CN115698301A - 活性dna转座子系统及其使用方法 - Google Patents
活性dna转座子系统及其使用方法 Download PDFInfo
- Publication number
- CN115698301A CN115698301A CN202180025387.4A CN202180025387A CN115698301A CN 115698301 A CN115698301 A CN 115698301A CN 202180025387 A CN202180025387 A CN 202180025387A CN 115698301 A CN115698301 A CN 115698301A
- Authority
- CN
- China
- Prior art keywords
- nucleic acid
- seq
- transposable element
- cell
- acid sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1086—Preparation or screening of expression libraries, e.g. reporter assays
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/90—Vectors containing a transposable element
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Cell Biology (AREA)
- Mycology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
本申请提供了工程化转座元件、包含所述工程化转座元件的基因转移系统,以及使用它们的方法和试剂盒。所公开的组合物、系统和方法可用于在体外或细胞中将异源核酸插入靶核酸。
Description
相关申请的交叉引用
本申请要求2020年3月30日提交的国际专利申请号PCT/CN2020/082087的优先权,其内容通过引用整体并入本文。
提交ASCII文本文件的序列表
以下提交的ASCII文本文件的内容通过引用整体并入本文:序列表的计算机可读形式(CRF)(文件名:182452000641SEQLIST.txt,记录日期:2021年3月29日,大小:244kb)。
技术领域
本申请一般地涉及遗传学领域。更具体地,本申请涉及转座元件及其用途。
背景技术
将DNA引入细胞的典型方法包括DNA凝聚剂,如诸如磷酸钙、聚乙二醇等,含脂质试剂,诸如脂质体、多层囊泡等,以及病毒介导的策略。然而,这样的方法可能有局限性。例如,存在与DNA凝聚剂和病毒介导的策略相关的尺寸限制。此外,可转染到细胞中的核酸量在病毒策略中受到限制。并非所有方法都有助于将递送的核酸插入细胞的核酸中,虽然DNA凝聚方法和含脂质试剂相对容易制备,但将核酸插入病毒载体会是耗费劳力的。病毒介导的策略可以是细胞类型或组织类型特异的,并且使用病毒介导的策略在体内使用时会产生免疫问题。
为了克服这些问题的一种合适的工具是通过转座元件。转座元件(TE、转座子或跳跃基因)是一种可以改变其在核酸中的位置的DNA序列,从而产生或逆转突变并改变基因组中的序列。转座元件代表了许多真核基因组的绝大部分。例如,大约50%的人类基因组来源于转座元件序列,而其他基因组,例如植物,会由更高比例的来源于转座元件的DNA组成。转座元件通常分为两类,1类和2类。1类的代表为反转录转座子,包括1)长末端重复序列(LTR)反转录转座子,诸如内源性反转录病毒(ERV),和2)非LTR反转录转座子,诸如长散布元件(LINE)和短散布元件(SINE)。2类TE包括1)“剪切粘贴”DNA转座子,其特征为末端重复序列(TR,也称为末端反向重复序列,TIR)并能够由转座酶移动,以及2)非“剪切粘贴”DNA转座元件,诸如helitron和polinton。虽然2类TE在多种真核生物中广泛存在并具有活性,但并非所有这些TE都具有转座活性。最近的活性转座元件的实例包括在过去几百万年中具有移动迹象的hAT和piggyBa超家族的成员。然而,目前可用于基因发现研究和基因治疗的活性转座元件的选择是有限的。
因此,需要适用于将DNA导入细胞的新转座元件,以及用于通过转座元件将不同大小的异源序列有效插入细胞的核酸中或将DNA插入细胞的基因组中的方法和系统。
发明内容
本申请提供工程化转座元件、包含所述工程化转座元件的基因转移系统,以及使用它们的方法和试剂盒。还提供了在体外或在细胞中将异源核酸插入靶核酸的方法。本文所述的组合物、系统和方法可用于各种应用,包括标签化、基因组工程和基因发现研究。
在一个方面,本申请提供了一种工程化转座元件,其从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,其中3′TR包含选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段,并且其中所述转座元件表现出允许异源核酸插入细胞的DNA中的转座活性。在一些实施方案中,所述5′TR包含与选自SEQ ID NO:1-26和79-90的核酸序列具有至少约90%序列同一性的核酸序列。在一些实施方案中,所述5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列。在一些实施方案中,所述3′TR包含与选自SEQ ID NO:27-52和91-102的核酸序列具有至少约90%序列同一性的核酸序列。在一些进一步的实施方案中,所述3′TR包含选自SEQ ID NO:27-52和91-102的核酸序列。
在根据上述工程化转座元件的任一项的一些实施方案中,所述转座元件进一步包含侧接5′TR的5′的5′靶位点重复序列(TSD)或侧接3′TR的3′的3′TSD。在一些实施方案中,所述5′TSD和3′TSD的核酸序列是相同的序列。在一些实施方案中,所述5′TSD包含选自SEQID NO:191-206的核酸序列、其变体或其片段,而所述3′TSD包含选自SEQ ID NO:191-206的核酸序列、其变体或其片段。
在根据上述工程化转座元件的任一项的一些实施方案中,所述5′TR包含与选自SEQ ID NO:3、8、11、12、13、16、22、23、29和82的核酸序列具有至少约90%序列同一性的核酸序列,而所述3′TR包含与选自SEQ ID NO:29、34、37、38、39、42、48、49、91和94的核酸序列具有至少约90%序列同一性的核酸序列。
在根据上述工程化转座元件的任一项的一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3FR、Mariner2_AG、Tc1-1_Xt、Tc1-1_AG、Tc1-1_PM、Tc1-4_Xt、Tc1-15_Xt、Mariner-6_AMi或Mariner-3_Crp。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。在一些实施方案中,所述5′TR包含SEQ ID NO:3的核酸序列,而所述3′TR包含SEQ ID NO:29的核酸序列。在一些实施方案中,所述5′TR包含SEQ ID NO:8的核酸序列,而所述3′TR包含SEQ ID NO:34的核酸序列。在一些实施方案中,所述5′TR包含SEQ ID NO:11的核酸序列,而所述3′TR包含SEQ ID NO:37的核酸序列。在一些实施方案中,所述5′TR包含SEQ ID NO:12的核酸序列,而所述3′TR包含SEQID NO:38的核酸序列。在一些实施方案中,所述5′TR包含SEQ ID NO:16的核酸序列,而所述3′TR包含SEQ ID NO:42的核酸序列。
在根据上述工程化转座元件的任一项的一些实施方案中,所述异源核酸包含编码序列。在一些进一步的实施方案中,所述异源核酸还包含与所述编码序列可操作地连接的启动子。
在根据上述工程化转座元件的任一项的一些实施方案中,所述转座元件的转座活性高于piggyBac(PB)转座子、Sleeping Beauty(SB)转座子和/或TcBuster转座子的转座活性。
在根据上述工程化转座元件的任一项的一些实施方案中,所述细胞是动物细胞、植物细胞、藻类细胞、真菌细胞、酵母细胞或细菌细胞。在一些实施方案中,所述细胞是哺乳动物细胞。在一些实施方案中,所述哺乳动物细胞选自免疫细胞(例如,T细胞)、肝细胞、肿瘤细胞、干细胞、受精卵、肌肉细胞和皮肤细胞。在一些实施方案中,所述细胞是人类细胞。在一些实施方案中,所述转座元件在人胚胎肾293T(293T)细胞中的转座活性高于在HeLa细胞中的转座活性。
在根据上述工程化转座元件的任一项的一些实施方案中,所述转座元件存在于载体中。在一些进一步的实施方案中,所述载体是质粒或病毒载体。
本申请的另一方面提供了一种基因转移系统,其包含:1)根据上述任何一种转座元件的工程化转座元件;和2)转座酶,或编码转座酶的核酸。在一些实施方案中,转座酶包含选自SEQ ID NO:53-78和103-114的氨基酸序列或其变体。
在又一方面,本申请提供了一种基因转移系统,其包含:1)工程化转座元件;和2)转座酶或编码转座酶的核酸,其中所述转座元件从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中所述转座元件表现出允许异源核酸插入细胞的DNA中的转座活性,并且其中所述转座酶包含选自SEQ ID NO:53-78和103-114的氨基酸序列或其变体。在一些实施方案中,所述5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,并且其中3′TR包含选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段。
在根据上述任一基因转移系统中的一些实施方案中,所述转座元件包含5′TR,其具有与选自SEQ ID NO:3、8、11、12、13、16、22、23、29和82的核酸序列具有至少约90%的序列同一性的核酸序列,而所述3′TR包含与选自SEQ ID NO:29、34、37、38、39、42、48、49、91和94的核酸序列具有至少约90%序列同一性的核酸序列。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt、Tc1-1_AG、Tc1-1_PM、Tc1-4_Xt、Tc1-15_Xt、Mariner-6_AMi或Mariner-3_Crp。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。在一些实施方案中,所述5′TR包含SEQ ID NO:3的核酸序列,所述3′TR包含SEQ ID NO:29的核酸序列,而所述转座酶包含SEQ ID NO:55的氨基酸序列。在一些实施方案中,所述5′TR包含SEQ ID NO:8的核酸序列,所述3′TR包含SEQ ID NO:34的核酸序列,而所述转座酶包含SEQ ID NO:60的氨基酸序列。在一些实施方案中,所述5′TR包含SEQ ID NO:11的核酸序列,所述3′TR包含SEQ ID NO:37的核酸序列,而所述转座酶包含SEQ ID NO:63的氨基酸序列。在一些实施方案中,所述5′TR包含SEQ ID NO:12的核酸序列,所述3′TR包含SEQ ID NO:38的核酸序列,而所述转座酶包含SEQ ID NO:64的氨基酸序列。在一些实施方案中,所述5′TR包含SEQ ID NO:16的核酸序列,所述3′TR包含SEQ ID NO:42的核酸序列,而所述转座酶包含SEQ ID NO:68的氨基酸序列。
在根据上述基因转移系统的任一项的一些实施方案中,所述基因转移系统包含编码转座酶的核酸。在一些进一步的实施方案中,所述转座元件和编码转座酶的核酸在不同的载体中。在一些进一步的具体实施方案中,所述转座元件和编码转座酶的核酸在同一载体中。
在又一方面,本申请提供一种将异源核酸插入靶核酸的方法,其包括:使靶核酸与根据上述工程化转座元件的任一项的转座元件或根据上述基因转移系统的任一项的基因转移系统接触。在一些实施方案中,该方法在体外进行。在一些实施方案中,所述靶核酸在细胞中。在一些实施方案中,所述靶核酸是基因组DNA。
在根据任一上述方法的一些实施方案中,其中所述靶核酸在细胞中,该细胞是动物细胞、植物细胞、藻类细胞、真菌细胞、酵母细胞或细菌细胞。在一些实施方案中,所述细胞是哺乳动物细胞。在一些实施方案中,所述哺乳动物细胞选自免疫细胞(例如,T细胞)、肝细胞、肿瘤细胞、干细胞、受精卵、肌肉细胞和皮肤细胞。在一些实施方案中,所述异源核酸的插入使细胞的基因失活。
在根据上述方法的任一项的一些实施方案中,所述异源核酸编码蛋白质。在一些实施方案中,所述蛋白质选自报告蛋白、工程化受体、细胞因子、抗生素抗性蛋白、抗原和治疗性蛋白。
在根据上述方法的任一项的一些实施方案中,所述异源核酸编码RNA。在一些实施方案中,所述RNA选自治疗性RNA、小干扰RNA(siRNA)、微小RNA、短发夹RNA(shRNA)、长非编码RNA(lincRNA)和指导RNA(gRNA)。在一些实施方案中,所述异源核酸编码多于一种分子。
在根据上述方法的任一项的一些实施方案中,所述异源核酸的长度不超过约300千碱基(kb),例如长度为约10kb至约300kb,或约100碱基对(bp)至约10kb,或约100bp至约5kb,或约100bp至约2kb,或约2kb至约300kb。
在根据上述方法的任一项的一些实施例中,所述插入是随机的。
在又一方面,本申请提供了一种试剂盒,其包含根据上述工程化转座元件的任一项的转座元件,或根据上述基因转移系统的任一项的基因转移系统,以及用于将异源核酸插入靶核酸的说明书。
附图说明
图1显示了说明鉴定活性转座元件(TE)的过程的图。
图2显示了经鉴定的131个转座元件(TE)的总结,这些转座元件(TE)具有长度不小于300个氨基酸(aa)的开放阅读框(ORF)、转座酶(Tn)结构域和不超过25%的平均差异值。饼图说明了经鉴定的131个TE的五个超家族的分布。
图3显示了用于筛选活性转座元件的一组示例性二元构建体。上方的构建体是转座酶表达的辅助构建体,其从5′到3′包含:巨细胞病毒(CMV)启动子、转座酶(Tn)基因和polyA(pA)信号。下方的构建体是供体构建体,其从5′到3′包含:磷酸甘油酸激酶(PGK)启动子、5′靶位点重复(5′TSD)序列、5′末端重复(5′TR)序列、编码嘌呤霉素和增强型GFP融合(Puro-eGFP)的序列、3′末端重复(3′TR)序列、3′靶位点重复(3′TSD)序列和polyA(pA)信号。
图4A-4B展示了在HEK293T(293T)和HeLa细胞中,与包括piggyBac、HyperpiggyBac和SB100X的对照TE相比,具有不大于5%的差异值的经鉴定的转座元件的转座活性。图4A展示了在HEK293T(293T)和HeLa细胞中,与包括piggyBac、Hyper piggyBac、SB100X、TcBuster(TB)的对照TE和阴性对照(NC)相比,以下经鉴定的转座元件的转座活性:1_hAT-2_AG、2_AgaP12,3_P3_AG、4_HAT2_CI、5_HAT5_CI、6_hAT-6_DR、7_Chaplin1_DR、8_Harbinger-4_XT、9_HAT1_AG、10_AgaP15、11_IS4EU-1_DR、12_POGO、14_Tc1-8B_DR、15_HOBO、17_hAT-6_PM、18_MARISP1、19_hAT-7_XT、20_BARI_DM、21_Mariner-3_PM、22_hAT-3_XT、23_P1_AG、24_IS4EU-2_DR、25_Tc1-3_Xt、26_Mariner-1_PM、27_P2_AG、28_hAT-5_DR、29_Tc1-3_FR、30_Mariner-4_XT、32_Tc1-5_Xt、33_Tc1-10_Xt和34_hAT-1_D。图4B展示了在HEK293T(293T)和HeLa细胞中,与包括piggyBac、Hyper piggyBac、SB100X、TcBuster(TB)的对照TE和阴性对照(NC)相比,以下经鉴定的转座元件的转座活性:35_Mariner2_AG、36_Tc1-1_Xt、37_Tc1-1_AG、38_Mariner-1_XT、39_Tc1DR3_Xt、40_hAT-1B_PM、41_hAT-3_PM、42_hAT-6B_PM、43_Tc1-1_PM、44_TC1_XL、45_Mariner-4_AMi、46_Myotis_hAT1、47_hAT-7_PM、48_TC1_FR4、49_hAT-8_PM、50_piggyBac1_Mm、51_Tc1-11_Xt、52_Tc1-16_Xt、53_TC1-2_DM、54_Tc1-4_Xt、55_TC1_DM、56_Tc1-15_Xt、59_TC1_FR2、60_Mariner-6B_AMi、61_Tc1-9_Xt、63_hAT-9_XT、64_Mariner-5_XT、65_S2_DM、67_PROTOP、68_Tc1-8_Xt和69_Tc1-12_Xt。
图5A-5B展示了在HEK293T(293T)中具有大于5%的差异值的经鉴定的转座元件的转座活性。图5A展示了在HEK293T(293T)中以下经鉴定的转座元件的转座活性:70_Mariner-6_AMi、71_hAT-3_Gav、72_piggyBac2_Mm、73_Mariner-2_XT、74_hAT-4_Crp、75_OposCharlie2、76_hAT-1_AMi、77_Mariner-2_AMi、78_hAT-13_AMi、80_hAT-12_AMi、81_Mariner-7_Croc、82_piggyBac-2_XT、83_Mariner-3_AMi、84_piggyBac1_CI、86_piggyBac-1_AMi、87_Mariner-5_AMi、89_Mariner-6_Crp、90_Mariner-3_Crp、91_hAT-3_AMi、92_TC1_FR1、93_hAT-5_Croc、94_hAT-8_AMi、95_PARIS、96_Mariner-2_PM、97_piggyBac-1_XT、98_Tigger1、99_Mariner-1_Crp、101_S_DM、102_hAT-12_Crp、103_hAT-1_PM、104_Senkusha1、105_Tc1-2_PM、106_Harbinger-2_AMi、108_hAT-2_Gay和110_Tigger2T。图5B展示了在HEK293T(293T)中以下经鉴定的转座元件的转座活性:111_TC1-4_DR、116_TIGGER17、117_TIGGE3、118_HAT-14_CRP、119_MARINER-9_CRP、124_HAT-111_AMI、126_MARINER-1_AMI、126_MARINER-10_CRP、139_hAT-17_Croc、140_hAT-4_AMi、142_Tigger4、144_Tigger7、156_Tigger2、180_hAT-19_Crp、183_hAT-17B_Croc、188_Tc1-13_Xt、197_hAT-19B_Croc、199_MarsTigger8、212_Tigger5、222_hAT-10_XT、237_hAT-6_AMi、245_MarsTigger1c、246_Tigger17c、258_Harbinger-1_AMi、260_Tc1-14_Xt、271_Kanga1、275_Arthur1、295_Harbinger-1_Crp、314_Zaphod3、320_Joey1、331_Zaphod、342_Harbinger-3_AMi、348_Harbinger-1B_Crp、349_MARWOLEN1和351_Zaphod2。
图6A-6B显示了与对照TE piggyBac、hyperpiggyBac和SB100X相比,各种经鉴定的TE的转座(即转移)效率。图6A显示了在HEK293T(293T)细胞中,与对照TE piggyBac、hyperpiggyBac和SB100X相比,各种经鉴定的TE的转座(转移)效率。图6B显示了在HeLa细胞中,与对照TE piggyBac、hyperpiggyBac和SB100X相比,各种经鉴定的TE的转座(转移)效率。
图7A-7C显示了系统发育树,其说明了属于不同超家族的经鉴定的转座酶与其对照TE之间的系统发育关系。图7A显示了系统发育树,其说明了以下14个经鉴定的hAT超家族转座酶和对照TE TcBuster之间的系统发育关系:103_hAT-1_PM、17_hAT-6_PM、46_Myotis_hAT1、28_hAT-5_DR、22_hAT-3_XT、41_hAT-3_PM、47_hAT-7_PM、180_hAT-19_Crp、1_hAT-2_AG、9_HAT1_AG、139_hAT-17_Croc、183_hAT-17B_Croc、63_hAT-9_XT、222_hAT-10_XT。图7B显示了系统发育树,其说明2个经鉴定的piggyBac超家族转座酶82_piggyBac-2_XT、86_piggyBac-1_AMi和对照TE TcBuster之间的系统发育关系。图7C显示了系统发育树,其说明了22个经鉴定的TcMariner超家族转座酶和对照TE SB100X之间的系统发育关系。
图8A-8B展示了在HEK293T(293T)细胞和HeLa细胞中,与包括piggyBac、hyperpiggyBac和SB100X的对照TE以及阴性对照(NC)相比,经鉴定的转座元件和131个候选物中5个活性最高的TE的转座活性。图8A显示了在293T细胞中,与包括piggyBac、hyperpiggyBac和SB100X的对照TE以及阴性对照(NC)相比,各种经鉴定的TE的转座(转移)效率。图8B显示了在HeLa细胞中,与包括piggyBac、hyperpiggyBac和SB100X的对照TE和阴性对照(NC)相比,各种经鉴定的TE的转座(转移)效率。
图9A-9B展示了在Hct116和K562细胞中,与包括piggyBac、hyperpiggyBac和SB100X的对照TE和阴性对照(NC)相比,经鉴定的转座元件和131个候选物中5个活性最高的TE的转座活性。图9A显示了在Hct116细胞中,与包括piggyBac、hyperpiggyBac和SB100X的对照TE和阴性对照(NC)相比,各种经鉴定的TE的转座(转移)效率。图9B显示了在K562细胞中,与包括piggyBac、hyperpiggyBac和SB100X的对照TE和阴性对照(NC)相比,各种经鉴定的TE的转座(转移)效率。
图10A-10B展示了在原代T细胞中,与对照TE SB100X相比,经鉴定的转座元件14-Tc1-8B_DR、29-Tc1-3_FR、35-Mariner2_AG、36-Tc1-1_Xt、37-Tc1-1_AG、43-Tc1-1_PM、52-Tc1-16_Xt、54-Tc1-4_Xt和56-Tc1-15_Xt的转座活性。图10A显示了用含有EF1α启动子和CopGFP基因的质粒转染的原代T细胞的转座测定结果,其中GFP阳性T细胞的存在代表细胞中的成功转座。图10B显示了用含有EF1a启动子和019CAR-P2A-eGFP基因的质粒转染的原代T细胞的转座测定结果,其中GFP阳性T细胞的存在代表细胞中的成功转座。
图11A-11B展示了在293T细胞和HeLa细胞中,与对照TE piggyBac和阴性对照(NC)相比,基于辅助体质粒和转座元件质粒的不同比例,经鉴定的转座元件SB100X和131个候选物中5个活性最高的TE的转座活性。图11A显示了在293T细胞中,与对照TE SB100X和阴性对照(NC)相比,各种经鉴定的TE的转座(转移)效率。图11B显示了在HeLa细胞中,与对照TESB100X和阴性对照(NC)相比,各种经鉴定的TE的转座(转移)效率。
图12展示了在293T细胞中,与对照TE piggyBac、piggyBac、hyperpiggy Bac、SB100X相比,经鉴定的转座元件SB100X和131个候选物中5个活性最高的TE的装载能力。图12显示了与对照TE piggyBac、piggyBac、hyperpiggyBac、SB100X相比,各种经鉴定的TE的转座(转移)效率。
图13展示了来自TE原始物种和稳定转座K562细胞系的基因组中靶位点周围40bp窗口中基因组插入基因座的共有序列。
图14A-14B展示了在距离最近基因的经鉴定的转座元件的插入频率,这些转座元件包括piggyBac、hyperpiggyBac、SB100X和131个候选物中5个活性最高的TE,图14A显示了0bp-1Mb窗口中的插入频率,图14B显示了相比在50kb窗口中随机插入的富集倍数。
图15展示了在基因体中从5′末端到3′末端的相对位置中,经鉴定的转座元件相比随机插入的富集倍数,这些转座元件包括piggyBac、hyperpiggy Bac、SB100X和131个候选物中5个活性最高的TE。
图16展示了不同表达水平相比的基因中,经鉴定的转座元件相比随机插入的富集倍数,这些转座元件包括piggyBac、hyperpiggyBac、SB100X和131个候选物中5个活性最高的TE,水平7表示最高表达,水平0表示最低表达。
图17展示了在5kb窗口中转录起始位点(TSS)周围位置中,经鉴定的转座元件相比随机插入的富集倍数,这些转座元件包括piggyBac、hyperpiggy Bac、SB100X和131个候选物中5个活性最高的TE。
图18展示了在不同染色质状态中,经鉴定的转座元件相比随机插入的富集倍数,这些转座元件包括piggyBac、hyperpiggyBac、SB100X和131个候选物中5个活性最高的TE。
具体实施方式
本申请提供了工程化转座元件、包含工程化转座元件的基因转移系统,以及使用它们的方法和试剂盒。本申请至少部分基于从泛基因组生物信息学分析的广泛物种中鉴定新的转座元件(例如,表2),以及许多鉴定的转座元件能够在人体细胞中高效转座的令人惊讶的结果。所公开的组合物、系统和方法可用于将异源核酸插入靶核酸,包括将异源DNA引入细胞的基因组。本文所述的转座元件和基因转移系统可用于各种应用,如基因治疗和基因发现研究。
因此,在一个方面,本申请提供了一种工程化转座元件,其从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,其中3′TR包含选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段,并且其中所述转座元件表现出允许异源核酸插入细胞的DNA中的转座活性。
在另一方面,本申请提供了一种基因转移系统,其包含:1)工程化转座元件;和2)转座酶或编码转座酶的核酸,其中所述转座元件从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中所述转座元件表现出允许异源核酸插入细胞的DNA中的转座活性。在一些实施方案中,所述转座元件是工程化转座元件。在一些实施方案中,所述转座酶包含选自SEQ ID NO:53-78和103-114的氨基酸序列或其变体。
I.定义
如本文所用,术语“转座子”、“转座元件”或“TE”是指能够从第一核酸(即,供体核酸,例如载体)切除并整合到靶位点(例如细胞中的第二个核酸或基因组或染色体外DNA)的多核苷酸。如果至少一个顺式作用核酸序列位于核酸序列的5′,并且至少一个顺式作用核酸序列位于核酸序列的3′,转座子包括侧接转座元件末端的顺式作用核酸序列的核酸序列。顺式作用核酸序列在转座酶结合的转座元件的每一端包括至少一个末端重复序列(TR,也称为反向末端重复序列(ITR)或末端反向重复序列(TIR))。本文所述的转座元件可以包含或不包含编码转座酶的开放阅读框(ORF)。
如本文所用,术语“转座”是指转座元件从第一核酸(例如,载体)的位置改变并整合到靶位点(例如细胞中的第二核酸或基因组或染色体外DNA)。
如本文所用,术语“末端重复”或“TR”是指位于转座元件两端且侧接可转座的第二核酸序列的核酸序列。位于第二核酸序列的5′(上游)的TR称为5′TR,位于第二核酸序列的3′(下游)的TR称为3′TR。在2类转座元件中,TR是彼此互补的。
如本文所用,术语“靶位点重复”或“TSD”是指在转座元件的插入位点处出现的核酸序列。TSD可能是由于转座酶对靶DNA双链体的交错切割导致的粘性端的DNA修复而出现的。TSD侧接转座元件中的TR。位于5′TR的5′的TSD是5′TSD。位于3′TR的3′的TSD是3′TSD。
如本文所用,术语“转座酶”是指催化转座子从第一核酸(例如,载体)切除并整合到靶位点(例如细胞中的第二核酸或基因组或染色体外DNA)的多肽。在一些实施方案中,转座酶结合一个或两个末端重复序列。
如本文所用,“左转座子片段”或“LTF”是指天然存在的转座元件中从5′TSD到转座酶ORF序列的起始密码子的片段。如本文所用,“右转座子片段”或“RTF”是指天然存在的转座元件中从转座酶ORF序列的终止密码子到3′TSD的片段。
术语“核酸”、“多核苷酸”和“核酸序列”可互换使用以指任何长度的核苷酸的聚合形式,包括脱氧核糖核苷酸、核糖核苷酸、其组合及其类似物。“寡核苷酸”和“寡(oligo)”可互换使用,指具有不超过约50个核苷酸的短多核苷酸。
如本文所用,“异源核酸”是指来自与参比核酸序列不同来源的DNA或RNA序列。例如,在转座元件的情况下,所述异源核酸来自与末端重复序列不同的来源。例如,从与末端重复序列不同的生物体中分离的核酸序列被认为是针对所述末端重复序列的异源核酸。
如本文所用,术语“可操作地连接”是指与另一个核酸序列处于功能关系的核酸序列。例如,如果编码序列与启动子序列可操作地连接,这通常意味着启动子可以促进编码序列的转录。可操作地连接意味着被连接的DNA序列通常是连续的,并且在必须连接两个蛋白质编码区时,是连续的并且在阅读框中。由于增强子在与启动子相隔几千个碱基时可以起作用并且内含子序列可以具有可变长度,因此一些核酸序列可能是可操作地连接但不连续的。
关于核酸序列的“序列同一性百分比(%)”定义为在比对序列之后,候选序列中与特定核酸序列中的核苷酸相同的核苷酸的百分比,如有必要,通过允许空位以达到最大序列同一性百分比。关于肽、多肽或蛋白质序列的“序列同源性百分比(%)”是在比对序列后,候选序列中与特定肽或氨基酸序列中的氨基酸残基具有相同取代的氨基酸残基的百分比,如有必要,通过允许空位来实现最大序列同源性百分比。用于确定百分比氨基酸序列同一性的比对可以以本领域技术范围内的各种方式实现,例如,使用如BLAST、BLAST-2、ALIGN或MEGALIGNTM(DNASTAR)软件的公开可用的计算机软件。本领域技术人员可以确定用于测量比对的适当参数,包括在被比较的序列的全长上实现最大比对所需的任何算法。
如本文所用,术语“载体”是指能够转运与其连接的另一个核酸分子的核酸分子。载体的实例包括但不限于细菌、质粒、噬菌体、粘粒、游离基因、病毒和可插入的DNA片段,即能够通过同源重组插入宿主细胞基因组的片段。
如本文所用,术语“质粒”是指能够接受外源DNA片段并能够在原核或真核细胞中复制的环状双链DNA。
术语“多肽”和“肽”在本文中可互换使用以指任何长度的氨基酸聚合物。因此,例如,术语肽、寡肽、蛋白质、抗体和酶包括在多肽的定义中。聚合物可以是直链或支链的,它可以包含修饰的氨基酸,并且它可以被非氨基酸打断。蛋白质可以具有一种或多种多肽。该术语还包括已修饰的氨基酸聚合物;例如,二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作,如与标记组分缀合。
如本文所用,“变体”被解释为分别不同于参比多核苷酸或多肽但保留基本特性的多核苷酸或多肽。多核苷酸的典型变体与另一个参比多核苷酸的核酸序列不同。变体的核酸序列变化可以或可以不改变由参比多核苷酸编码的多肽的氨基酸序列。如下所述,核苷酸变化可以导致参比序列编码的多肽中的氨基酸取代、添加、缺失、融合和截短。多肽的典型变体与另一个参比多肽的氨基酸序列不同。通常,差异是有限的,因此参比多肽和变体的序列总体上非常相似,并且在许多区域中是相同的。变体和参比多肽的氨基酸序列可以因任意组合形式的一个或多个取代、添加、缺失而不同。取代或插入的氨基酸残基可以是或可以不是由遗传密码编码的氨基酸残基。多核苷酸或多肽的变体可以是天然存在的,如等位基因变体,或者它可以是未知天然存在的变体。多核苷酸和多肽的非天然存在的变体可以通过诱变技术、通过直接合成以及通过技术人员已知的其他重组方法来制备。
如本文所用,序列的“片段”是指序列的一部分。例如,核酸序列的片段是指核酸序列的一部分,氨基酸序列的片段是指氨基酸序列的一部分。
如本文所用,术语“基因电路”、“生物电路”或“合成电路”是指设计用于执行逻辑功能的一组生物组分。通常,需要输入来激活基因电路,基因电路随后会根据输入产生输出。
如本文所用,术语“工程化”是指导致多核苷酸或多肽发生可检测变化的任何操作,其中该操作包括但不限于插入、删除和取代多核苷酸或氨基酸序列的一部分。
如本文所用,术语“转座效率”是指转座元件将异源核酸插入靶细胞群的效率。例如,转座效率可以通过以下方式来确定:将包含转座元件的质粒转染到靶细胞群中,该转座元件包含报告基因或编码选择标记的基因,例如抗生素抗性基因(例如嘌呤霉素),并确定表达由报告基因或选择标记编码的基因产物的细胞数量,例如,通过测量具有抗生素抗性的细胞数量。
如本文所用,术语“转染的”或“转化的”或“转导的”是指将外源核酸转移或引入宿主细胞的过程。“转染的”或“转化的”或“转导的”细胞是一种已经用外源核酸转染、转化或转导的细胞。如本文所用,术语“转导”和“转染”包括本领域已知的使用感染因子(例如病毒)或其他方式将DNA引入细胞以表达目标蛋白质或分子所有方法。除了病毒或病毒样剂外,还有基于化学的转染方法,如使用磷酸钙、树枝状大分子、脂质体或阳离子聚合物(例如DEAE-葡聚糖或聚乙烯亚胺)的方法;非化学方法,如电穿孔、细胞挤压、声穿孔、光转染、穿刺转染、原生质体融合、质粒或转座子递送;基于颗粒的方法,如使用基因枪、磁转染或磁辅助转染、颗粒轰击;以及混合方法,诸如核转染。
术语“体内”是指在获得细胞的生物体内。“离体”或“体外”是指在获得细胞的生物体外。
应当理解,本文描述的本发明的实施方案包括“由......组成”和/或“基本上由......组成”的实施方案。
本文提及“约”数值或参数包括(并描述)针对该数值或参数本身的变化。例如,提及“约X”的描述包括“X”的描述。
如本文所用,提及“不是”数值或参数通常表示和描述“不同于”数值或参数。例如,该方法不用于治疗X型癌症意味着该方法用于治疗X型以外的癌症。
本文使用的术语“约X-Y”与“约X至约Y”具有相同的含义。
如本文和所附权利要求中使用的,单数形式“一种”、“一个”和“所述”包括复数指涉,除非上下文另有明确规定。
II.工程化转座元件
本申请在一个方面提供了一种工程化转座元件,其从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR)。在一些实施方案中,所述转座元件表现出允许异源核酸在体外插入到靶核酸(例如,DNA)中的转座活性。在一些实施方案中,所述工程化转座元件表现出允许异源核酸插入细胞中的靶核酸(例如哺乳动物或细胞植物中的DNA)的转座活性。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
在一些实施方案中,所述工程化转座元件从5′到3′包含:5′靶位点重复序列(5′TSD)、5′TR、异源核酸、3′TR和3′TSD。在一些实施方案中,所述转座元件表现出允许异源核酸在体外插入到靶核酸(例如,DNA)中的转座活性。在一些实施方案中,所述工程化转座元件表现出允许异源核酸插入细胞中的靶核酸(例如哺乳动物或细胞植物中的DNA)的转座活性。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
在一些实施方案中,本申请提供了来自广泛物种的新型转座元件,其能够在人类细胞中高效转座。本文所述的转座元件为有天然活性的哺乳动物剪切粘贴DNA转座子提供了直接的实验证据。
示例性转座元件的列表及其对应的左末端片段(LTF)、右末端片段(RTF)、转座酶、5′末端重复(TR)、3′TR、5′靶位点重复(TSD)和3′TSD序列可以在表1-2和序列表中找到。表1列出了从本申请公开的生物信息学分析中鉴定的131个TE,包括11个TE(TE ID:4、5、7、12、18、20、22、25、26、28和30),其符合长度不超过3000bp,MITE拷贝数大于10,平均差异小1%,适用于高效基因组工程。表2列出了在人类细胞系HEK293T和Hela中使用转座分析实验验证的活性TE。
在一些实施方案中,所述转座元件是2类转座元件。2类转座元件可以根据转座酶的相关性和共享的结构特征分为超家族,包括末端重复(TR)和在整合过程中产生的侧接TR的靶位点重复(TSD)的长度。本申请的转座元件设想为可以来自各种合适的TE超家族和/或家族。在一些实施方案中,所述转座元件来自hAT超家族。在一些实施方案中,所述转座元件来自P超家族。在一些实施方案中,所述转座元件来自PIF-Harbinger超家族。在一些实施方案中,所述转座元件来自piggyBac超家族。在一些实施方案中,所述转座元件来自TcMariner超家族。在一些实施方案中,所述5′TR是3′TR的反向互补。在一些实施方案中,所述5′TR不是3′TR的反向互补。
在一些实施方案中,所述工程化转座元件包含5′TR,其包含与选自hAT、P、PIF-Harbinger、piggyBac和TcMariner的超家族的转座元件的5′TR具有至少约50%、60%、70%、80%、90%、95%、99%或100%序列同一性的核酸序列。在一些实施方案中,所述工程化转座元件包含3′TR,其包含与选自hAT、P、PIF-Harbinger、piggyBac和TcMariner的超家族的转座元件的3′TR具有至少约50%、60%、70%、80%、90%、95%、99%或100%序列同一性的核酸序列。
在一些实施方案中,所述工程化转座元件包含5′TR和3′TR,所述5′TR包含与选自hAT、P、PIF-Harbinger、piggyBac和TcMariner的超家族的转座元件的5′TR具有至少约50%、60%、70%、80%、90%、95%、99%或100%序列同一性的核酸序列,所述3′TR包含与选自hAT、P、PIF-Harbinger、piggyBac和TcMariner的超家族的转座元件的3′TR具有至少约50%、60%、70%、80%、90%、95%、99%或100%序列同一性的核酸序列。
在一些实施方案中,所述工程化转座元件包含来源于表1的任何一种TE的5′TR、3′TR、LTF、RTF、转座酶、5′TSD和/或3′TSD。在一些实施方案中,所述工程化转座元件包含来源于表2的任何一种TE的5′TR、3′TR、LTF、RTF、转座酶、5′TSD和/或3′TSD。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt、Tc1-1_AG、Tc1-1_PM、Tc1-4_Xt、Tc1-15_Xt、Mariner-6_AMi、或Mariner-3_Crp。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。
在一些实施方案中,所述工程化转座元件包含LTF,其包含选自SEQ ID NO:115-140和167-178的核酸序列、其变体或其片段。
在一些实施方案中,所述工程化转座元件包含RTF,其包含选自SEQ ID NO:141-190的核酸序列、其变体或其片段。
在一些实施方案中,所述工程化转座元件包含LTF和RTF,所述LTF与选自SEQ IDNO:115-140和167-178的核酸序列具有至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项的序列同一性,所述RTF与选自SEQ ID NO:141-190的核酸序列具有至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项的序列同一性。在一些实施方案中,所述工程化转座元件包括包含选自SEQ ID NO:115-140和167-178的核酸序列的LTF,和包含选自SEQ ID NO:141-190的核酸序列的RTF。
在一些实施方案中,所述工程化转座元件包含LTF中的5′TR,所述LTF包含选自SEQID NO:115-140和167-178的核酸序列。在一些实施方案中,所述工程化转座元件包含RTF中的3′TR,所述RTF包含选自SEQ ID NO:141-190的核酸序列。
在一些实施方案中,所述工程化转座元件包含LTF中的5′TR、5′TR的变体或5′TR的片段,所述LTF包含选自SEQ ID NO:115-140和167-178的核酸序列;和RTF中的3′TR、3′TR的变体或3′TR的片段,所述RTF包含选自SEQ ID NO:141-190的核酸序列。
在一些实施方案中,所述工程化转座元件包含5′TR,其具有与选自SEQ ID NO:1-26和79-90的核酸序列具有至少约90%序列同一性的核酸序列。在一些实施方案中,本申请的工程化转座元件包含5′TR,其具有与选自SEQ ID NO:1-26和79-90的核酸序列具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项的序列同一性。在一些实施方案中,所述5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列。在一些实施方案中,所述工程化转座元件包含具有作为5′TR的互补序列的3′TR。
在一些实施方案中,所述工程化转座元件包含3′TR,其具有与选自SEQ ID NO:27-52和91-102的核酸序列具有至少约90%序列同一性的核酸序列。在一些实施方案中,所述工程化转座元件包含3′TR,其与选自SEQ ID NO:27-52和91-102的核酸序列具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项的序列同一性。在一些实施方案中,所述3′TR包含选自SEQ ID NO:27-52和91-102的核酸序列。在一些实施方案中,所述工程化转座元件包含具有作为3′TR的互补序列的5′TR。
在一些实施方案中,所述工程化转座元件包含:1)5′TR,其与选自SEQ ID NO:1-26和79-90的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性;和2)3′TR,其与选自SEQ ID NO:27-52和91-102的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性。
在一些实施方案中,所述工程化转座元件包含:1)5′TR,其与选自SEQ ID NO:1-26的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性;和2)3′TR,其与选自SEQ ID NO:27-52的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性。
在一些实施方案中,所述工程化转座元件包含:1)5′TR,其与选自SEQ ID NO:79-90的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性;和2)3′TR,其与选自SEQ ID NO:91-102的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性。
本文还考虑了工程化转座元件,其包含本文例如表1和2中所述的5′TR和/或3′TR、或LTF和/或RTF中的任一项的变体或片段。在一些实施方案中,所述变体包含不超过约50、40、35、30、25、20、15、10、9、8、7、6、5、4、3、2或1个中的任一项的核苷酸取代。在一些实施方案中,所述片段包含至少约5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个中的任一项的核苷酸。
在一些实施方案中,所述工程化转座元件包含5′TSD。在一些实施方案中,所述工程化转座元件包含3′TSD。在一些实施方案中,所述工程化转座元件包含5′TSD和3′TSD。在一些实施方案中,所述工程化转座元件不包含5′TSD。在一些实施方案中,所述工程化转座元件不包含3′TSD。在一些实施方案中,所述工程化转座元件不包含5′TSD或3′TSD。在一些实施方案中,所述5′TSD与3′TSD相同。在一些实施方案中,所述5′TSD不同于3′TSD。
在一些实施方案中,所述工程化转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述工程化转座元件不包含编码转座酶的核酸序列。在一些实施方案中,转座酶来源于与5′TR和3′TR序列相同的物种。在一些实施方案中,转座酶是针对5′TR和3′TR序列的天然转座酶。在一些实施方案中,转座酶是基于针对5′TR和3′TR序列的天然转座酶的工程化转座酶。
转座酶催化从供体多核苷酸(例如,载体)切除转座子并随后将转座子整合到靶核酸中,诸如靶细胞的基因组或染色体外DNA中。在一些实施方案中,转座酶结合转座元件的末端重复。
在一些实施方案中,转座酶包含选自SEQ ID NO:53-78和103-114的氨基酸序列、其变体或其片段。
本申请在一些实施方案中考虑了表1-2和序列表中列出的转座酶的变体。转座酶变体的提及是指转座酶多肽,其与参比转座酶多肽(例如天然存在的转座酶多肽)的区别在于至少一个氨基酸残基的添加、缺失、截短和/或取代,其保留转座活性。在某些实施方案中,转座酶多肽变体与参比转座酶多肽的区别在于一个或多个取代,如本领域已知的,所述取代可以是保守的或非保守的。在某些实施方案中,变体转座酶包含与参比转座酶的相应序列具有至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项的序列同一性或相似性的氨基酸序列。在一些实施方案中,变体转座酶包含不超过约50、40、35、30、25、20、15、10、9、8、7、6、5、4、3、2或1个氨基酸取代。
也考虑本文所述的转座酶的具有氨基酸缺失的功能片段或具有氨基酸添加的变体。在一些实施方案中,转座酶片段的长度为至少约50、60、70、80、90、100、150、200、250、300、350、400、450、500、600、700或更多个中的任一项的氨基酸残基。在某些实施方案中,氨基酸添加或缺失发生在参比转座酶的C末端和/或N末端。在一些实施方案中,氨基酸添加或缺失发生在内部位置,例如参比转座酶的柔性环。在某些实施方案中,氨基酸缺失(例如,N末端和/或C末端截短)包含约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约15、约20、约25、约30、约35、约40、约45、50、约55、约60、约65、约70、约75、约80、约85、约90、约95、约100、约105、约110、约115、约120、约125、约130、约135、约140、约145、约150、约155、约160、约165、约170、约175或更多个氨基酸,包括这些值之间的所有值和范围。在一些实施方案中,变体转座酶包含N末端或C末端纯化标签、选择标记(例如,抗生素抗性基因)或报告基因(例如,荧光报告基因)。
如上所述,本发明的转座酶多肽可以多种方式改变,包括氨基酸取代、缺失、截短和插入。此类操作的方法在本领域中通常是已知的。例如,参比多肽的氨基酸序列变体可以通过DNA中的突变来制备。用于诱变和核酸序列改变的方法是本领域公知的。参见,例如,Kunkel(1985,Proc.Natl.Acad.Sci.USA.82:488-492)、Kunkel et al.,(1987,Methods inEnzymol,154:367-382)、U.S.Pat.No.4,873,192、Watson,J.D.et al.,(MolecularBiology of the Gene,Fourth Edition,Benjamin/Cummings,Menlo Park,Calif.,1987)和其中引用的参考文献。关于不影响目标蛋白质生物活性的适当氨基酸替代的指导可见于Dayhoff et al.,(1978)Atlas of Protein Sequence and Structure(Natl.Biomed.Res.Found.,Washington,D.C.)的模型。
在一些实施方案中,与参比转座酶相比,转座酶被密码子优化。在一些实施方案中,转座酶被密码子优化以用于在哺乳动物细胞如人类细胞中表达。在一些实施方案中,转座酶被密码子优化以在植物细胞中表达。
在一些实施方案中,转座酶包含与选自SEQ ID NO:53-78和103-114的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)的序列同一性的氨基酸序列。在一些实施方案中,转座酶包含选自SEQ ID NO:53-78和103-114的氨基酸序列。
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:115的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:141的核酸序列。在一些实施方案中,所述转座元件包含:1)包含TAGGC(SEQ ID NO:1)的核酸序列、其变体或其片段的5′TR;2)包含GCCTA(SEQ ID NO:27)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:1的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:27的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:1的核酸序列的5′TR;和2)包含SEQ ID NO:27的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含GTATGGAC(SEQ ID NO:191)的核酸序列的5′TSD,和包含SEQ ID NO:191的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:115的核酸序列的序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:141的核酸序列的序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:53的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:53的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:53(hAT-2_AG的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:116的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:142的核酸序列。在一些实施方案中,所述转座元件包含:1)包含TAG(SEQ ID NO:2)核酸序列、其变体或其片段的5′TR);和2)包含CTA(SEQ ID NO:28)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:2的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,具有与SEQ ID NO:28的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:2的核酸序列的5′TR;和2)包含SEQ ID NO:28的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含ATGTGAAC(SEQ ID NO:192)的核酸序列的5′TSD,和包含SEQ ID NO:192的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:116的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:142的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:54的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:54的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:54(HAT1_AG的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:117的核酸序列;2)RTF中的3′TR,所述RTF包含SEQ ID NO:143的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:3的核酸序列、其变体或其片段的5′TR;和2)包含SEQ ID NO:29的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:3的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,具有与SEQ ID NO:29的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:3的核酸序列的5′TR;和2)包含SEQ IDNO:29的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含TA(SEQ IDNO:193)的核酸序列的5′TSD,和包含SEQ ID NO:193的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:117的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:143的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:55的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:55的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:3(Tc1-8B_DR的5′TR)
SEQ ID NO:29(Tc1-8B_DR的3′TR)
SEQ ID NO:55(Tc1-8B_DR的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:118的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:144的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:4的核酸序列、其变体或其片段的5′TR;和2)包含SEQ ID NO:30的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:4的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:30的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:4的核酸序列的5′TR;和2)包含SEQID NO:30的核酸序列的3′TR。在一些实施方案中,所述转座元件还包括包含TTAGAG(SEQID NO:195)的核酸序列的5′TSD,和包含SEQ ID NO:195的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:118的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:144的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项1的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:56的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:56的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:56(hAT-6_PM的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:119的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:145的核酸序列。在一些实施方案中,所述转座元件包含:1)包含CAGGGG(SEQ ID NO:5)的核酸序列、其变体或其片段的5′TR;和2)包含SEQ ID NO:31的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:5的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:31的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:5的核酸序列的5′TR;和2)包含CCCCTG(SEQ ID NO:31)的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含CTGTATAG(SEQ ID NO:196)的核酸序列的5′TSD和包含SEQ ID NO:196的核酸序列的3′TSD。转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:119的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:145的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:57的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:57的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:57(hAT-3_XT的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:120的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:146的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:6的核酸序列、其变体或其片段的5′TR;和2)包含SEQ ID NO:32的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:6的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:32的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:6的核酸序列的5′TR;和2)包含SEQID NO:32的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ IDNO:193的核酸序列的5′TSD和包含SEQ ID NO:193的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:120的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:146的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:58的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:58的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:6(Tc1-3_Xt的5′TR)
SEQ ID NO:32(Tc1-3_Xt的3′TR)
SEQ ID NO:58(Tc1-3_Xt的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:121的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:147的核酸序列。在一些实施方案中,所述转座元件包含:1)包含CAGGGGTGGCGAACC(SEQ ID NO:7)核酸序列、其变体或其片段的5′TR;和2)包含GGTTCGCCACCCCTG(SEQ ID NO:33)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:7的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:33的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:7的核酸序列的5′TR;和2)包含SEQ ID NO:33的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含GTCTATAC(SEQ ID NO:194)的核酸序列的5′TSD,和包含SEQ ID NO:194的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:121的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:147的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:59的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:59的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:59(hAT-5_DR的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:122的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:148的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:8的核酸序列、其变体或其片段的5′TR;和2)包含SEQ ID NO:34的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:8的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:34的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:8的核酸序列的5′TR;和2)包含SEQID NO:34的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ IDNO:193的核酸序列的5′TSD,和包含SEQ ID NO:193的核酸序列的3′TR。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:122的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:148的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:60的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:60的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:8(Tc1-3_FR的5′TR)
SEQ ID NO:34(Tc1-3_FR的3′TR)
SEQ ID NO:60(Tc1-3_FR的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:123的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:149的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:9的核酸序列、其变体或其片段的5′TR;和2)包含SEQ ID NO:35的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:9的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:35的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:9的核酸序列的5′TR;和2)包含SEQID NO:35的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ IDNO:193的核酸序列的5′TSD和包含SEQ ID NO:193的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:123的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:149的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:61的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:61的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:9(Tc1-5_Xt的5′TR)
SEQ ID NO:35(Tc1-5_Xt的3′TR)
SEQ ID NO:61(Tc1-5_Xt的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:124的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:150的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:10的核酸序列、其变体或其片段的5′TR;和2)包含SEQ ID NO:36的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:10的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:36的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:10的核酸序列的5′TR;和2)包含SEQ ID NO:36的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ ID NO:193的核酸序列的5′TSD和包含SEQ ID NO:193的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:124的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:150的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:62的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:62的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:10(c1-10_Xt的5′TRT)
SEQ ID NO:36(c1-10_Xt的3′TR T)
SEQ ID NO:62(Tc1-10_X的转座酶t)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:125的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:151的核酸序列。在一些实施方案中,所述转座元件包含:1)包含TACAGTGTCGGACAAATC(SEQ ID NO:11)的核酸序列、其变体或其片段的5′TR;和2)包含GATTTGTCCGACACTGTA(SEQ ID NO:37)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:11的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:37的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:11的核酸序列的5′TR;和2)包含SEQ ID NO:37的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ ID NO:193的核酸序列的5′TSD,和包含SEQ IDNO:193的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:125的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:151的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:63的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:63的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:63(Mariner2_AG的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:126的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:152的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:12的核酸序列、其变体或其片段的5′TR;和2)包含SEQ ID NO:38的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:12的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:38的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:12的核酸序列的5′TR;和2)包含SEQ ID NO:38的核酸序列的3′TR。在一些实施方案中,所述转座元件还包括包含SEQID NO:193的核酸序列的5′TSD和包含SEQ ID NO:193的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:126的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:152的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:64的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:64的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:12(Tc1-1_Xt的5′TR)
SEQ ID NO:38(Tc1-1_Xt的3′TR)
SEQ ID NO:64(Tc1-1_Xt的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:127的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:153的核酸序列。在一些实施方案中,所述转座元件包含:1)包含CACTGGTGGACAT(SEQ ID NO:13)核酸序列、其变体或其片段的5′TR);和2)包含ATGTCCACCAGTG(SEQ ID NO:39)的核酸序列、其变体或其片段的、3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:13的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:39的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ IDNO:13的核酸序列的5′TR;和2)包含SEQ ID NO:39的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ ID NO:193的核酸序列的5′TSD和包含SEQ ID NO:193的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其具有与SEQ ID NO:127的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:153的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:65的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:65的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:65(Tc1-1_AG的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:128的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:154的核酸序列。在一些实施方案中,所述转座元件包含:1)包含ATATACAC(SEQ ID NO:14)核酸序列、其变体或其片段的5′TR);和2)包含GTGTATAT(SEQ ID NO:40)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:14的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:40的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:14的核酸序列的5′TR;和2)包含SEQ ID NO:40的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含AT(SEQ ID NO:198)的核酸序列的5′TSD,和包含SEQ ID NO:198的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:128的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:154的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:66的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:66的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:66(Tc1DR3_Xt的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:129的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:155的核酸序列。在一些实施方案中,所述转座元件包含:1)包含CAGGGGTCACCAAACT(SEQ ID N0:15)核酸序列其变体或其片段的5′TR)、;和2)包含SEQ ID NO:41的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:15的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:41的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:15的核酸序列的5TR;和2)包含AGTTTGGTGACCCCTG(SEQ ID NO:41)的核酸序列的3′TR。在一些实施方案中,所述转座元件还包括包含CTCTAGAC(SEQ ID NO:199)的核酸序列的5′TSD,和包含SEQID NO:199的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:129的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:155的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:67的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:67的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:67(hAT-3_PM的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:130的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:156的核酸序列。在一些实施方案中,所述转座元件包含:1)包含CAGGGGTCACCAAACT(SEQ ID NO:16)核酸序列、其变体或其片段的5′TR;和2)包含AGTTTGGTGACCCCTG(SEQ ID NO:42)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:16的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:42的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ IDNO:16的核酸序列的5′TR;和2)包含SEQ ID NO:42的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ ID NO:193的核酸序列的5′TSD和包含SEQ ID NO:193的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:130的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:156的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:68的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:68的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:68(Tc1-1_PM的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:131的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:157的核酸序列。在一些实施方案中,所述转座元件包含:1)包含CAGGC(SEQ ID NO:17)的核酸序列、其变体或其片段的5′TR;和2)包含GCCTG(SEQ ID NO:43)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:17的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:43的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:17的核酸序列的5′TR;和2)包含SEQ ID NO:43的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ ID NO:193的核酸序列的5′TSD和包含SEQ ID NO:193的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:131的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:157的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:69的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:69的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:69(Mariner-4_AMi的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:132的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:158的核酸序列。在一些实施方案中,所述转座元件包含:1)包含CAGTGATGGCGAACCT(SEQ ID NO:18)的核酸序列、其变体或其片段的5′TR;和2)包含AGGTTCGCCATCACTG(SEQ ID NO:44)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:18的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:44的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQID NO:18的核酸序列的5′TR;和2)包含SEQ ID NO:44的核酸序列的3′TR。在一些实施方案中,所述转座元件还包括包含GTCTAGAG(SEQ ID NO:197)的核酸序列的5′TSD,和包含SEQID NO:197的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:132的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:158的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:70的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:70的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:70(Myotis_hAT1的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:133的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:159的核酸序列。在一些实施方案中,所述转座元件包含:1)包含CAG(SEQ ID NO:19)核酸序列、其变体或其片段的5′TR;和2)包含CTG(SEQ ID NO:45)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:19的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:45的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:19的核酸序列的5′TR;和2)包含SEQ ID NO:45的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含GTCTAGAC(SEQ ID NO:200)的核酸序列的5′TSD,和包含SEQ ID NO:200的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:133的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:159的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:71的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:71的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:71(hAT-7_PM的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:134的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:160的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:20的核酸序列、其变体或其片段的5′TR;和2)包含SEO ID NO:46的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:20的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:46的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:20的核酸序列的5′TR;和2)包含SEQ ID NO:46的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ ID NO:193的核酸序列的5′TSD,和包含SEQ ID NO:193的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:134的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:160的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:72的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:72的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:20(Tc1-11_Xt的5′TR)
SEQ ID NO:46(Tc1-11_Xt的3′TR)
SEQ ID NO:72(Tc1-11_Xt的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:135的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:161的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:21的核酸序列、其变体或其片段的5′TR;和2)包含SEQ ID NO:47的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:21的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:47的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:21的核酸序列的5′TR;和2)包含SEQ ID NO:47的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ ID NO:193的核酸序列的5′TSD,和包含SEQ ID NO:193的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:135的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:161的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:73的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:73的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:21(Tc1-16_Xt的5′TR)
SEQ ID NO:47(的3′TR Tc1-16_Xt)
SEQ ID NO:73(的转座酶Tc1-16_Xt)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:136的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:162的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:22的核酸序列、其变体或其片段的5′TR;和2)包含SEQ ID NO:48的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:22的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:48的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:22的核酸序列的5′TR;和2)包含SEQ ID NO:48的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ ID NO:193的核酸序列的5′TSD,和包含SEQ ID NO:193的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:136的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:162的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:74的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:74的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:22(Tc1-4_Xt的5′TR)
SEQ ID NO:48(Tc1-4_Xt的3′TR)
SEQ ID NO:74(Tc1-4_Xt的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:137的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:163的核酸序列。在一些实施方案中,所述转座元件包含:1)包含CACTGCTCAAAAAAATAAAGGGAACAC(SEQ ID NO:23)的核酸序列、其变体或其片段的5′TR;和2)包含GTGTTCCCTTTATTTTTTTTGAGCAGTG(SEQ ID NO:49)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:23的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:49的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:23的核酸序列的5′TR;和2)包含SEQ ID NO:49的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ ID NO:193的核酸序列的5′TSD和包含SEQ ID NO:49的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:137的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:163的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:75的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:75的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID N0:75(Tc1-15_Xt的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:138的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:164的核酸序列。在一些实施方案中,所述转座元件包含:1)包含CACTGCTCAAAAAAATTAGAGGAACACTT(SEQ ID NO:24)的核酸序列、其变体或其片段的5′TR;和2)包含AAGTGTTTCCTCTAATTTTTTTTGAGCAGTG(SEQ ID NO:50)的核酸序列、其变体或其片段3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:24的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID N0:50的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:24的核酸序列的5′TR;和2)包含SEQ ID NO:50的核酸序列的3′TR。在一些实施方案中,所述转座元件还包括包含SEQ ID NO:193的核酸序列的5′TSD和包含SEQ ID NO:193的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:138的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:164的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:76的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:76的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:76(TC1_FR2的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:139的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:165的核酸序列。在一些实施方案中,所述转座元件包含:1)包含TAG(SEQ ID NO:25)的核酸序列、其变体或其片段的5′TR;和2)包含CTA(SEQ ID NO:51)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:25的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:51的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:25的核酸序列的5′TR;和2)包含SEQ ID NO:51的核酸序列的3′TR。在一些实施方案中,所述转座元件还包括包含ATCATCAT(SEQ ID NO:201)的核酸序列的5′TSD,和包含SEQ ID NO:201的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:139的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:165的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:77的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:77的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:77(hAT-9_XT的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:140的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:168的核酸序列。在一些实施方案中,所述转座元件包含:1)包含CCGTATTTTCCGCACTATAAGGCGCACC(SEQ ID NO:26)的核酸序列、其变体或其片段的5′TR;和2)包含GGTGCGCCTTATAGTGCGGAAAATACGG(SEQ ID NO:52)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:26的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:52的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:26的核酸序列的5′TR;和2)包含SEQ ID NO:52的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ ID NO:193的核酸序列的5′TSD,和包含SEQ ID NO:193的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:140的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:168的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:78的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:78的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:78(Mariner-5_XT的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:167的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:179的核酸序列。在一些实施方案中,所述转座元件包含:1)包含CCGTATTTTCTC(SEQ ID NO:79)的核酸序列、其变体或其片段的5′TR;和2)包含GAGAAAATACGG(SEQ ID NO:91)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:79的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:91的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:79的核酸序列的5′TR;和2)包含SEQ ID NO:91的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ ID NO:193的核酸序列的5′TSD,和包含SEQ ID NO:193的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:167的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:179的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:103的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:103的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:103(Mariner-6_AMi的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:168的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:180的核酸序列。在一些实施方案中,所述转座元件包含:1)包含CCCTTT(SEQ ID NO:80)的核酸序列、其变体或其片段的5′TR;和2)包含AAAGGG(SEQ ID NO:92)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:80的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:92的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:80的核酸序列的5′TR;和2)包含SEQ ID NO:92的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含TTAA(SEQ ID NO:202)的核酸序列的5′TSD,和包含SEQ ID NO:202的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:168的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:180的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:104的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:104的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:104(piggyBac-2_XT的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:169的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:181的核酸序列。在一些实施方案中,所述转座元件包含:1)包含CCTTCATACG TTCCCATG(SEQ ID NO:81)的核酸序列、其变体或其片段5′TR;和2)包含CATGAGAACG GATGAGGG(SEQ ID NO:93)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:81的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:93的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:81的核酸序列的5′TR;和2)包含SEQ ID NO:93的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ ID NO:202的核酸序列的5′TSD和包含SEQ IDNO:202的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:169的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:181的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:105的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:105的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:105(piggyBac-1_AMi的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:170的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:182的核酸序列。在一些实施方案中,所述转座元件包含:1)包含CAGTAGAACC CCG(SEQ ID NO:82)的核酸序列、其变体或其片段的5′TR;和2)包含CGGGGTTCTACTG(SEQ ID NO:94)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:82的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:94的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ IDNO:82的核酸序列的5′TR;和2)包含SEQ ID NO:94的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ ID NO:193的核酸序列的5′TSD,和包含SEQ ID NO:193的核酸序列3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:170的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:182的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:106的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:106的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:106(Mariner-3_Crp的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:171的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:183的核酸序列。在一些实施方案中,所述转座元件包含:1)包含CAGTGGTTCT TAACCT(SEQ ID NO:83)的核酸序列、其变体或其片段的5′TR;和2)包含AGGTTAAGAA CCACTG(SEQ ID NO:95)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:83的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:95的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQID NO:83的核酸序列的5′TR;和2)包含SEQ ID NO:95的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含CTCTAGAG(SEQ ID NO:203)的核酸序列的5′TSD,和包含SEQ ID NO:203的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:171的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:183的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:107的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:107的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:107(hAT-1_PM的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:172的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:184的核酸序列。在一些实施方案中,所述转座元件包含:1)包含TAGGGCTGTG CGAAA(SEQ ID NO:84)的核酸序列、其变体或其片段的5′TR,;和2)包含TTTCGCACAG CCCTA(SEQ ID NO:96)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:84的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:96的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQID NO:84的核酸序列的5′TR;和2)包含SEQ ID NO:96的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ ID NO:196的核酸序列的5′TSD和包含SEQ ID NO:96的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:172的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:184的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:108的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:108的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:108(hAT-17_Croc的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:173的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:185的核酸序列。在一些实施方案中,所述转座元件包含:1)包含CAGGTTGAG(SEQ ID NO:85)的核酸序列、其变体或其片段的5′TR;和2)包含CTCAACCTG(SEQ ID NO:97)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:85的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:97的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:85的核酸序列的5′TR;和2)包含SEQ ID NO:97的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ ID NO:193的核酸序列的5′TSD和包含SEQ ID NO:193的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:173的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:185的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:109的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:109的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:109(Tigger4的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:173的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:185的核酸序列。在一些实施方案中,所述转座元件包含:1)包含CAGTAGTCCC CCCTTATCCG CGG(SEQ ID NO:86)的核酸序列、其变体或其片段的5′TR;和2)包含CCGCGGATAA GGGGGGACTA CTG(SEQ ID NO:98)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:86的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:98的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:86的核酸序列的5′TR;和2)包含SEQ ID NO:98的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ ID N0:193的核酸序列的5′TSD和包含SEQ ID NO:193的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:173的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:185的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:110的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:110的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:110(Tigger7的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:175的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:187的核酸序列。在一些实施方案中,所述转座元件包含:1)包含TAGGG(SEQ ID NO:87)的核酸序列、其变体或其片段的5′TR);和2)包含CCCTA(SEQ ID NO:99)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:87的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:99的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:87的核酸序列的5′TR;和2)包含SEQ ID NO:99的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含TTTATAAT(SEQ ID NO:204)的核酸序列的5′TSD,和包含SEQ ID NO:204的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:175的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:187的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:111的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:111的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:111(hAT-19_Crp的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:176的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:188的核酸序列。在一些实施方案中,所述转座元件包含:1)包含TAGG(SEQ ID NO:88)的核酸序列、其变体或其片段的5′TR);和2)包含CCTA(SEQ ID NO:100)的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:88的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:100的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:88的核酸序列的5′TR;和2)包含SEQ ID NO:100的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含CTATATAG(SEQ ID NO:205)的核酸序列的5′TSD,和包含SEQ ID NO:205的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:176的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:188的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:112的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:112的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:112(hAT-17B_Croc的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:177的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:189的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:89的核酸序列、其变体或其片段的5′TR;和2)包含SEQ ID NO:101的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)具5′TR,其具有与SEQ ID NO:89的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:101的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:89的核酸序列的5′TR;和2)包含SEQ ID NO:101的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含ATTAATAG(SEQ ID NO:206)的核酸序列的5′TSD,和包含SEQ ID NO:206的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:177的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:189的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:113的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:113的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:113(hAT-10_XT的转座酶)
在一些实施方案中,所述转座元件包含:1)LTF中的5′TR,所述LTF包含SEQ ID NO:178的核酸序列;和2)RTF中的3′TR,所述RTF包含SEQ ID NO:190的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:90的核酸序列、其变体或其片段的5′TR;和2)包含SEQ ID NO:102的核酸序列、其变体或其片段的3′TR。在一些实施方案中,所述转座元件包含:1)5′TR,其具有与SEQ ID NO:90的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列;和2)3′TR,其具有与SEQ ID NO:102的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件包含:1)包含SEQ ID NO:90的核酸序列的5′TR;和2)包含SEQ ID NO:102的核酸序列的3′TR。在一些实施方案中,所述转座元件进一步包括包含SEQ ID NO:193的核酸序列的5′TSD和包含SEQ ID NO:193的核酸序列的3′TSD。在一些实施方案中,所述转座元件不包含5′TSD和/或3′TSD。在一些实施方案中,所述转座元件包含LTF,其包含与SEQ ID NO:178的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列;和2)RTF,其包含与SEQ ID NO:190的核酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%中的任一项)的序列同一性的核酸序列。在一些实施方案中,所述转座元件与包含SEQ ID NO:114的氨基酸序列或其变体的转座酶相关。在一些实施方案中,转座酶包含与SEQ ID NO:114的氨基酸序列具有至少约80%(例如,至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多中的任一项)的序列同一性的氨基酸序列。在一些实施方案中,所述转座元件包含编码转座酶的核酸序列。在一些实施方案中,所述转座元件不包含编码转座酶的核酸序列。
SEQ ID NO:90(MARWOLEN1的5′TR)
SEQ ID NO:102(MARWOLEN1的3′TR)
SEQ ID NO:114(MARWOLEN1的转座酶)
异源核酸
本文所述的工程化转座元件适用于转座多种异源核酸。在一些实施方案中,所述异源核酸是DNA。在一些实施方案中,所述异源核酸是双链的。在一些实施方案中,所述异源核酸包含一种或多种经修饰的核苷酸。在一些实施方案中,所述异源核酸未经修饰。
转座元件中的异源核酸可以具有各种合适的长度。在一些实施方案中,所述异源核酸的长度为至少约1kb、2kb、10kb、20kb、30kb、40kb、50kb、60kb、70kb、80kb、90kb、100kb、150kb、200kb、250kb、300kb、350kb、400kb、450kb、500kb、600kb、700kb、800kb、900kb、1000kb或更多中的任一项。在一些实施方案中,所述异源核酸的长度不超过约1000kb、900kb、800kb、700kb、600kb、500kb、450kb、400kb、350kb、300kb、250kb、200kb、150kb、100kb、90kb、80kb、70kb、60kb、50kb、40kb、30kb、20kb、10kb、5kb、2kb或1kb中的任一项。在一些实施方案中,所述异源核酸的长度为约100bp至约1kb、约1kb至约2kb、约2kb至约5kb、约5kb至约10kb、约100bp至约5kb、约100bp至约2kb、约2kb至约10kb、约1kb至约10kb、约10kb至约20kb、约20kb至约50kb、约50kb至约100kb、约1kb至约100kb、约150kb至约200kb、约200kb至约300kb、约300kb至约400kb、约400kb至约500kb、约500kb至约600kb、约600kb至约700kb、约700kb至约80kb、约800kb至约900kb、约900kb至约1000kb、约10kb至约100kb、约100kb至约500kb、约500kb至约1000kb、或约10kb至约500kb。在一些实施方案中,所述异源核酸的长度为约10kb至约300kb核苷酸。在一些实施方案中,所述异源核酸的长度为约100bp至约300kb核苷酸。
异源核酸可包含一种或多种编码序列,包括1、2、3、4、5、6、10或更多个中的任一项的编码序列。在本申请中可以使用任何合适的编码序列,并且编码序列可以编码任何合适的目标生物产物。在一些实施方案中,所述编码序列编码RNA分子。在一些实施方案中,所述编码序列编码多肽,例如蛋白质。在一些实施方案中,所述异源核酸包含编码第一蛋白质的第一编码序列和编码第二蛋白质的第二编码序列。在一些实施方案中,所述异源核酸包含编码第一RNA的第一编码序列和编码第二RNA的第二编码序列。在一些实施方案中,所述异源核酸包含编码蛋白质的第一编码序列和编码RNA的第二编码序列。
在一些实施方案中,所述编码序列编码治疗性蛋白质。在一些实施方案中,所述编码序列编码治疗性抗体,包括单克隆抗体、多特异性抗体和抗体片段。在一些实施方案中,所述编码序列编码细胞因子。在一些实施方案中,所述编码序列编码抗原。在一些实施方案中,所述编码序列编码可用于基因治疗的治疗剂。可用于基因治疗的示例性治疗性蛋白质包括但不限于腺苷脱氨酶、在溶酶体贮积病中受影响的酶、载脂蛋白E、脑源性神经营养因子(BDNF)、骨形态发生蛋白2(BMP-2)、骨形态发生蛋6(BMP-6)、骨形态发生蛋白7(BMP-7)、心肌营养因子1(CT-1)、CD22、CD40、睫状神经营养因子(CNTF)、CCL1-CCL28、CXCL1-CXCL17、CXCL1、CXCL2、CX3CL1、血管内皮细胞生长因子(VEGF)、多巴胺、促红细胞生成素、因子IX、因子VIII、表皮生长因子(EGF)、雌激素、FAS-配体、成纤维细胞生长因子1(FGF-1)、成纤维细胞生长因子2(FGF-2)、成纤维细胞生长因子4(FGF-4)、成纤维细胞生长因子5(FGF-5)、成纤维细胞生长因子6(FGF-6)、成纤维细胞生长因子1(FGF-7)、成纤维细胞生长因子1(FGF-10)、Flt-3、粒细胞集落刺激因子(G-CSF)、粒细胞巨噬细胞刺激因子(GM-CSF)、生长激素、肝细胞生长因子(HGF)、干扰素α(IFN-a)、干扰素β(IFN-b)、干扰素γ(IFNg)、胰岛素、胰高血糖素、胰岛素样生长因子1(IGF-1)、胰岛素样生长因子2(IGF-2)、白细胞介素1(IL-1)、白细胞介素2(IL-2)、白细胞介素3(IL-3)、白细胞介素4(IL-4)、白细胞介素5(IL-5)、白细胞介素6(IL-6)、白细胞介素7(IL-7)、白细胞介素8(IL-8)、白细胞介素9(IL-9)、白细胞介素10(IL-10)、白细胞介素11(IL-11)、白细胞介素12(IL-12)、白细胞介素13(IL-13)、白细胞介素15(IL-15)、白细胞介素17(IL-17)、白细胞介素19(IL-19)、巨噬细胞集落刺激因子(M-CSF)、单核细胞趋化蛋白1(MCP-1)、巨噬细胞炎症蛋白3a(MIP-3a)、巨噬细胞炎症蛋白3b(MIP-3b)、神经生长因子(NGF)、神经营养因子3(NT-3)、神经营养因子4(NT-4)、甲状旁腺激素、血小板衍生生长因子AA(PDGF-AA)、血小板衍生生长因子AB(PDGF-AB)、血小板衍生生长因子BB(PDGF-BB)、血小板衍生生长因子CC(PDGF-CC)、血小板衍生生长因子DD(PDGF-DD)、RANTES、干细胞因子(SCF)、基质细胞衍生因子1(SDF-1)、转化生长因子α(TGF-a)、转化生长因子β(TGF-b)、肿瘤坏死因子α(TNF-a)、Wnt1、Wnt2、Wnt2b/13、Wnt3、Wnt3a、Wnt4、Wnt5a、Wnt5b、Wnt6、Wnt7a、Wnt7b、Wnt7c、Wnt8、Wnt8a、Wnt8b、Wnt8c、Wnt10a、Wnt10b、Wnt11、Wnt14、Wnt15或Wnt16、音猬因子、沙漠刺猬因子和印度刺猬因子。
在一些实施方案中,所述编码序列编码工程化受体,如嵌合抗原受体(CAR)或工程化T细胞受体(TCR)。
如本文所用,“嵌合抗原受体”或“CAR”是指基因工程受体,其将一种或多种抗原特异性移植到细胞如T细胞上。CAR也被称为“人工T细胞受体”、“嵌合T细胞受体”或“嵌合免疫受体”。在一些实施方案中,CAR包含对肿瘤抗原特异的抗体的胞外可变结构域,以及T细胞或其他受体的胞内信号转导结构域,如一个或多个共刺激结构域。“CAR-T”是指表达CAR的T细胞。
在一些具体实施方案中,所述编码序列编码嵌合抗原受体(CAR)。许多嵌合抗原受体是本领域已知的并且可以适用于本申请。通过利用例如抗体分子的抗原结合片段或抗体可变结构域,还可以构建具有对任何细胞表面标志物的特异性的CAR。本文可以使用任何产生CAR的方法。参见例如US6,410,319、US7,446、191、US7,514,537、US9765342B2、WO 2002/077029、WO2015/142675、US2010/065818、US 2010/025177、US 2007/059298和Berger C.etal.,J.Clinical Investigation 118:1294-308(2008),其通过引用并入本文。
如本文所用,“T细胞受体”或“TCR”是指内源性或重组T细胞受体,其包含与结合在MHC分子中的特定抗原肽结合的细胞外抗原结合结构域。在一些实施方案中,TCR包含TCRα多肽链和TCRβ多肽链。在一些实施方案中,TCR特异性结合肿瘤抗原。“TCR-T”是指表达重组TCR的T细胞。术语“重组体”是指一种生物分子,例如基因或蛋白质,其(1)已从其天然存在的环境中去除,(2)与自然界中发现该基因的多核苷酸的全部或部分不相关,(3)与自然界中不相关的多核苷酸可操作连接,或(4)不存在于自然。术语“重组体”可用于指克隆的DNA分离物、化学合成的多核苷酸类似物或由异源系统生物合成的多核苷酸类似物,以及由此类核酸编码的蛋白质和/或mRNA。
在一些具体实施方案中,所述编码序列编码工程化T细胞受体(TCR)。在一些实施方案中,工程改造的TCR对肿瘤抗原是特异性的。在一些实施方案中,肿瘤抗原来源于肿瘤细胞的细胞内蛋白质。已经描述了许多对肿瘤抗原(包括肿瘤相关抗原)特异的TCR,包括例如NY-ESO-1癌-睾丸抗原、p53肿瘤抑制抗原、黑色素瘤中肿瘤抗原的TCR(例如MARTI、gp100)、白血病(例如WT1、次要组织相容性抗原)和乳腺癌(例如HER2、NY-BR1)。本领域已知的任何TCR都可以用于本申请。在一些实施方案中,TCR对肿瘤抗原具有增强的亲和力。示例性TCR和生产TCR的方法已描述于例如US5830755和Kessels et al.Immunotherapythrough TCR gene transfer.Nat.Immunol.2,957-961(2001)。
在一些实施方案中,所述编码序列编码选择标记。“选择标记”是一种基因,其表达产生可检测的表型并且有助于检测具有异源核酸的宿主细胞,所述异源核酸编码插入到靶核酸(例如基因组DNA)中的选择标记。在一些实施方案中,选择标记赋予对抗生素剂如嘌呤霉素的抗性。选择标记的其他非限制性实例包括抗药性基因和营养标记。例如,选择标记可以是赋予选自以下的抗生素抗性的基因:氨苄青霉素、卡那霉素、红霉素、氯霉素、庆大霉素、春雷霉素、利福平、壮观霉素、D-环丝氨酸、萘啶酸、链霉素或四环素。选择标记的其他非限制性实例包括腺苷脱氨酶、氨基糖苷磷酸转移酶、二氢叶酸还原酶、潮霉素-B-磷酸转移酶、胸苷激酶和黄嘌呤-鸟嘌呤磷酸核糖基转移酶。适用于哺乳动物细胞的选择标记的实例还包括DHFR、胸苷激酶、金属硫蛋白-I和-II,优选灵长类金属硫蛋白基因、腺苷脱氨酶、鸟氨酸脱羧酶等。在一些具体实施方案中,所述异源核酸包含嘌呤霉素抗性基因的编码序列。
在一些实施方案中,所述编码序列是报告基因。“报告基因”是编码可检测产物的基因,因此报告基因产物的检测可用于评估目标核酸的功能。报告基因可以与任何合适的目标核酸(例如启动子、目标基因、选择标记和/或转座元件的末端重复)融合,以允许检测目标核酸是否在给定的一组条件下被表达或改变(例如被转座酶切除)。报告基因的非限制性实例包括:3-半乳糖苷酶、3-葡萄糖醛酸酶、谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、荧光素酶、氯霉素乙酰转移酶(CAT)、分泌型碱性磷酸酶(SEAP)、绿色荧光蛋白(GFP,例如eGFP)、红色荧光蛋白(RFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、儿茶酚2,3-加氧酶(xylE)和自体荧光蛋白,包括蓝色荧光蛋白(BFP)。在一些实施方案中,所述异源核酸包含编码增强型绿色荧光蛋白(eGFP)的编码序列。在一些实施方案中,所述编码序列编码多于一种生物产物,或者编码序列可以编码融合蛋白。在一些实施方案中,本申请的异源核酸包含编码嘌呤霉素抗性-增强型绿色荧光蛋白(eGFP)融合蛋白的编码序列。
在一些实施方案中,所述编码序列编码转座酶。
在一些实施方案中,所述编码序列编码可用于基因组编辑的多肽。基因组编辑可以通过使用核酸酶来完成,所述核酸酶在基因组中的所需位置产生特定的双链断裂(DSB),并利用细胞的内源机制以通过同源定向修复(HDR)(例如,同源重组)或通过非同源末端连接(NHEJ)修复诱导的断裂。可以将任何合适的核酸酶引入细胞以诱导靶DNA序列的基因组编辑,包括但不限于CRISPR相关蛋白(Cas,例如Cas9)核酸酶、锌指核酸酶(ZFN,例如FokI)、转录激活剂类效应核酸酶(TALEN,例如TALE)、归巢核酸内切酶及其变体(Shukla et al.(2009)Nature 459:437-441;Townsend et al(2009)Nature 459:442-445)。在一些实施方案中,所述编码序列编码Cas9多肽。
在一些实施方案中,所述编码序列编码RNA分子。RNA分子可以是蛋白质编码RNA如信使RNA(mRNA),或非蛋白质编码RNA,包括但不限于转运RNA(tRNA)和核糖体RNA(rRNA)、小RNA如微小RNA(miRNA)、小干扰RNA(siRNA)、短发夹RNA(shRNA)或piwi相互作用RNA(piRNA)和长非编码RNA(lincRNA)。某些类型的小RNA,如微小RNA和siRNA在RNA干扰(RNAi)过程中很重要。RNAi是一种基因调控过程,其中由于通过转录后降解或翻译的抑制而干扰小RNA,从而抑制原本正常表达的靶基因的表达。对于RNAi技术的详细描述,参见,例如,U.S.Pat.No.6,326,527;6,452,067;6,573,099;6,753,139;和6,777,588。在一些实施方案中,所述编码序列编码调节RNA。在一些实施方案中,所述编码序列编码RNAi分子。在一些实施方案中,所述编码序列编码shRNA。在一些实施方案中,所述编码序列编码miRNA。
在一些实施方案中,所述编码序列编码可用于基因组编辑的RNA分子。此类RNA分子的实例包括但不限于CRISPR RNA(crRNA)、反式激活crRNA(tracrRNA)、指导RNA(gRNA)和单指导RNA(sgRNA)。
在一些实施方案中,所述异源核酸进一步包含一种或多种调节编码序列表达的调节元件。调节元件设想为与本文所述的方法和构建体一起使用。术语“调节元件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)和其他表达控制元件(例如,转录终止信号,如多腺苷酸化(poly-A)信号和poly-U序列)。此类调节元件描述于,例如,Goeddel,GeneExpression Technology:Methods in Enzymology 185,Academic Press,San Diego,Calif.(1990)。
启动子是引导编码序列的表达模式的重要调控元件。在一些实施方案中,所述异源核酸包含与编码序列可操作地连接的启动子。在本申请中可以使用任何合适的启动子。在一些实施方案中,启动子是内源启动子。在一些实施方案中,启动子是异源启动子。已经探索了多种启动子用于哺乳动物细胞中的基因表达,并且本领域已知的任何启动子都可以用于本申请。启动子可大致分为组成型启动子或调节启动子,如诱导型启动子。在一些实施方案中,所述异源核酸包含与组成型启动子可操作地连接的编码序列(例如,转座酶编码序列)。在一些实施方案中,所述异源核酸包含与诱导型启动子可操作地连接的编码序列(例如,转座酶编码序列)。
组成型启动子允许异源核酸在宿主细胞中组成型表达。本文考虑的示例性组成型启动子包括但不限于巨细胞病毒(CMV)启动子、人延伸因子-1α(hEF1α)、泛素C启动子(UbiC)、磷酸甘油激酶启动子(PGK)、猿病毒40早期启动子(SV40)、和与CMV早期增强子(CAGG)偶联的鸡β-肌动蛋白启动子。这种组成型启动子在驱动转基因表达方面的效率已在大量研究中进行了广泛比较。例如,Michael C.Milone等人比较了CMV、hEF1α、UbiC和PGK在人原代T细胞中驱动嵌合抗原受体表达的效率,并得出结论,hEF1α启动子不仅诱导最高水平的转基因表达,而且还在CD4和CD8人T细胞中理想维持(Molecular Therapy,17(8):1453-1464(2009))。在一些实施方案中,所述异源核酸中的启动子是CAG启动子。包含编码由组成型启动子驱动的转座酶或选择标记/报告基因的异源核酸序列的示例性工程化转座元件显示在图3中。其中启动子是CMV启动子或PGK启动子。
对于某些应用设想了,如在某些基因治疗中,可能需要使用编码序列的具有中等或弱表达模式的启动子,而不是强表达启动子(例如CMV启动子),以避免或减少基于转座酶的自动调节事件,统称为过度生产抑制(OPI)。
调节启动子,如诱导型启动子,允许异源核酸在某些情况下,如在特定发育阶段,或特定组织类型或亚细胞位置表达。本领域已知各种类型的调节启动子,包括诱导型、组织特异性、细胞类型特异性或细胞周期特异性,参见例如Sambrook and Russell,2001。诱导型启动子属于调节启动子的类别。诱导型启动子可以由一种或多种条件诱导,如物理条件、工程化哺乳动物细胞的微环境或工程化哺乳动物细胞的生理状态、诱导子(即诱导剂)或其组合。
在一些实施方案中,会希望仅在细胞类型、细胞谱系或组织的子集中或在特定发育阶段使用启动子表达编码序列。实例包括但不限于:B29启动子(B细胞表达)、矮小转录因子(CBFa2)启动子(干细胞表达)、CD14启动子(单核细胞表达)、CD43启动子(白细胞和血小板表达)、CD45启动子(造血细胞表达)、CD68启动子(巨噬细胞表达)、内皮糖蛋白启动子(内皮细胞表达)、fms相关酪氨酸激酶1(FLT1)启动子(内皮细胞表达)、整合素、α2b(ITGA2B)启动子(巨核细胞表达)、细胞内粘附分子2(ICAM-2)启动子(内皮细胞表达)、干扰素β(IFN-β)启动子(造血细胞表达)、p-珠蛋白LCR(红细胞表达)、珠蛋白启动子(红细胞表达)、β-珠蛋白启动子(红细胞表达)、α-珠蛋白HS40增强子(红细胞表达)、锚蛋白-1启动子(红细胞表达)和维斯科特-奥尔德里奇综合征蛋白质(WASP)启动子(血红蛋白拓扑细胞表达)。
本文描述的方法的方面可以利用终止子序列。终止子序列包括一段核酸序列,其在转录过程中标记基因或操纵子的末端。该序列通过在新合成的mRNA中提供信号来介导转录终止,这些信号触发从转录复合物中释放mRNA的过程。这些过程包括mRNA二级结构与复合物的直接相互作用和/或募集的终止因子的间接活动。转录复合物的释放解放了RNA聚合酶和相关的转录机制,以开始转录新的mRNA。终止子序列包括本领域已知的那些。在本申请的一些实施方案中,终止子序列是多聚腺苷酸化(poly-A)信号。
在一些实施方案中,所述异源核酸包含至少一个限制性内切核酸酶识别位点,例如限制性位点,用作插入外源核酸的位点。本领域已知多种限制性位点,包括但不限于:HindIII、PstI、SalI、AccI、HincII、XbaI、BamHI、SmaI、XmaI、KpnI、SacI、EcoRI等。在一些实施方案中,限制性位点是多克隆位点(MCS,也称为多接头),即由多种不同的限制性内切酶(例如上面列出的那些)识别的紧密排列的系列或位点阵列。在其他实施方案中,本申请的异源核酸包含重组酶识别位点,如分别被Cre、Flp和PhiC31重组酶识别的LoxP、FRT或AttB/AttP位点。
在一些实施方案中,所述异源核酸包含标签序列。标签序列可用于鉴定分子,或例如通过杂交提供用于捕获分子的位点。
在一些实施方案中,所述异源核酸包含条形码序列。“条形码序列”是指具有可用于识别和/或区分一个或多个与该核酸条形码缀合的第一分子与一个或多个第二分子的序列的核酸。核酸条形码序列通常很短,例如,长度约为5至20个碱基,并且可以与一种或多种目标靶分子或其扩增产物缀合。核酸条形码序列可以是单链或双链的。
在一些实施方案中,所述异源核酸包含唯一分子标识符(UMI)。如本文所用,术语“唯一分子标识符”或“UMI”是指可用于识别和/或区分UMI所缀合的一个或多个第一分子与一个或多个第二分子的核酸序列。UMI通常很短,例如,长度约为5至20个碱基,并且可以与一种或多种目标靶分子或其扩增产物缀合。UMI可以是单链或双链的。在一些实施方案中,核酸条形码序列和UMI都被掺入核酸靶分子或其扩增产物中。通常,UMI用于区分群体或组内的相似类型的分子,而核酸条形码序列用于区分分子的群体或组。在同时使用UMI和核酸条形码序列的一些实施方案中,UMI的序列长度比核酸条形码序列短。在一些实施方案中,在同时使用UMI和核酸条形码序列的情况下,在掺入核酸条形码序列之前将UMI掺入靶核酸或其扩增产物中。在一些实施方案中,在同时使用UMI和核酸条形码序列的情况下,在将UMI掺入靶核酸或其扩增产物中之后,将核酸条形码序列掺入UMI或其扩增产物中。
转座活性
在一些实施方案中,本申请的转座元件在体外或在细胞中表现出转座活性。
转座活性可以通过本领域普通技术人员已知的多种技术来检测。用于测量从载体中切除转座元件、将转座元件整合到细胞的基因组或染色体外DNA中以及转座酶与反向重复序列结合的能力的测定实例可以在例如Ivies et al.Cell,91,501-510(1997),WO 98/40510(Hackett et al.),WO 99/25817(Hackett et al.),and WO00/68399(Mclvor etal.)中找到。
在一些实施方案中,转座测定基于转座元件系统中两种组分的反式互补,其中一种组分含有侧接末端重复的选择标记/报告基因(供体),而另一种组分表达转座酶识别并结合末端重复以执行转座(辅助体)。例如,图3显示了用于筛选活性转座元件的一组示例性二元构建体。上方的构建体是转座酶表达的辅助构建体,从5′到3′包括:巨细胞病毒(CMV)启动子、转座酶(Tn)基因和poly(A)信号。下方的构建体是供体构建体,从5′到3′包含:磷酸甘油酸激酶(PGK)启动子、5′靶位点重复(TSD)序列、5′末端重复(5′TR)序列、编码嘌呤霉素和增强型GFP融合(Puro-eGFP)的序列、3′末端重复(3′TR)序列、3′靶位点重复(TSD)序列和poly(A)信号。在转座测定中,供体质粒与辅助或对照质粒共转染到培养的哺乳动物细胞(例如人293T、HeLa或Hct116细胞)中,由于染色体整合和嘌呤霉素抗性基因的表达而对嘌呤霉素产生抗性的细胞克隆的数量作为基因转移效率的指标,由亚甲蓝染色表示。对于悬浮细胞,如K562和原代T细胞,转座活性可以根据电穿孔后的GFP报告基因阳性细胞评估。图4A-6B显示了基于转座测定的亚甲蓝染色结果的菌落计数,为与对照相比评估的TE的转座效率。此类测定中的转座效率也称为“转移效率”。
在一些实施方案中,所述工程化转座元件的转移效率为至少约0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%或更高中的任一项。在一些实施方案中,所述工程化转座元件的转移效率在人类细胞中测定,如在人293T、HeLa、Hct116、K562或原代T细胞中。
在一些实施方案中,所述工程化转座元件的转座活性高于piggyBac(PB)转座子、Sleeping Beauty(SB)转座子和/或TcBuster(TB)转座子的转座活性。在一些实施方案中,所述工程化转座元件的转座活性比piggyBac(PB)转座子的转座活性高,例如,高约10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、2x、3x、5x、10x或更多中的任一项,如在哺乳动物细胞中通过基于报告基因的转座测定(例如,如实施例2中所述)确定的。在一些实施方案中,所述工程化转座元件的转座活性比Sleeping Beauty(SB)转座子的转座活性高,例如,高约10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、2x、3x、5x、10x或更多中的任一项,如在哺乳动物细胞中通过基于报告基因的转座测定(例如,如实施例2中所述)确定的。在一些实施方案中,所述工程化转座元件的转座活性比TcBuster(TB)转座子的转座活性高,例如,高至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、2x、3x、5x、10x或更多中的任一项,如在哺乳动物细胞中通过基于报告基因的转座测定(例如,如实施例2中所述)确定的。在一些实施方案中,所述工程化转座元件的转座活性高于PB转座子和SB转座子的转座活性。在一些实施方案中,所述工程化转座元件的转座活性高于PB转座子和TB转座子的转座活性。在一些实施方案中,所述工程化转座元件的转座活性高于TB转座子和SB转座子的转座活性。在一些实施方案中,所述工程化转座元件的转座活性高于PB转座子、SB转座子和TB转座子的转座活性。
在一些实施方案中,所述工程化转座元件的转座活性在哺乳动物细胞中进行评估。在一些实施方案中,所述哺乳动物细胞是HeLa细胞。在一些实施方案中,所述哺乳动物细胞是人胚肾293T(293T)。在一些实施方案中,所述哺乳动物细胞是K562细胞。在一些实施方案中,所述哺乳动物细胞是Hct116细胞。在一些实施方案中,所述哺乳动物细胞是人T细胞,例如来自供体的原代T细胞。在一些实施方案中,所述工程化转座元件在293T细胞中具有比在HeLa细胞中更高的转座活性,如在293T细胞中的转座活性比在HeLa细胞中的转座活性,高至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、2x、3x、5x、10x或更多中的任一项。
细胞
本文所述的工程化转座元件在多种细胞中具有转座活性,并且可用于将异源核酸插入任何合适细胞中的靶核酸中。
在一些实施方案中,所述细胞是分离的细胞。在一些实施方案中,所述细胞处于细胞培养物中。在一些实施方案中,所述细胞是离体的。在一些实施方案中,所述细胞获自活生物体,并维持在细胞培养物中。在一些实施方案中,所述细胞是单细胞生物。可以基于细胞来源、来源组织、形态、功能、组织学标记、表达谱等将细胞分类为不同类型。
在一些实施方案中,所述细胞是原核细胞。在一些实施方案中,所述细胞是细菌细胞或来源于细菌细胞。在一些实施方案中,所述细胞是古细菌细胞或来源于古细菌细胞。在一些实施方案中,所述细胞是真核细胞。在一些实施方案中,所述细胞是植物细胞或来源于植物细胞。在一些实施方案中,所述细胞是真菌细胞或来源于真菌细胞。在一些实施方案中,所述细胞是动物细胞或来来源于动物细胞。在一些实施方案中,所述细胞是无脊椎动物细胞或来源于无脊椎动物细胞。在一些实施方案中,所述细胞是脊椎动物细胞或来源于脊椎动物细胞。在一些实施方案中,所述细胞是哺乳动物细胞或来源于哺乳动物细胞。在一些实施方案中,所述细胞是人类细胞。在一些实施方案中,所述细胞是斑马鱼(D.rerio)细胞。在一些实施方案中,所述细胞是啮齿动物细胞。在一些实施方案中,所述细胞是合成制造的,有时称为人造细胞。在一些实施方案中,所述细胞与5′TR、3′TR和/或转座酶来源的动物物种有关。在一些实施方案中,所述细胞与5′TR、3′TR和/或转座酶来源的动物物种无关。
在一些实施方案中,所述细胞是细菌、酵母细胞、真菌细胞、藻类细胞、植物细胞或动物细胞。在一些实施方案中,所述细胞是从天然来源分离的细胞,如组织活检。在一些实施方案中,所述细胞是从体外培养的细胞系中分离的细胞。在一些实施方案中,所述细胞是基因工程细胞。在一些实施方案中,所述细胞是在核中经历增殖、分化或两者的种子细胞。
在一些实施方案中,所述细胞是来自选自牛、绵羊、山羊、马、猪、鹿、鸡、鸭、鹅、兔和鱼的生物体的动物细胞。
在一些实施方案中,所述细胞是来自选自玉米、小麦、大麦、燕麦、水稻、大豆、油棕、红花、芝麻、烟草、亚麻、棉花、向日葵、珍珠粟、谷子、高粱、油菜、大麻、蔬菜作物、饲料作物、经济作物、木本作物和生物质作物的生物体的植物细胞。
在一些实施方案中,所述细胞是哺乳动物细胞,包括来自人类、家养动物和农场动物、动物园、运动场或宠物,如狗(C.familiaris)、马、猫、牛等的细胞。在一些实施方案中,所述细胞是人体细胞。在一些实施方案中,人类细胞是人胚肾293T(HEK293T或293T)细胞或HeLa细胞。
在一些实施方案中,所述细胞来源于原代细胞。例如,原代细胞的培养物可以传代0次、1次、2次、4次、5次、10次、15次或更多次。在一些实施方案中,通过任何已知方法从个体收获原代细胞。例如,可以通过血液成分置换、白细胞分离术、密度梯度分离等来收获白细胞。可以通过活检来收获来自如皮肤、肌肉、骨髓、脾脏、肝、胰腺、肺、肠、胃等组织的细胞。可以使用合适的溶液来分散或悬浮收获的细胞。这种溶液通常可以是平衡盐溶液(例如生理盐水、磷酸盐缓冲盐水(PBS)、汉克平衡盐溶液等),方便地补充有胎牛血清或其他天然存在的因子,连同可接受的低浓度缓冲液。缓冲液可以包括HEPES、磷酸盐缓冲液、乳酸缓冲液等。细胞可以立即使用,也可以储存(例如,通过冷冻)。冷冻细胞可以解冻并且可以重复使用。细胞可以在DMSO、血清、培养基缓冲液(例如,10%DMSO、50%血清、40%缓冲培养基)和/或用于在冷冻温度下保存细胞的一些其他此类常用溶液中冷冻。
在一些实施方案中,所述细胞来源于细胞系。本领域已知多种细胞系。细胞系的实例包括但不限于293T、MF7、K562、HeLa及其转基因品种。细胞系可从本领域技术人员已知的多种来源获得(参见例如美国典型培养物保藏中心(ATCC)(Manassus,Va.))。
在一些实施方案中,所述细胞包含贴壁细胞。在一些实施方案中,所述细胞包含分化的贴壁细胞。在一些实施方案中,所述细胞包含未分化的贴壁细胞。在一些实施方案中,所述细胞包含多能干细胞。在一些实施方案中,所述细胞包含非贴壁细胞。
在一些实施方案中,所述细胞来源于上皮组织、肌肉组织、神经组织或结缔组织,或其任何组合。在一些实施方案中,所述细胞来源于选自以下的组织:肝脏、胃肠道、胰腺、肾脏、肺、气管、血管、骨骼肌、心脏、皮肤、平滑肌、结缔组织、角膜、泌尿生殖系统、乳腺、生殖、内皮、上皮、成纤维细胞、神经、施旺(Schwann)、脂肪、骨、骨髓、软骨、周细胞、间皮、内分泌、基质、淋巴、血液、内胚层、外胚层、中胚层及其组合。在一些实施方案中,所述细胞来源于选自以下的组织:结缔组织(例如,疏松结缔组织、致密结缔组织、弹性组织、网状结缔组织和脂肪组织)、肌肉组织(例如,骨骼肌、平滑肌和心肌)、泌尿生殖组织、胃肠组织、肺组织、骨组织、神经组织和上皮组织(例如,单层上皮和复层上皮)、来源于内胚层的组织、来源于中胚层的组织和来源于外胚层的组织,或其任何组合。在一些实施方案中,所述细胞来源于肿瘤。
在一些实施方案中,所述细胞选自肝细胞、胃肠细胞、胰腺细胞、肾细胞、肺细胞、气管细胞、血管细胞、骨骼肌细胞、心肌细胞、皮肤细胞、平滑肌细胞、结缔组织细胞、角膜细胞、泌尿生殖细胞、乳腺细胞、生殖细胞、内皮细胞、上皮细胞、成纤维细胞、神经细胞、施旺细胞、脂肪细胞、骨细胞、骨髓细胞、软骨细胞、周细胞、间皮细胞、细胞来源于内分泌组织、基质细胞、干细胞、祖细胞、淋巴细胞、血细胞、来源于内胚层的细胞、来源于外胚层的细胞、来源于中胚层的细胞、未分化细胞(如干细胞或祖细胞)、肿瘤细胞、iPS细胞及其组合。
在一些实施方案中,所述细胞是免疫细胞,例如T细胞、B细胞、自然杀伤(NK)细胞、树突细胞(DC)和巨噬细胞。在一些实施方案中,所述细胞是从患者或供体获得的人类T细胞。在一些实施方案中,所述细胞是选自以下的免疫细胞:细胞毒性T细胞、辅助T细胞、自然杀伤(NK)T细胞、iNK-T细胞、NK-T样细胞、αβT细胞、aγδT细胞、肿瘤浸润性T细胞和树突细胞(DC)激活的T细胞。在一些实施方案中,所述细胞是使用本申请的工程化转座元件或基因转移系统修饰的免疫细胞。在一些实施方案中,修饰的免疫细胞是CAR-T细胞。在一些实施方案中,修饰的免疫细胞是TCR-T细胞。
在一些实施方案中,本申请的细胞是哺乳动物细胞。在一些实施方案中,所述哺乳动物细胞是人类HKT293细胞或HeLa细胞。在一些进一步的实施方案中,所述转座元件在293T细胞中的转座活性高于在HeLa细胞中的转座活性。在一些实施方案中,所述哺乳动物细胞选自免疫细胞、肝细胞、肿瘤细胞、干细胞、受精卵、肌肉细胞和皮肤细胞。
在一些实施方案中,所述细胞是干细胞或祖细胞。细胞可以包括干细胞(例如,成体干细胞、胚胎干细胞、iPS细胞)和祖细胞(例如,心脏祖细胞、神经祖细胞等)。细胞可以包括哺乳动物干细胞和祖细胞,包括啮齿动物干细胞、啮齿动物祖细胞、人类干细胞、人类祖细胞等。
在一些实施方案中,所述细胞是患病细胞。患病细胞可能具有改变的代谢、基因表达和/或形态特征。患病细胞可以是癌细胞、糖尿病细胞和凋亡细胞。患病细胞可以是来自患病对象的细胞。
在一些实施方案中,本申请的细胞属于可用于基因治疗的靶细胞类型。示例性靶细胞类型包括造血干细胞、造血祖细胞、骨髓祖细胞、淋巴祖细胞、血小板生成祖细胞、红系祖细胞、粒细胞生成祖细胞、单核细胞祖细胞、巨核细胞、原巨核细胞、巨核细胞、凝血细胞/血小板、原红细胞、嗜碱性成红细胞、多色成红细胞、正染性成红细胞、多色素性红细胞、红细胞(红血细胞或RBC)、嗜碱性前髓细胞,嗜碱性髓细胞、嗜碱性后髓细胞、嗜碱性粒细胞、中性前髓细胞、中性髓细胞、中性后髓细胞、中性粒细胞、嗜酸性前髓细胞、嗜酸性髓细胞、巨噬细胞、树突细胞、淋巴母细胞、幼淋巴细胞、自然杀伤(NK)细胞、小淋巴细胞、T淋巴细胞、B淋巴细胞、浆细胞和淋巴树突细胞。在优选的实施方案中,靶细胞类型是一种或多种红细胞,例如原红细胞、嗜碱性红细胞、多染色红细胞、正染色红细胞、多染色红细胞和红细胞(RBC)。在优选的实施方案中,靶细胞类型是一种或多种红细胞,例如原红细胞、嗜碱性成红细胞、多色成红细胞、正染性成红细胞、多色素性红细胞和红细胞(RBC)。
载体
在一些实施方案中,所述工程化转座元件和/或编码转座酶的核酸序列存在于一种或多种载体中。
在本申请中可以使用各种合适的载体。在一些实施方案中,载体是质粒载体、粘粒载体、人工染色体(例如细菌人工染色体、酵母人工染色体或哺乳动物人工染色体)、病毒载体如噬菌体、杆状病毒、逆转录病毒、慢病毒、腺病毒、牛痘病毒、塞姆利基森林病毒或腺相关病毒(AAV)载体,所有这些都是公知的,可以从商业来源购买。通常,合适的载体包含在至少一种生物体中具有功能的复制起点、启动子序列、方便的限制性内切核酸酶位点和一种或多种选择标记。
在一些实施方案中,所述载体是质粒。在一些实施方案中,可以将质粒转化到细菌中以储存或扩增,并且可以转染到哺乳动物细胞中。
将载体引入哺乳动物细胞的方法是本领域已知的。可以通过物理、化学和/或生物学方法将载体转移到宿主细胞中。可以预期,对于本申请,可以单独或组合使用各种载体类型和载体递送方法。
用于将载体引入宿主细胞的物理方法包括磷酸钙沉淀、脂质转染、颗粒轰击、显微注射、电穿孔等。用于产生包含载体和/或外源核酸的细胞的方法是本领域公知的。例如,参见Sambrook et al.(2001)Molecular Cloning:A Laboratory Manual,Cold SpringHarbor Laboratory,New York。在一些实施方案中,通过电穿孔将载体引入细胞中。
用于将异源核酸引入宿主细胞的生物学方法包括使用DNA和RNA载体。病毒载体已成为将基因插入哺乳动物(例如人类细胞)中最广泛使用的方法。
用于将载体引入宿主细胞的化学方法包括胶体分散系统,如大分子复合物、纳米胶囊、微球、珠子和基于脂质的系统,包括水包油乳液、胶束、混合胶束和脂质体。用作体外递送载体的示例性胶体系统是脂质体(例如,人造膜囊泡)。
在一些实施方案中,所述载体是病毒载体。病毒载体的实例包括但不限于腺病毒载体、腺相关病毒(AAV)载体、慢病毒载体、逆转录病毒载体、牛痘载体、单纯疱疹病毒载体及其衍生物。病毒载体技术在本领域中是公知的并且描述于例如Sambrook et al.(2001,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory,NewYork),以及其他病毒学和分子生物学手册。在一些实施方案中,使用病毒载体递送转座元件可用于基因治疗,其中将病毒载体的高效率基因递送与转座元件实现的基因表达的稳定性相结合。例如,可以参考Yant,Stephen R.,et al.“Transposition from a gutlessadeno-transposon vector stabilizes transgene expression in vivo.”Naturebiotechnology 20.10(2002):999-1005。
III.基因转移系统
申请的另一方面提供了一种基因转移系统,其包含:1)工程化转座元件(例如本文描述的任何一种转座元件);和2)转座酶,或编码转座酶的核酸。
在一些实施方案中,提供了一种基因转移系统,其包含:1)工程化转座元件,其从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,其中3′TR包含选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段;和2)转座酶。在一些实施方案中,所述转座元件表现出允许异源核酸插入细胞(例如哺乳动物细胞或植物细胞)的DNA中的转座活性。在一些实施方案中,所述工程化转座元件来源于表2的任何一种TE。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。
在一些实施方案中,提供了一种基因转移系统,其包含:1)工程化转座元件,其从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,其中3′TR包含选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段;和2)编码转座酶的核酸(例如DNA或RNA)。在一些实施方案中,所述转座元件表现出允许异源核酸插入细胞(例如哺乳动物细胞或植物细胞)的DNA中的转座活性。在一些实施方案中,所述工程化转座元件来源于表2的任何一种TE。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。
在一些实施方案中,提供了一种基因转移系统,其包含:1)工程化转座元件,其从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR);和2)转座酶,其包含选自SEQ ID NO:53-78和103-114的氨基酸序列或其变体。在一些实施方案中,所述转座元件表现出允许异源核酸插入细胞(例如哺乳动物细胞或植物细胞)的DNA中的转座活性。在一些实施方案中,所述工程化转座元件来源于表2的任何一种TE。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。
在一些实施方案中,提供了一种基因转移系统,其包含:1)工程化转座元件,其从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR);和2)编码转座酶的核酸(例如DNA或RNA),所述转座酶包含选自SEQ ID NO:53-78和103-114的氨基酸序列或其变体。在一些实施方案中,所述转座元件表现出允许异源核酸插入细胞(例如哺乳动物细胞或植物细胞)的DNA中的转座活性。在一些实施方案中,所述工程化转座元件来源于表2的任何一种TE。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。
在一些实施方案中,提供了一种基因转移系统,其包含:1)工程化转座元件;和2)转座酶,其中所述转座元件从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,其中3′TR包含选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段;其中所述转座酶包含选自SEQ ID NO:53-78和103-114的氨基酸序列或其变体。在一些实施方案中,所述转座元件表现出允许异源核酸插入细胞(例如哺乳动物细胞或植物细胞)的DNA中的转座活性。在一些实施方案中,所述工程化转座元件来源于表2的任何一种TE。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。
在一些实施方案中,提供了一种基因转移系统,其包含:1)工程化转座元件;和2)编码转座酶的核酸(例如DNA或RNA),其中所述转座元件从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,其中3′TR包含选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段;其中所述转座酶包含选自SEQ ID NO:53-78和103-114的氨基酸序列或其变体。在一些实施方案中,所述转座元件表现出允许异源核酸插入细胞(例如哺乳动物细胞或植物细胞)的DNA中的转座活性。在一些实施方案中,所述工程化转座元件来源于表2的任何一种TE。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。
在一些实施方案中,提供了一种基因转移系统,其包含:1)工程化转座元件,其从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含SEQ ID NO:3的核酸序列、其变体或其片段,其中3′TR包含SEQ ID NO:29的核酸序列、其变体或其片段;和2)包含SEQ ID NO:55的氨基酸序列的转座酶,或编码转座酶的核酸。
在一些实施方案中,提供了一种基因转移系统,其包含:1)工程化转座元件,其从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含SEQ ID NO:8的核酸序列、其变体或其片段,其中3′TR包含SEQ ID NO:34的核酸序列、其变体或其片段;和2)包含SEQ ID NO:60的氨基酸序列的转座酶,或编码转座酶的核酸。
在一些实施方案中,提供了一种基因转移系统,其包含:1)工程化转座元件,其从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含SEQ ID NO:11的核酸序列、其变体或其片段,其中3′TR包含SEQ ID NO:37的核酸序列、其变体或其片段;和2)包含SEQ ID NO:63的氨基酸序列的转座酶,或编码转座酶的核酸。
在一些实施方案中,提供了一种基因转移系统,其包含:1)工程化转座元件,其从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含SEQ ID NO:12的核酸序列、其变体或其片段,其中3′TR包含SEQ ID NO:38的核酸序列、其变体或其片段;和2)包含SEQ ID NO:64的氨基酸序列的转座酶,或编码转座酶的核酸。
在一些实施方案中,提供了一种基因转移系统,其包含:1)工程化转座元件,其从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含SEQ ID NO:13的核酸序列、其变体或其片段,其中3′TR包含SEQ ID NO:39的核酸序列、其变体或其片段;和2)包含SEQ ID NO:65的氨基酸序列的转座酶,或编码转座酶的核酸。
在一些实施方案中,提供了一种基因转移系统,其包含:1)工程化转座元件,其从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含SEQ ID NO:16的核酸序列、其变体或其片段,其中3′TR包含SEQ ID NO:42的核酸序列、其变体或其片段;和2)包含SEQ ID NO:68的氨基酸序列的转座酶,或编码转座酶的核酸。
在一些实施方案中,提供了一种基因转移系统,其包含:1)工程化转座元件,其从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含SEQ ID NO:22的核酸序列、其变体或其片段,其中3′TR包含SEQ ID NO:48的核酸序列、其变体或其片段;和2)包含SEQ ID NO:74的氨基酸序列的转座酶,或编码转座酶的核酸。
在一些实施方案中,提供了一种基因转移系统,其包含:1)工程化转座元件,其从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含SEQ ID NO:23的核酸序列、其变体或其片段,其中3′TR包含SEQ ID NO:49的核酸序列、其变体或其片段;和2)包含SEQ ID NO:75的氨基酸序列的转座酶,或编码转座酶的核酸。
在一些实施方案中,提供了一种基因转移系统,其包含:1)工程化转座元件,其从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含SEQ ID NO:79的核酸序列、其变体或其片段,其中3′TR包含SEQ ID NO:91的核酸序列、其变体或其片段;和2)包含SEQ ID NO:103的氨基酸序列的转座酶,或编码转座酶的核酸。
在一些实施方案中,提供了一种基因转移系统,其包含:1)工程化转座元件,其从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含SEQ ID NO:82的核酸序列、其变体或其片段,其中3′TR包含SEQ ID NO:94的核酸序列、其变体或其片段;和2)包含SEQ ID NO:106的氨基酸序列的转座酶,或编码转座酶的核酸。
本文所述的基因转移系统包含转座酶。转座酶可以作为多肽存在。或者,转座酶以包含编码转座酶的编码序列的多核苷酸形式存在。多核苷酸可以是RNA,例如编码转座酶的mRNA,或DNA,例如编码转座酶的编码序列。当转座酶作为编码转座酶的编码序列存在时,在一些实施方案中,所述编码序列可以存在于包括转座元件的相同载体中,即顺式。在一些实施方案中,所述基因转移系统包括包含工程化转座元件的第一载体和包含转座酶编码序列的第二载体,即反式。
在一些实施方案中,所述基因转移系统包含:1)载体,其包含工程化转座元件(如本文所述的工程化转座元件中的任何一种);和2)转座酶。
在一些实施方案中,所述基因转移系统包含:1)工程化转座元件(如本文所述的工程化转座元件中的任何一种);和2)编码转座酶的核酸,其中所述核酸是DNA。在一些实施方案中所述工程化转座元件和核酸存在于单一载体中。在一些实施方案中,所述工程化转座元件和核酸存在于单独的载体中。
在一些实施方案中,所述基因转移系统包含:1)工程化转座元件(如本文所述的工程化转座元件中的任何一种);和2)编码转座酶的核酸,其中所述核酸是RNA。在一些实施方案中所述工程化转座元件和核酸存在于单一载体中。在一些实施方案中,所述工程化转座元件和核酸存在于单独的载体中。
在本文所述的基因转移系统中,对于工程化转座元件和转座酶或编码转座酶的核酸,存在许多潜在的和合适的细胞内递送方法组合。转座酶可以作为DNA、RNA或蛋白质递送。工程化转座元件和转座酶可以一起或分开递送。例如,转座子和转座酶基因可以一起包含在同一个重组病毒基因组中;单个感染递送系统的两个部分,使得转座酶的表达指导转座子从重组病毒基因组中切割下来,以便随后整合到细胞染色体中。在另一个实例中,转座酶和转座元件可以通过病毒和/或非病毒系统如含脂质试剂的组合分别递送。在这些情况下,所述转座元件和/或转座酶基因可以通过重组病毒递送。在一些实施方案中,转座酶指导转座元件从其供体DNA中释放以整合到靶位置中。
转座酶可以作为蛋白质或作为编码转座酶蛋白质的核酸提供给细胞。编码转座酶蛋白的核酸可以采取DNA或RNA的形式。可以将蛋白质单独引入细胞中,或引入载体中,如质粒或病毒载体。此外,编码转座酶蛋白的核酸可以稳定或瞬时掺入细胞的基因组中,以促进转座酶蛋白在细胞中的暂时或延长表达。此外,启动子或其他表达控制区可以与编码转座酶蛋白的核酸可操作地连接,以定量或以组织特异性方式调节该蛋白的表达。在一些实施方案中,转座酶蛋白含有DNA结合结构域、催化结构域(具有转座酶活性)和/或核定位信号(NLS)。
因此,多种方法和材料可用于将本申请的基因转移系统递送至细胞。
例如,一种方法是使用质粒载体来递送基因转移系统。例如,该系统可以由两种质粒组成,一种携带转座酶表达盒的辅助体质粒和一种携带转座元件的供体质粒。转染后,两种质粒都朝向细胞核,允许从辅助体质粒产生转座酶编码RNA,随后从供体质粒中切除转座元件,这由导至细胞核的转座酶亚基促进。这种方法可以通过将转座酶基因和转座元件放在单个质粒上来进一步完善,该质粒最初称为辅助体独立的转座元件-转座酶载体。或者,转染的体外转录的mRNA可以作为转座酶的丰富来源,消除了产生具有延长转座酶表达的细胞的风险。
因此,在一些实施方案中,所述转座元件存在于第一载体(供体载体)中,编码转座酶的核酸存在于第二载体(辅助载体)中。在一些实施方案中,第一载体和第二载体用于共转染细胞以进行转座。
另一种方法是使用病毒载体来递送基因转移系统。尽管病毒载体可能具有免疫原性或致癌性问题,但在某些应用中可能需要高递送效率。基因转移系统的组分可以由病毒衣壳携带和传递,从而提供其他附加型载体——如腺病毒或单纯疱疹病毒载体一一整合基因和建立长期转基因表达的能力。病毒外壳可提供载体稳定性、组织特异性转座元件递送和跨细胞膜转运,而转座元件根据转座元件的特征整合谱促进病毒载体整合。基于病毒载体的递送的方法和技术是本领域已知的。例如,Sleeping Beauty转座子系统的基于病毒载体的转移首先在带有腺病毒载体的小鼠肝脏中得到证实,最近的研究证明了这种方法在大型动物中的适用性。腺相关病毒载体也适用于作为Sleeping Beauty系统的载体。例如,参见Yant,Stephen R.,et al.“Transposition from a gutless adeno-transposon vectorstabilizes transgene expression in vivo.”Nature biotechnology 20.10(2002):999-1005,Hausl,Martin A.,et al.“Hyperactive sleeping beauty transposaseenables persistent phenotypic correction in mice and a canine model forhemophilia B.”Molecular Therapy 18.11(2010):1896-1906,以及Zhang,Wenli,et al.“Hybrid adeno-associated viral vectors utilizing transposase-mediated somaticintegration for stable transgene expression in human cells.”PIoS one 8.10(2013)。
如上所述,本申请的基因转移系统可以通过物理、化学、生物学方法或其组合递送到宿主细胞中。各种递送载体和方法设想为可以单独或组合用于本申请,以实现某些应用的期望结果。因此,本领域技术人员能够最好地利用具有各种修改的各种递送方法和技术,以适合设想的特定用途,例如基因治疗。为了使基因治疗切实可行,人们应该在患病组织的基因组中实现治疗性转基因的稳定整合,以提供长期且具有成本效益的治疗。例如,为了实现高效且低免疫原性的基因转移到患者体内,可以结合使用合成化合物和质粒将DNA递送到细胞中。脂质体和其他纳米粒子可以足以完成这项任务。例如,可以将两种质粒递送给患者:一种提供转座酶的表达(辅助体质粒),另一种提供含有治疗性转基因的转座元件(供体质粒)。这些DNA可以与脂质体复合并通过肠胃外注射施用。进入细胞后,转座酶可以与供体质粒中的转座元件结合,将其切除,然后将其整合到基因组中。这种插入将是稳定和永久的。辅助和供体质粒最终可能会因细胞和宿主防御机制而丢失,但任何包含治疗性转基因的基因组整合转座元件都将是稳定和永久的修饰。这些质粒的短暂性也减少了过度转座,从而最大限度地降低了致癌风险。
更多细节和示例性转座元件递送方法和技术可以见于例如Skipper,KristianAlsbjerg,et al.“DNA transposon-based gene vehicles-scenes from anevolutionary drive.”Journal of biomedical science 20.1(2013):92。
IV.方法
本申请进一步提供将异源核酸插入靶核酸的方法,其包括:使靶核酸与工程化转座元件或基因转移系统接触,所述工程化转座元件包含根据本文所述的工程化转座元件中任一项的异源核酸,所述基因转移系统包含根据本文所述的任何一种基因转移系统的异源核酸。该方法将在体外或在细胞中进行。
体外方法
在一些实施方案中,提供了一种在体外将异源核酸插入靶核酸的方法,其包括使靶核酸与工程化转座元件接触,所述工程化转座元件包含:1)工程化转座元件;和2)转座酶,其中所述转座元件从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,其中3′TR包含选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段;其中所述转座酶包含选自SEQ ID NO:53-78和103-114的氨基酸序列或其变体。在一些实施方案中,所述靶核酸是环状DNA。在一些实施方案中,所述靶核酸是线性DNA。在一些实施方案中,所述工程化转座元件来源于表2的任何一种TE。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。
本文所述的方法可用于体外转座,包括在无细胞系统中。例如,参见Goryshin,Igor Yu,and William S.Reznikoff.“Tn5 in vitro transposition.”Journal ofBiological Chemistry 273.13(1998):7367-7374。表现出体外转座活性的转座元件可用于二代测序(NGS)文库构建,包括例如加标签方法。
在一些实施方案中,提供了一种从靶核酸制备多个条形码化核酸的方法,其包括使靶核酸与工程化转座元件接触,所述工程化转座元件包括:1)工程化转座元件;和2)转座酶,其中所述转座元件从5′到3′包含:5′末端重复序列(5′TR)、包含条形码序列的异源核酸和3′末端重复序列(3′TR),其中5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,其中3′TR包含选自选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段;其中所述转座酶包含选自SEQ ID NO:53-78和103-114的氨基酸序列或其变体,从而提供多个条形码化核酸。在一些实施方案中,所述靶核酸是基因组DNA。在一些实施方案中,所述靶核酸是cDNA。在一些实施方案中,所述靶核酸是扩增的DNA。在一些实施方案中,所述异源核酸进一步包含引物序列。在一些实施方案中,该方法进一步包括扩增多个条形码化核酸以提供核酸测序文库。在一些实施方案中,该方法还包括对核酸测序文库进行测序。在一些实施方案中,该方法包括使靶核酸与多个工程化转座元件接触,其中每个工程化转座元件包含独特的条形码序列。在一些实施方案中,使用本文所述的体外方法制备的核酸测序文库保留了靶核酸序列中的邻接信息。在一些实施方案中,所述工程化转座元件来源于表2的任何一种TE。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。
在一些实施方案中,使用本文所述的任何一种转座酶和/或TR序列提供加标签方法。使用Tn5转座子的加标签方法在本领域中是已知的,例如在US9080211B2中,其通过引用整体并入本文。本文所述的加标签方法使用转座体复合物组合物。
在一些实施方案中,提供了转座体复合物组合物,其包含:包含选自SEQ ID NO:53-78和103-114的氨基酸序列或其变体的转座酶,和包含一个或两个TR序列和标签序列的异源核酸。在一些实施方案中,转座体复合物包含形成发夹的单个异源核酸。在一些实施方案中,发夹包含可切割位点。
在一些实施方案中,转座体复合物包含与两种异源核酸结合的两种转座酶。在一些实施方案中,提供了一种转座体复合物组合物,其包含:与包含5′TR序列和第一标签序列的第一异源核酸结合的第一转座酶,以及与包含3′TR序列和第二标签序列的第二异源核酸结合的第二转座酶。在一些实施方案中,所述5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,并且其中3′TR包含选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段。在一些实施方案中,第一标签序列不同于第二标签序列。在一些实施方案中,所述工程化转座元件来源于表2的任何一种TE。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。
在一些实施方案中,提供了用于制备具有用于靶核酸的第一和第二标签序列的核酸(例如,DNA)片段文库的方法,其包括使靶核酸与多个转座体复合物接触,所述转座体复合物包含:(1)包含第一转座酶和包含TR序列和第一标签序列的第一异源核酸的第一转座体复合物;和(2)包含第二转座酶和包含TR序列和第二标签序列的第二异源核酸的第二转座体复合物,其中第一标签序列不同于第二标签序列,并且其中所述转座酶包含选自SEQID NO:53-78和103-114的氨基酸序列或其变体;其中第一异源核酸和第二异源核酸被插入到靶核酸中,并且靶核酸被片段化成多个核酸片段,所述核酸片段包含连接到核酸片段的每个5′末端的第一或第二核酸中的一个;从而提供核酸片段的文库。在一些实施方案中,(1)的转座体复合物包含两个第一异源核酸,并且(2)的转座体复合物包含两个第二异源核酸。在一些实施方案中,所述5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,并且其中3′TR包含选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段。在一些实施方案中,该方法还包括扩增核酸片段。在一些实施方案中,该方法进一步包括对核酸片段或其扩增子进行测序。在一些实施方案中,所述工程化转座元件来源于表2的任何一种TE。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。
在一些实施方案中,所述工程化转座元件或转座体复合物以随机方式插入靶核酸,即不偏向特定序列基序。在一些实施方案中,所述工程化转座元件或转座体复合物比PB、SB或TB转座子更随机地插入到靶核酸中。
在一些实施方案中,所述工程化转座元件或转座体复合物优先插入靶核酸的空间自由区,如开放染色质区、不与核小体或其他DNA结合蛋白结合的区域。因此,本文所述的体外方法可用于制备用于测定的核酸测序文库以研究表观基因组学(例如,染色质重塑或DNA甲基化),包括但不限于染色质转座酶可及性测序(ATAC-seq)、靶标和标签下的切割(CUT&TAG)、转座酶可及染色质和DNA甲基化分析(ATAC-Me)和转座酶介导的染色质环化分析(Trac-looping)。使用Tn5转座子的ATAC-seq、CUT&TAG、ATAC-Me和Trac-looping测定已描述于例如Buenrostro,Jason D.,et al.“Transposition of native chromatin for fastand sensitive epigenomic profiling of open chromatin,DNA-binding proteins andnucleosome position.”Nature methods(2013)10(2):1213;Kaya-Okur HS,et al.,“CUT&Tag for efficient epigenomic profiling of small samples and single cells.”Nature Communications(2019),10(1):1-10;Barnett KR et al.“ATAC-Me CapturesProlonged DNA Methylation of Dynamic Chromatin Accessibility Loci during CellFate Transitions.”Molecular Cell,2020;and Lai B.et al.“Trac-looping measuresgenome structure and chromatin accessibility,”Nature methods,2018,15(9):741,其全文通过引用并入本文。在一些实施方案中,测序文库制备物用于染色质转座酶可及性测序(ATAC-seq)。
在一些实施方案中,所述工程化转座元件或转座体复合物可用于加标签于在空间上接近的靶核酸(例如,基因组DNA)的区域。在空间上彼此接近的两个区域可能在末端包含相同的标签序列对。因此,本文所述的体外方法可用于制备荧光标记的探针,该探针可用于与基因组DNA中的染色质相互作用边界进行原位杂交,例如在基于转座酶的荧光原位杂交(FISH)中。基于Tn5的FISH方法已描述于例如,Zhang X.et al.“Imaging chromatininteractions at sub-kilobase resolution via Tn5-FISH,”bioRxiv,2019:601690,其全文通过引用并入本文。
细胞中的方法
在一些实施方案中,提供了一种将异源核酸插入细胞中的靶核酸的方法,其包括使靶核酸与工程化转座元件接触,所述工程化转座元件包含:1)工程化转座元件;和2)转座酶,其中所述转座元件从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,其中3′TR包含选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段;其中所述转座酶包含选自SEQ ID NO:53-78和103-114的氨基酸序列或其变体。在一些实施方案中,所述靶核酸是基因组DNA。在一些实施方案中,所述靶核酸是染色体外DNA。在一些实施方案中,所述工程化转座元件来源于表2的任何一种TE。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。
在一些实施方案中,提供了一种将异源核酸插入哺乳动物细胞中的靶核酸的方法,其包括使靶核酸与工程化转座元件接触,所述工程化转座元件包含:1)工程化转座元件;和2)转座酶,其中所述转座元件从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,其中3′TR包含选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段;其中所述转座酶包含选自SEQ ID NO:53-78和103-114的氨基酸序列或其变体。在一些实施方案中,所述哺乳动物细胞是人类细胞。在一些实施方案中,所述哺乳动物细胞是动物细胞,例如啮齿动物细胞。在一些实施方案中,所述哺乳动物细胞是免疫细胞,例如T细胞。在一些实施方案中,该方法是离体进行的。在一些实施方案中,所述工程化转座元件来源于表2的任何一种TE。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。
在一些实施方案中,提供了一种将异源核酸插入植物细胞中的靶核酸中的方法,其包括使靶核酸与工程化转座元件接触,所述工程化转座元件包含:1)工程化转座元件;和2)转座酶,其中所述转座元件从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,其中3′TR包含选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段;其中所述转座酶包含选自SEQ ID NO:53-78和103-114的氨基酸序列或其变体。在一些实施方案中,植物细胞是农作物的细胞。在一些实施方案中,所述工程化转座元件来源于表2的任何一种TE。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。
可以使用本领域已知的多种技术中的任何一种将本文所述的转座元件或基因转移系统引入一个或多个细胞中,如但不限于显微注射、将核酸片段与脂质囊泡(如阳离子脂质囊泡)结合、颗粒轰击、电穿孔、DNA凝聚试剂(例如磷酸钙、聚赖氨酸或聚乙烯亚胺)或将核酸片段掺入病毒载体中并使病毒载体与细胞接触。在使用病毒载体的情况下,病毒载体可以包括本领域已知的多种病毒载体中的任何一种,包括选自逆转录病毒载体、腺病毒载体或腺相关病毒(AAV)载体的病毒载体。
设想异源核酸可以包含多个操纵子,或者异源核酸可以编码多于一种的生物产物。在一些实施方案中,所述异源核酸编码基因电路。示例性基因电路是经历转录和/或翻译以分别产生mRNA或蛋白质的部件的集合(每个部件的“输出”)。部件输出可以与其他部分相互作用(例如调节转录或翻译),或可以与细胞中的其他分子(例如细胞环境中存在的小分子、DNA、RNA或蛋白质)相互作用。例如,电路可以是代谢途径或基因级联,其可以是天然存在的或非天然存在的、人工工程化的。电路中的每个部件可以包括一组组分或基因模块,例如启动子、核糖体结合位点(RBS)、编码序列(CDS)和/或终止子。这些组分可以以不同的方式互连或组装以实现不同的部件,并且最终的部件可以以不同的方式组合以创建不同的电路或通路。除了这些部件之外,电路还可以包含存在于细胞中或与组分相互作用的细胞环境中的其他分子种类。
因此,在一些实施方案中,提供了将异源核酸插入细胞中的靶核酸的方法,其包括:使细胞与工程化转座元件接触,所述工程化转座元件包含:1)工程化转座元件;和2)转座酶,其中所述转座元件从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,其中3′TR包含选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段;其中所述转座酶包含选自SEQ ID NO:53-78和103-114的氨基酸序列或其变体,其中异源核酸编码基因电路。在一些实施方案中,所述靶核酸是基因组DNA。在一些实施方案中,所述靶核酸是染色体外DNA。在一些实施方案中,所述工程化转座元件来源于表2的任何一种TE。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。
基因电路可用于基因治疗。设计和使用基因电路的方法和技术是本领域已知的。可以进一步参考例如Brophy,Jennifer AN,and Christopher A.Voigt.″Principles ofgenetic circuit design.″Nature methods 11.5(2014):508。
该方法适用于任何合适的细胞类型。在一些实施方案中,所述细胞是细菌、酵母细胞、真菌细胞、藻类细胞、植物细胞或动物细胞。在一些实施方案中,所述细胞是从天然来源分离的细胞,如组织活检。在一些实施方案中,所述细胞是从体外培养的细胞系中分离的细胞。在一些实施方案中,所述细胞是基因工程化细胞。在一些实施方案中,所述细胞是在核中经历增殖、分化或两者的种子细胞。
在一些实施方案中,所述细胞是来自选自牛、绵羊、山羊、马、猪、鹿、鸡、鸭、鹅、兔和鱼的生物的动物细胞。
在一些实施方案中,所述细胞是来自选自玉米、小麦、大麦、燕麦、水稻、大豆、油棕、红花、芝麻、烟草、亚麻、棉花、向日葵、珍珠粟、谷子、高粱、油菜、大麻、蔬菜作物、饲料作物、经济作物、木本作物和生物质作物的生物体的植物细胞。
在一些实施方案中,所述细胞是哺乳动物细胞。在一些实施方案中,所述细胞是人类细胞。在一些实施方案中,人类细胞是人胚肾293T(HEK293T或293T)细胞或HeLa细胞。在一些实施方案中,所述哺乳动物细胞选自免疫细胞、肝细胞、肿瘤细胞、干细胞、受精卵、肌肉细胞和皮肤细胞。
在一些实施方案中,所述细胞是选自下组的免疫细胞:细胞毒性T细胞、辅助T细胞、自然杀伤(NK)T细胞、iNK-T细胞、NK-T样细胞,aγδT细胞,肿瘤浸润性T细胞和树突细胞(DC)激活的T细胞。在一些实施方案中,该方法产生修饰的免疫细胞,例如CAR-T细胞或TCR-T细胞。
在一些实施方案中,所述异源核酸被插入到细胞的基因组中。在一些进一步的实施方案中,所述异源核酸的插入使细胞的基因失活。在一些实施方案中,所述异源核酸编码蛋白质或RNAi分子。
此外,所述异源核酸可以编码在基因组编辑中有用的RNA分子。此类RNA分子的实例包括但不限于CRISPR RNA(crRNA)、反式激活crRNA(tracrRNA)、指导RNA(gRNA)和单指导RNA(sgRNA)。
在一些实施方案中,所述异源核酸编码选自以下的生物产物:报告蛋白、抗原特异性受体、治疗蛋白、抗生素抗性蛋白、RNAi分子、细胞因子、激酶、抗原、抗原特异性受体、细胞因子受体和自杀多肽。例如,所述异源核酸可以编码对肿瘤相关抗原特异的受体。通过该方法工程化的T细胞能够识别并特异性杀死表达肿瘤相关抗原的肿瘤细胞。在另一个实例中,所述异源核酸编码潮霉素抗性蛋白,从而可以建立潮霉素抗性细胞系。或者,所述异源核酸可能不具有任何生物学功能,并且可用于通过将其自身插入必需基因中来中断另一个基因的功能,从而中断其功能。
在一些具体实施方案中,所述异源核酸编码可用于基因治疗的治疗性蛋白质。在一些实施方案中,所述异源核酸编码治疗性抗体。在一些实施方案中,所述异源核酸编码工程化受体,如嵌合抗原受体(CAR)或工程化TCR。
在一些实施方案中,所述异源核酸包含一个或多个多克隆位点(MCS)以促进目标多核苷酸(“货物基因”)的插入。
在一些实施方案中,该方法是离体进行的。在一些实施方案中,转导或转染的细胞(例如哺乳动物细胞)在将异源核酸引入细胞后离体增殖。在一些实施方案中,培养转导或转染的细胞至少约1天、2天、3天、4天、5天、6天、7天、10天、12天或14天中的任一项以增殖。在一些实施方案中,培养转导或转染的细胞不超过约1天、2天、3天、4天、5天、6天、7天、10天、12天或14天中的任一项。在一些实施方案中,进一步评估或筛选转导或转染的细胞以选择工程化细胞。
报告基因或选择标记可用于鉴定潜在转染的细胞和用于评估调节序列的功能。一般而言,报告基因是不存在于受体生物体或组织中或不由受体生物体或组织表达的基因,并且其编码的多肽的表达通过一些容易检测的特性,如酶活性来证明。在将DNA引入受体细胞后的合适时间测定报告基因的表达。合适的报告基因可以包括编码荧光素酶、β-半乳糖苷酶、氯霉素乙酰转移酶、分泌型碱性磷酸酶或绿色荧光蛋白基因的基因(例如,Ui-Tei etal.FEBS Letters 479:79-82(2000))。合适的表达系统是公知的并且可以使用已知技术制备或商业获得。
确认细胞中异源核酸存在的其他方法包括,例如,本领域技术人员熟知的分子生物学测定,如Southern和Northern印迹法、RT-PCR和PCR;生化测定,如检测特定肽的存在与否,例如通过免疫学方法(如ELISA和蛋白质印迹法)。
本申请设想了产生哺乳动物细胞的等基因系以研究遗传变异的方法。本申请还考虑了微生物、细胞、植物、动物或合成生物体的基因组修饰以产生生物医学、农业和工业上有用的产品。这些方法可以用作生物学研究工具,用于了解基因组,例如基因敲除或敲入研究。
还提供了使用本文描述的任何一种方法通过异源核酸修饰的细胞,以及包含或由此类细胞产生的生物体(例如动物、植物或真菌)。
靶核酸
本文所述的方法适用于将异源核酸插入多种靶核酸中。在一些实施方案中,所述靶核酸是DNA。在一些实施方案中,所述靶核酸是单链的。在一些实施方案中,所述靶核酸是双链的。在一些实施方案中,所述靶核酸包含单链区和双链区。在一些实施方案中,所述靶核酸是线性的。在一些实施方案中,所述靶核酸是环状的。在一些实施方案中,所述靶核酸包含一种或多种修饰的核苷酸,例如甲基化核苷酸、受损核苷酸或核苷酸类似物。在一些实施方案中,所述靶核酸未被修饰。在一些实施方案中,所述靶核酸结合一种或多种蛋白质,如核小体。
靶核酸可以是任何长度,如约100bp、200bp、500bp、1000bp、2000bp、5000bp、10kb、20kb、50kb、100kb、200kb、500kb、1Mb或更长中的至少任何一种。在一些实施方案中,所述靶核酸不超过约500kb、200kb、100kb、50kb、40kb、30kb、20kb、10kb、5kb、2kb、1kb、500bp、200bp或更少中的任何一种。在一些实施方案中,所述靶核酸是约100bp-500bp、500bp-1kb、100bp-1kb、1kb-2kb、100bp-5kb、100bp-10kb、100bp-20kb、1kb-5kb、1kb-10kb、1kb-20kb、20kb-100kb或100kb-1Mb中的任何一种。靶核酸还可以包含任何序列。在一些实施方案中,所述靶核酸富集特定序列,其是本文所述的工程化转座元件或基因递送系统转座的热点。在一些实施方案中,所述靶核酸富集AT,如具有至少约40%、45%、50%、55%、60%、65%或更高的AT含量中的任何一种。在一些实施方案中,所述靶核酸不富集AT。在一些实施方案中,所述靶核酸没有富集特定热点序列,因为本文描述的工程化转座元件或基因递送系统不偏好将异源核酸插入特定序列或序列基序中。在一些实施方案中,所述靶核酸具有一种或多种二级结构或更高级结构。在一些实施方案中,所述靶核酸不处于凝聚状态,如在染色质中。
在一些实施方案中,所述靶核酸存在于细胞中。在一些实施方案中,所述靶核酸存在于细胞核中。在一些实施方案中,所述靶核酸对于细胞是内源的。在一些实施方案中,所述靶核酸是基因组DNA。在一些实施方案中,所述靶核酸是染色体DNA。在一些实施方案中,所述靶核酸是蛋白质编码基因或其功能区,如编码区,或调控元件,如启动子、增强子、5′或3′非翻译区等。在一些实施方案中,所述靶核酸是非编码基因,如转座子、miRNA、tRNA、核糖体RNA、核酶或lincRNA。在一些实施方案中,所述靶核酸是质粒。
在一些实施方案中,所述靶核酸对于细胞是外源的。在一些实施方案中,所述靶核酸是病毒核酸,如病毒DNA。在一些实施方案中,所述靶核酸是水平转移的质粒。在一些实施方案中,所述靶核酸整合在细胞的基因组中。在一些实施方案中,所述靶核酸没有整合到细胞的基因组中。在一些实施方案中,所述靶核酸是细胞中的质粒。在一些实施方案中,所述靶核酸存在于染色体外阵列中。
在一些实施方案中,所述靶核酸是分离的核酸,如分离的DNA。在一些实施方案中,所述靶核酸存在于无细胞环境中。在一些实施方案中,所述靶核酸是分离的载体,例如质粒。在一些实施方案中,所述靶核酸是分离的线性DNA片段。
V.试剂盒和制品
本申请还提供了包含本文所述的任何一种转座元件或基因转移系统的试剂盒和制品。在一些实施方案中,试剂盒包含用于将异源核酸插入靶核酸中的说明(例如,使用本文所述的任何一种方法)。在一些实施方案中,试剂盒用于在体外将异源核酸插入靶核酸中。在一些实施方案中,试剂盒用于将异源核酸插入细胞如哺乳动物细胞或植物细胞中的靶核酸。本文所述的试剂盒和制品可用于在体外或离体、遗传研究和基因治疗中修饰靶核酸。
在一些实施方案中,提供了包含工程化转座元件的试剂盒,所述工程化转座元件从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,其中3′TR包含选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段,并且其中所述转座元件表现出允许异源核酸插入细胞(例如哺乳动物细胞或植物细胞)的DNA中的转座活性。在一些实施方案中,所述异源核酸包含一个或多个多克隆位点(MCS)以促进目的多核苷酸(“货物基因”)的插入。在一些实施方案中,所述工程化转座元件来源于表2的任何一种TE。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。
在一些实施方案中,提供了包含基因转移系统的试剂盒,所述基因转移系统包含:1)工程化转座元件;和2)转座酶或编码转座酶的核酸,其中所述转座元件从5′到3′包含:5′末端重复序列(5′TR)、异源核酸和3′末端重复序列(3′TR),其中5′TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,其中3′TR包含选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段;其中所述转座酶包含选自SEQ ID NO:53-78和103-114的氨基酸序列,或其变体,并且其中所述转座元件表现出允许异源核酸插入细胞(例如哺乳动物细胞或植物细胞)的DNA中的转座活性。在一些实施方案中,所述异源核酸包含一个或多个多克隆位点(MCS)以促进目的多核苷酸(“货物基因”)的插入。在一些实施方案中,所述工程化转座元件来源于表2的任何一种TE。在一些实施方案中,所述工程化转座元件来源于Tc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt或Tc1-1_PM。
在一些实施方案中,试剂盒包含一种或多种用于本文所述的任何一种方法中的试剂。试剂可以在任何合适的容器中提供。例如,试剂盒可以提供一种或多种反应或储存缓冲液。试剂可以以可用于特定测定的形式提供,或以需要在使用前添加一种或多种其他组分的形式(例如以浓缩物或冻干形式)提供。缓冲液可以是任何缓冲液,包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液及其组合。在一些实施方案中,试剂盒包含培养基、缓冲液、试剂等以允许使用本文所述的工程化转座元件或基因转移系统修饰的细胞的增殖或诱导。在一些实施方案中,试剂盒包含缓冲液、试剂等,用于分离和/或制备使用本文所述的工程化转座元件或基因转移系统修饰的靶核酸。在一些实施方案中,试剂盒包含用于使用本文所述的工程化转座元件或基因转移系统制备测序文库的引物和试剂。
试剂盒采用合适的包装。合适的包装包括但不限于小瓶、瓶子、广口瓶、软包装(例如密封的聚酯薄膜或塑料袋)等。试剂盒可以选择性地提供额外的组分,如缓冲液和解释信息。本申请因此还提供制品,其包括小瓶(例如密封小瓶)、瓶子、广口瓶、软包装等。
实施例
以下实施例仅仅旨在示例本发明,因此不应认为以任何方式限制本发明。以下实施例和详细描述是通过说明而非限制的方式提供的。
实施例1:候选活性转座元件的鉴定
该实施例描述了跨物种的候选活性转座元件(TE、转座子)的计算机鉴定。各种物种中都存在大量的转座子。然而,只有少数转座子在哺乳动物细胞中表现出转座活性。因此,需要一种方法来系统地鉴定候选活性转座子,这些转座子可用作基因组工程和基因治疗的试剂。此实施例集中于鉴定具有末端反向重复序列(TIR,也称为末端重复TR)的转座子,但该方法可用于鉴定任何其他类型的转座子。
材料和方法
Repbase是最常用的转座子数据库,其包含来自多种真核物种的38,000个转座子序列(Bao,W.,K.K.Kojima,and O.Kohany,Repbase Update,a database ofrepetitiveelements in eukaryotic genomes.Mob DNA,2015.6:p.11)。这些原型序列大多是共有序列,其对每个转座子家族进行重构,以近似其祖先活化状态的序列。因此,共有序列可用于实验性重建用于转基因和基因治疗的活性转座子,如Sleeping Beauty(Ivics,Z.,et al.,Molecular reconstruction of Sleeping Beauty,a Tc1-like transposon from fish,and its transposition in human cells.Cell,1997.91(4):p.501-10)。作为该项目的第一步,所有共有序列均从Repbase(版本Repbase24.02)下载用于候选转座子筛选。
因为共有序列不一定包含完整的转座酶基因(特别是对于那些高度退化的古老转座子),并且会在其他系统(例如哺乳动物细胞)中不作为活性转座子起作用,所以使用几个参数来评估其原始物种中的经鉴定的TE转座活性,包括由转座酶编码的重要结构域、共有和家族成员之间的平均序列差异、拷贝数、保守的末端反向重复(TR)序列以及侧接TE的保守靶位点重复(TSD)。为了获得上述信息,从UCSC Genome Browser下载了100种动物的基因组序列(Haeussler,M.,et al.,The UCSC Genome Browser database:2019update.Nucleic Acids Res,2019.47(D1):p.D853-D858)。使用来自Repbase的共有序列对基因组序列进行重复掩蔽。活性转座子被定义为:1)候选转座子从头到尾匹配共有序列;以及2)候选转座子的长度达到共有转座子长度的90%,以确保转座子内没有明显的缺失。
结果
图1说明了生物信息学管线的流程图,以及管线每个阶段的候选活性转座元件的数量。
总共从100个动物基因组中鉴定了26,853,019个DNA转座子拷贝(主要是TIR转座子)。大量的拷贝是从活性转座子退化而来的片段。全长DNA转座子拷贝总数为1,895,466,其被映射到Repbase中的1,577个共有DNA转座子。
然后检查这些转座子以查看它们是否含有转座酶基因。ORFfinder用于检测开放阅读框(ORF),长度截止值设置为300个氨基酸。然后,所述蛋白质序列用于通过PfamScan搜索针对Pfam HMM文库的重要域(Madeira,F.,et al.,The EMBL-EBI search and sequenceanalysis tools APIs in 2019.Nucleic Acids Res,2019.47(W1):p.W636-W641)。在这个过滤步骤之后,131个具有Tn结构域的转座子保留在管线中。
接下来,使用RepeatMasker确定每个转座子的拷贝数(Smit,AFA,Hubley,R&Green,P.RepeatMasker Open-4.0.2013-2015)。计算了每个物种的共有转座子与其家族成员之间的平均序列差异值,该差异值在不同物种中的范围为0-24.4%。如表1所示,62个经鉴定的TE的平均差异值不大于5%,69个经鉴定的TE的平均差异值大于5%。发现这131个活性转座子分布在五个超家族中(图2)
在表1中鉴定的62个转座子中,共发现11个转座子符合以下更严格的标准,使其非常适合用于基因组工程:1)转座子的长度小于3000bp;2)转座子内的微型反向重复转座元件(MITE)数量大于10个;以及3)转座子的平均差异值小于1%(TE IDs:4、5、7、12、18、20、22、25、26、28和30,如表1所示)。
总之,这些数据显示了通过对100个基因组的泛基因组生物信息学分析鉴定的131个候选活性转座子。因此,这个实施例展示了一个用于鉴定候选活性转座元件的强大的生物信息学管线的成功开发。
实施例2:候选活性转座元件的验证
本实施例描述了实施例1中鉴定的候选活性转座元件的实验验证。
材料和方法
DNA合成和质粒构建
合成侧接EcoRI和NotI的哺乳动物密码子优化的转座酶ORF,并克隆到CMV-hyPBase载体中(K.Yusa,et al.,A hyperactive piggyBac transposase for mammalianapplications.Proc Natl Acad Sci U S A,2011.108(4):p.1531-6)。这些载体是辅助体质粒,用于在人CMV启动子下帮助转座酶表达。转座子供体质粒包含位于抗生素抗性基因两侧的左右转座子片段。如本文所用,左转座子片段(LTF)是指从5′TSD到TE序列的转座酶ORF序列的起始密码子的片段。如本文所用,右转座元件片段(RTF)是指从转座酶ORF序列的终止密码子到TE序列的3′TSD的片段。通常,TR序列位于左右转座子片段内。例如,所述5′TR序列位于LTF序列内,所述3′TR序列位于RTF序列内。本实验中使用的LTF和RTF序列由青兰生物技术公司合成,并克隆到pMV载体中。还在转座子片段中合成了5′和3′多克隆位点(MCS),用于货物基因克隆。TSD序列位于最外侧。用于哺乳动物细胞中转座筛选的供体质粒,携带P2A连接的嘌呤霉素抗性基因和由PGK启动子表达的增强型GFP基因。图3显示了用于验证活性转座元件的一组示例性辅助体和供体构建体。
哺乳动物细胞中的转座
四种哺乳动物细胞系HEK293T(也称为293T)、HeLa、Hct116和K562用于筛选活性转座子。293T和HeLa细胞系维持在DMEM培养基中,并补充有10%胎牛血清和1%青霉素/链霉素。Hct116和K562细胞系维持在RPMI1640培养基中,并补充有10%胎牛血清和1%青霉素/链霉素。除了这些细胞系,使用EasySep Human T Cell Enrichment试剂盒分离CD3+T细胞,随后通过histopaque-1077(Sigma-Aldrich)梯度分离收集单核细胞,CD3+T细胞在X-Vivo15培养基(Lonza),补充有5%(v/v)热灭活胎牛血清、2mM L-谷氨酰胺和1mM丙酮酸钠。
对于转座测定,在转染前18小时,将1.2x105个HEK293T细胞、0.7x105个HeLa细胞或1.0x105个Hct116细胞接种到24孔板的各个孔中。使用Lipo3000将200ng的辅助体质粒和100ng的供体质粒,或单独的100ng的供体质粒递送到每个细胞系中。转染两天后,计算细胞数并通过FACS测量转染效率。然后将1/100th转染的HEK293T、1/100th转染的HeLa细胞或1/100th转染的Hct116细胞转移到100-mm板中用于嘌呤霉素(0.5μg/ml)选择10天(HEK-293T细胞系)或14天(HeLa细胞系和Hct116细胞系)。
嘌呤霉素筛选后,用5ml冷PBS洗涤细胞一次,然后用4%PFA固定15分钟,然后用0.2%亚甲蓝(在PBS中)染色1小时(Wu et al.,piggyBac is a flexible and highlyactive transposon as compared to Sleeping Beauty,Tol2,and Mos1 in mammaliancells.PNAS,2006.103:p.15008-15013)。最后,用PBS洗掉残留的非特异性染色。通过ImageJ软件计数单个染色的菌落。根据之前计算的转染细胞总数和转染效率,计算转座效率。
对于悬浮细胞,如K562细胞系和CD3+T细胞,基于电穿孔后第14天的GFP阳性细胞百分比评估转座活性,此时质粒被稀释至极小比例。
TE插入文库的构建和生物信息学分析
使用DNeasy血液和组织试剂盒(Qiagen,Germany)从稳定的转座K562细胞中分离基因组DNA,使用Covaris M220超声波发生器(Covaris,USA)将其剪切至600bp的平均长度。对DNA样品进行末端修复,通过嵌套PCR进行接头连接和扩增,并在Illumina HiSeq测序仪上进行纯化和测序。然后,将TE整合位点与侧接载体整合位点的一级序列上游和下游区域中的随机插入位点、到最近基因和TSS的距离以及不同的染色质状态进行比较。
结果
验证项目包括三轮实验。
对于初始轮,首先验证具有小于1%的差异值和大于10的MITE拷贝数的11个TE(即,TE ID:4、5、7、12、18、20、22、25、26、28和30)。不希望受任何理论的束缚,假设较低的差异值和较高的MITE拷贝数表明转座元件最近在一个物种中有活性的可能性较高(参见R.Mitra,et al.,Functional characterization of piggyBat from the bat Myotislucifugus unveils an active mammalian DNA transposon.Proc Natl Acad Sci U SA,2013.110(1):p.234-9)。
在质粒构建期间,发现来自两种不同来源的转座子TR序列可用,一种来自数据库提供的共有序列,另一种来自自主序列和MITE序列的比对。为了测试不同的TR序列来源是否会影响测定结果,分别使用来自不同来源的TR序列设计了两组供体质粒用于转录测定。
结果表明,对于在初始验证中测试的11个候选TE,发现三个TE是有活性的。发现Tc1-3_Xt(TE ID 25)在HEK293T和HeLa细胞中均具有活性,在HEK293T细胞中的转移效率约为9.6%,在HeLa细胞中转移效率为3.6%,相当于piggyBac的一半左右(在HEK293T细胞中为18.4%,在HeLa细胞中为8.3%)。发现两种TE仅在测试的两种细胞系中的一种中具有活性:hAT-3_XT(TE ID 22)在HeLa细胞中的活性约为1%,hAT-5_DR(TE ID 28)在HEK-293T细胞中的活性约为2%。因为在具有不同来源的TR序列的两个供体质粒组之间没有观察到转座效率的显著差异,所以后来的实验仅依赖于来自数据库中共有序列的TR序列。
对于下一轮实验,评估了从表1中选出的48个候选TE在293T和HeLa细胞系中的转座活性(其中,仅在293T细胞中测试了16个TE)。以惊人的高成功率,从测试的48个候选TE中发现22个TE有活性。其中,8个TE的转座效率与piggyBac相当甚至更高:Tc1-8B_DR(TE ID14)、Tc1-3_FR(TE ID 29)、Mariner2_AG(TE ID 35)、Tc1-1_Xt(TE ID 36)、Tc1-1_AG(TEID 37)、Tc1-1_PM(TE ID 43)、Tc1-4_Xt(TE ID 54)和Tc1-15_Xt(TE ID 56)。作为参比,piggyBac在293T细胞中的转座效率为17.44%,在HeLa细胞中的转座效率为10.25%。
对于几种活性TE,因为转座效率远高于预期,所述细胞的标准稀释度不足以使存活的菌落在测定板上保持分离以准确计数单个菌落。结果,图像软件计数的染色菌落数被低估了。对于那些TE,即使检测板的染色清楚地表明转座效率要高得多,但基于低估的菌落计数计算出的转座效率只是对实际转座效率的低估。
总之,从两轮实验,评估了59个候选TE的转座活性。图4A-5B显示了评估的TE与对照TE相比的转座效率。共发现25个TE在人类细胞系中有活性。
在25个活性TE中,9个TE属于hAT超家族,16个TE属于TcMariner超家族。8个活性TE的转座活性与piggyBac相当,甚至更高。这8个高效的活性TE均属于TcMariner超家族,表明该超家族中分布着更多的活性转座子。此外,25个活性TE中有9个来自热带爪蛙。此外,在TE的转座活性与差异值或MITE拷贝数之间没有观察到明显的关系。
在第3轮实验中,评估了从表1中选出的剩余72个候选TE在293T和HeLa细胞系中的转座活性。在候选TE中,仅在293T细胞中测试了69个差异值大于5%的TE。从测试的72个候选TE中发现13个TE具有活性。结果显示在图6A-6B中。
表2总结了来自上述实验的经验的活性TE,包括总共38个TE在293T细胞系和HeLa细胞系两者中或仅在两种细胞系之一中被验证有活性。基于转座酶序列鉴定的属于不同超家族的TE的系统发育树显示在图7A-7C中。每个超家族内各种转座酶之间的序列相似性百分比显示在表3-5中。
值得注意的是,5个DNATE(Tc1-8B_DR(TE ID 14)、Tc1-3_FR(TE ID 29)、Mariner2_AG(TE ID 35)、Tc1-1_Xt(TE ID 36)、Tc1-1_PM(TE ID 43)表现出比经过多次优化的SB100X更高的转座活性。5个活性最高的TE在HEK293T细胞、Hela细胞和HCT116细胞中也含有更高的转座活性(图8A-9B),图10A-10B显示TE在原代T细胞中的转座活性。在3个TE(Tc1-8B_DR(TE ID 14)、Tc1-3_FR(TE ID 29)、Tc1-1_PM(TE ID 43))中没有发生被称为过度生产抑制(OPI)的现象。图11A-11B显示转座活性随着编码转座酶的辅助体质粒与转座子质粒的优化比率而增加。图12显示与鉴定的对照TE、piggyBAC、hyperPiggyBac和SB100X相比,5个活性最高的TE的货物容量,包括2kb、5kb、10kb和20kb的基因长度。
在131个候选TE中,活性TE与非活性TE的比较表明,活性TE表现出较低的平均多样性、稍长的预测TIR序列和显著增加的自主TE数量。这些差异有助于区分可在生物信息学管线中用于鉴定活性TE的特征,包括初步和大规模筛选设置。
在转座子整合位点检索的整合位点揭示了5个活性最高的TE的高度优选的TA靶位点二核苷酸(图13)。TE的靶位点二核苷酸属于Tc/Mariner超家族,并且非常保守。图14A-18通过比较计算机生成的随机数据和对照TE、piggyBAC显示了整合到基因组特征中的频率,这些特征包括到基因和转录起始位点(TSS)的距离、不同染色质状态。数据显示,所有5个活性最高的TE对基因序列附近的整合的偏好都非常低,而对基因和TSS的上下游序列没有偏好。关于基因表达水平和染色质状态,5个活性最高的TE也显示出几乎随机的整合模式,并且它们往往不会插入过度活性的表达区域。
总而言之,这些数据表明成功建立了用于识别候选活性转座元件的稳健生物信息学管线,以及对鉴定的TE的成功的实验验证。各种TE的转座效率和整合模式表明,这些TE可能在基因组工程应用和基因治疗中有用。
表3 14个经鉴定的hAT超家族转座酶与对照TE TcBuster之间的序列相似性
表4 14个经鉴定的piggyBac超家族转座酶与对照TE piggyBac之间的序列相似性
82_piggyBac_2XT | 100.0% | ||
piggyBac | 33.1% | 100.0% | |
86_piggyBac-1_AMi | 35.8% | 44.5% | 100.0% |
82_piggyBac_2XT | piggyBac | 86_piggyBac-1_AMi |
序列表
<110> 中国科学院动物研究所
<120> 活性 DNA 转座子系统及其使用方法
<130> PF02518A-FE00379CN
<140> 尚未分配
<141> 同时用此方法
<150> PCT/CN2020/082087
<151> 2020-03-30
<160> 206
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 5
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 1
taggc 5
<210> 2
<211> 3
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 2
tag 3
<210> 3
<211> 201
<212> DNA
<213> 斑马鱼(Danio rerio)
<400> 3
cagcggggaa aataagtatt tgacacatca gcatttttat cagtaagggg atttctaagt 60
gggctactga cacaaaattc ctaccagatg tagccatcaa gccaaatatt gaattcatac 120
aaagaaatca gaacatttaa gtatacaagt tgagtcataa taaataaagt gaaatgacac 180
agggaataag tattgaacac a 201
<210> 4
<400> 4
000
<210> 5
<211> 6
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 5
cagggg 6
<210> 6
<211> 210
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 6
cagtggagga aataattatt tgacccctca ctgattttgt aagtttgtcc aatgacaaag 60
aaatgaaaag tctcagaaca gtatcatttc aatggtaggt ttattttaac agtggcagat 120
agcacatcaa aaggaaaatc gaaaaaataa ctttaaataa aagatagcaa ctgatttgca 180
tttcattgag tgaaataagt ttttgaaccc 210
<210> 7
<211> 15
<212> DNA
<213> 斑马鱼(Danio rerio)
<400> 7
caggggtggc gaacc 15
<210> 8
<211> 131
<212> DNA
<213> 红鳍东方鲀(Takifugu rubripes)
<400> 8
cagtgagagt aaaaagtatt tgatcccttg ctgattttgt tggtttgtcc actaataaag 60
acatgatcat tctatacttt taatggtaga tgtattctaa catggagaga cagaatatca 120
aaaagaaaat c 131
<210> 9
<211> 213
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 9
caaaccggat tccaaaaaag ttgggacact aaacaaattg tgaataaaaa ctgaacgcaa 60
tgatgtggag gtgccaactt ctaatatttt attcagaata gaacataaat cacggaacaa 120
aagtttaaac tgagaaaatg taccatttta agggaaaaat atgttgattc agaatttcat 180
ggtgtcaaca aatcccaaaa aagttgggac aag 213
<210> 10
<211> 214
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 10
cagtggcttg caaaagtatt cggccccctt gaacttttcc acattttgtc acattacagc 60
cacaaacatg aatcaatttt attggaattc cacgtgaaag accaatacaa agtggtgtac 120
acgtgagaag tggaacgaaa atcatacatg attccaaaca ttttttacaa ataaataact 180
gcaaagtggg gtgtgcgtaa ttattcagcc ccct 214
<210> 11
<211> 18
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 11
tacagtgtcg gacaaatc 18
<210> 12
<211> 63
<212> DNA
<213> 非洲爪蟾(Xenopus laevis)
<400> 12
cagtggtgtg aaaaactatt tgcccccttc ctgatttctt attcttttgc atgtttgtca 60
cac 63
<210> 13
<211> 13
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 13
cactggtgga cat 13
<210> 14
<211> 8
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 14
atatacac 8
<210> 15
<211> 16
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 15
caggggtcac caaact 16
<210> 16
<211> 129
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 16
cagtgaggga aaaaagtatt tgatcccctg ctgattttgt acgtttgccc actgacaaag 60
aaatgatcag tctataattt taatggtagg tttatttgaa cagtgagaga cagaataaca 120
acaacaaaa 129
<210> 17
<211> 5
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 17
caggc 5
<210> 18
<211> 16
<212> DNA
<213> 小棕蝠(Myotis lucifugus)
<400> 18
cagtgatggc gaacct 16
<210> 19
<211> 3
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 19
cag 3
<210> 20
<211> 157
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 20
cagtggatat aaaaagtcta cacacccctg gtaaaatgtc aggttcctgt gctgtacaaa 60
aatgagacaa agataaatca tttcagaact ttttccacct ttaatgtgac ctataaactg 120
taccactcaa ttgaaaaaca aactgaaatc ttttagg 157
<210> 21
<211> 215
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 21
cagtcatggc caaaattgtt ggcaccccag aaatttttcc agaaaatcaa gtatttctca 60
cagaaaagta ttgcagtaac acatgttttg ctatacacat gtttattccc tttgtgtgta 120
ttggaacaga acaaaaaagg gaggaaaaaa agcaaattgg acataatgtc acacaaaact 180
ccaaaaatgg gctggacaaa attattggca ccctt 215
<210> 22
<211> 204
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 22
cagtgaggaa cataagtatt tgaacaccct gcgattttgc aagttctccc acttagaaat 60
catggagggg tctgaaattc acattgtagg tgcattccca ctgtgagaga cagcatttaa 120
aaaaaaaatt caggaaatca cattgtatga tttttaaaga atgtatttgt attgcactgc 180
tgcacataag tatttgaaca cctg 204
<210> 23
<211> 27
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 23
cactgctcaa aaaaataaag ggaacac 27
<210> 24
<211> 29
<212> DNA
<213> 红鳍东方鲀(Takifugu rubripes)
<400> 24
cactgctcaa aaaaattaga ggaacactt 29
<210> 25
<211> 3
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 25
tag 3
<210> 26
<211> 28
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 26
ccgtattttc cgcactataa ggcgcacc 28
<210> 27
<211> 5
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 27
gccta 5
<210> 28
<211> 3
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 28
cta 3
<210> 29
<211> 201
<212> DNA
<213> 斑马鱼(Danio rerio)
<400> 29
tgtgttcaat acttattccc tgtgtcattt cactttattt attatgactc aacttgtata 60
cttaaatgtt ctgatttctt tgtatgaatt caatatttgg cttgatggct acatctggta 120
ggaattttgt gtcagtagcc cacttagaaa tccccttact gataaaaatg ctgatgtgtc 180
aaatacttat tttccccgct g 201
<210> 30
<400> 30
000
<210> 31
<211> 6
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 31
cccctg 6
<210> 32
<211> 210
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 32
gggttcaaaa acttatttca ctcaatgaaa tgcaaatcag ttgctatctt ttatttaaag 60
ttattttttc gattttcctt ttgatgtgct atctgccact gttaaaataa acctaccatt 120
gaaatgatac tgttctgaga cttttcattt ctttgtcatt ggacaaactt acaaaatcag 180
tgaggggtca aataattatt tcctccactg 210
<210> 33
<211> 15
<212> DNA
<213> 斑马鱼(Danio rerio)
<400> 33
ggttcgccac ccctg 15
<210> 34
<211> 131
<212> DNA
<213> 红鳍东方鲀(Takifugu rubripes)
<400> 34
gattttcttt ttgatattct gtctctccat gttagaatac atctaccatt aaaagtatag 60
aatgatcatg tctttattag tggacaaacc aacaaaatca gcaagggatc aaatactttt 120
tactctcact g 131
<210> 35
<211> 213
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 35
cttgtcccaa cttttttggg atttgttgac accatgaaat tctgaatcaa catatttttc 60
ccttaaaatg gtacattttc tcagtttaaa cttttgttcc gtgatttatg ttctattctg 120
aataaaatat tagaagttgg cacctccaca tcattgcgtt cagtttttat tcacaatttg 180
tttagtgtcc caactttttt ggaatccggg ttg 213
<210> 36
<211> 214
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 36
agggggctga ataattacgc acaccccact ttgcagttat ttatttgtaa aaaatgtttg 60
gaatcatgta tgattttcgt tccacttctc acgtgtacac cactttgtat tggtctttca 120
cgtggaattc caataaaatt gattcatgtt tgtggctgta atgtgacaaa atgtggaaaa 180
gttcaagggg gccgaatact tttgcaagcc actg 214
<210> 37
<211> 18
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 37
gatttgtccg acactgta 18
<210> 38
<211> 63
<212> DNA
<213> 非洲爪蟾(Xenopus laevis)
<400> 38
gtgtgacaaa catgcaaaag aataagaaat caggaagggg gcaaatagtt tttcacacca 60
ctg 63
<210> 39
<211> 13
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 39
atgtccacca gtg 13
<210> 40
<211> 8
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 40
gtgtatat 8
<210> 41
<211> 16
<212> DNA
<213>海七鳃鳗 (Petromyzon marinus)
<400> 41
agtttggtga cccctg 16
<210> 42
<211> 129
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 42
ttttgttgtt gttattctgt ctctcactgt tcaaataaac ctaccattaa aattatagac 60
tgatcatttc tttgtcagtg ggcaaacgta caaaatcagc aggggatcaa atactttttt 120
ccctcactg 129
<210> 43
<211> 5
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 43
gcctg 5
<210> 44
<211> 16
<212> DNA
<213> 小棕蝠(Myotis lucifugus)
<400> 44
aggttcgcca tcactg 16
<210> 45
<211> 3
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 45
ctg 3
<210> 46
<211> 157
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 46
cctaaaagat ttcagtttgt ttttcaattg agtggtacag tttataggtc acattaaagg 60
tggaaaaagt tctgaaatga tttatctttg tctcattttt gtacagcaca ggaacctgac 120
attttaccag gggtgtgtag actttttata tccactg 157
<210> 47
<211> 215
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 47
aagggtgcca ataattttgt ccagcccatt tttggagttt tgtgtgacat tatgtccaat 60
ttgctttttt tcctcccttt tttgttctgt tccaatacac acaaagggaa taaacatgtg 120
tatagcaaaa catgtgttac tgcaatactt ttctgtgaga aatacttgat tttctggaaa 180
aatttctggg gtgccaacaa ttttggccat gactg 215
<210> 48
<211> 204
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 48
caggtgttca aatacttatg tgcagcagtg caatacaaat acattcttta aaaatcatac 60
aatgtgattt cctgaatttt ttttttaaat gctgtctctc acagtgggaa tgcacctaca 120
atgtgaattt cagacccctc catgatttct aagtgggaga acttgcaaaa tcgcagggtg 180
ttcaaatact tatgttcctc actg 204
<210> 49
<211> 27
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 49
gtgttccctt tatttttttg agcagtg 27
<210> 50
<211> 29
<212> DNA
<213> 红鳍东方鲀(Takifugu rubripes)
<400> 50
aagtgttcct ctaatttttt tgagcagtg 29
<210> 51
<211> 3
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 51
cta 3
<210> 52
<211> 28
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 52
ggtgcgcctt atagtgcgga aaatacgg 28
<210> 53
<211> 595
<212> PRT
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 53
Met Ala Ser Asn Val Ala Thr Ser Ser Ser Ile Trp Asp His Phe Thr
1 5 10 15
Arg Asn Gly Thr Lys Ala Lys Cys Arg Tyr Cys Tyr Asn Glu Ile Ala
20 25 30
Phe Thr Lys Gly Ser Thr Ser Asn Leu Lys Arg His Met Lys Ala Lys
35 40 45
His Pro Ser Ile Ser Leu Glu Arg Gln His Leu Ala Ser Thr Thr Ser
50 55 60
Pro Ser Thr Gln Asn Ser Glu Pro Gly Pro Ser Cys Ser Ser Arg Pro
65 70 75 80
Pro Asn Leu Ile Ser Asn Phe Phe Lys Gln Pro Met Asn Ser Glu Thr
85 90 95
Lys Arg Lys Leu Asp Met Met Leu Leu Lys Leu Ile Cys Lys Asp Cys
100 105 110
Leu Pro Leu Ser Ile Val Glu Ser Glu Ala Phe Lys Thr Phe Val Gly
115 120 125
Cys Leu Asn Gln Asn Tyr Asp Leu Pro Thr Arg Lys Asn Val Ser Asn
130 135 140
Ala Leu Leu Pro Ser Ile Tyr Asn Glu Ile Leu Val Lys Val Gln Gly
145 150 155 160
Glu Val Arg Asn Ala Thr Ser Ile Ala Leu Thr Thr Asp Gly Trp Thr
165 170 175
Asn Val Asn Asn Thr Ser Phe Leu Gly Leu Thr Ala His Phe Ile Asp
180 185 190
Asn Asp Tyr Lys Leu Arg Ser Cys Leu Leu Glu Cys Ser Glu Ile Ser
195 200 205
Leu Ser His Ser Gly Gln Asn Ile Ala Ala Trp Ile Lys Glu Val Ile
210 215 220
Ile Lys Tyr Glu Ile Gln Asp Lys Ile Val Gly Ile Val Thr Asp Asn
225 230 235 240
Ala Ala Asn Met Lys Ser Ala Ala Arg Glu Leu Glu Phe Asn His Val
245 250 255
Thr Cys Phe Ala His Ser Leu His Leu Ile Val Lys Asp Ala Ile Lys
260 265 270
Lys Ser Ile Ile Ser Thr Val Asp Glu Val Lys Arg Ile Val Met Tyr
275 280 285
Phe Lys Lys Ser Pro Lys Ala Thr Asn Glu Leu Ala Asp Thr Gln Ser
290 295 300
Lys Phe Asn Leu Pro Asn Leu Lys Leu Lys Gln Asp Val Pro Thr Arg
305 310 315 320
Trp Asn Ser Thr Tyr Asp Met Leu Asn Arg Phe Tyr Lys Asn Lys Ile
325 330 335
Ala Ile Val Ala Cys Ala Asp Lys Leu Asn Thr Leu Asp Pro Ile Lys
340 345 350
Ile Asp Trp Ala Ile Leu Glu His Ser Leu Asn Ala Leu Lys Ile Phe
355 360 365
Asp Val Ala Thr Asn Met Val Ser Ala Glu Lys Asn Ile Thr Val Ser
370 375 380
His Val Gly Leu Leu Ser Lys Met Ile Ile Arg Lys Leu Asn Glu Thr
385 390 395 400
Asp Tyr Thr Ile Pro Glu Leu Gly Asn Leu Val Thr His Leu Lys Glu
405 410 415
Gly Val Lys Lys Arg Leu Glu Ile Tyr Ser Asn Asn Gln Ile Ile Ala
420 425 430
Lys Ser Met Leu Leu Asp Pro Arg Ile Lys Lys Gln Gly Phe His Glu
435 440 445
Glu Pro Leu Lys Tyr Arg Glu Thr Tyr Glu Leu Ile Ile Gln Glu Leu
450 455 460
Ile Pro Phe Gln Thr Pro Ser Met Asn Ala Gln Glu Pro His Asn Ile
465 470 475 480
Asp Asn Glu Ala Asn Leu Leu Leu Gly Glu Phe Ile Thr Trp Val Asn
485 490 495
Asn Ala Glu Cys Glu Ile Glu Ser Pro Ile Glu Leu Ala Lys Asn Glu
500 505 510
Leu Asn Ser Phe Leu Lys Ile Arg Asn Ile Asp Ile Lys Asn Asp Pro
515 520 525
Leu Glu Trp Trp Arg Ile His Ser Ser Lys Tyr Pro Ser Ile Tyr Ala
530 535 540
Leu Ala Lys Thr Ile Ile Cys Ile Pro Gly Thr Ser Val Pro Cys Glu
545 550 555 560
Arg Leu Phe Ser Lys Ala Gly Gln Ile Tyr Ser Asp Lys Arg Ser Arg
565 570 575
Leu His Pro Lys Lys Phe Lys Glu Ile Ile Phe Ile Gln Gln Asn Val
580 585 590
Asp Lys Phe
595
<210> 54
<211> 603
<212> PRT
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 54
Met Met Ala Pro Thr Asn Ala Thr Thr Ser Pro Val Trp Asp His Phe
1 5 10 15
Ser Pro Val Glu Thr Gly Ala Lys Cys Leu Tyr Cys Leu Lys Val Phe
20 25 30
Lys Tyr Thr Lys Gly Thr Thr Ser Asn Leu Lys Arg His Leu Asn Leu
35 40 45
Val His Lys Thr Val Pro Tyr Leu Lys Gln Lys Gln Pro Ile Pro Gln
50 55 60
Thr Ile Asn Ile Asp Asp Glu Ala Gly Pro Ser Ala Val Asn Phe Gln
65 70 75 80
Pro Ser Asn Gln Tyr Phe Asn Ser Asn Met Ser Ile Gln Gly Tyr Leu
85 90 95
Lys Lys Pro Ile Asn Ser Glu Thr Lys Lys Val Leu Asp Arg Met Leu
100 105 110
Leu Asp Leu Ile Cys Lys Glu Cys Leu Pro Phe Asn Leu Val Glu Ser
115 120 125
Glu Ile Phe Lys Lys Phe Val Tyr Thr Leu Asn Pro Asn Tyr Ile Met
130 135 140
Pro Thr Arg Lys Ser Leu Ser Asn Ala Leu Leu Pro Ser Val Tyr Asn
145 150 155 160
Gln Glu Phe Glu Lys Ala Lys Glu Lys Leu Ser Thr Ala Lys Ala Ile
165 170 175
Ala Ile Thr Ser Asp Gly Trp Thr Asn Leu Asn Gln Ile Ser Phe Phe
180 185 190
Ala Leu Thr Gly His Tyr Ile Asp Glu Asn Cys Lys Leu Ser Ser Ile
195 200 205
Leu Ile Glu Cys Ser Glu Phe Glu Asn Pro His Ser Gly Arg Asn Ile
210 215 220
Ala Asn Trp Ile Gln Gly Thr Leu Asn Lys Phe Asp Ile Glu Asp Lys
225 230 235 240
Ile Val Ala Met Val Thr Asp Asn Ala Ser Asn Met Lys Ala Ala Ser
245 250 255
Thr Glu Leu Asn Phe Cys His Ile Pro Cys Phe Ala His Thr Leu Asn
260 265 270
Leu Ile Val Arg Asp Ala Ile Lys Lys Ser Val Leu Pro Val Val Glu
275 280 285
Glu Val Lys Arg Val Val Met Leu Phe Lys Lys Ser Pro Lys Ala Ser
290 295 300
Gln Met Leu Ala Asp Thr Gln Lys Lys Leu Asn Leu Asp Gln Leu Lys
305 310 315 320
Met Ile Gln Glu Val Ser Thr Arg Trp Asn Ser Gly Tyr Asp Met Leu
325 330 335
Asn Arg Phe Tyr Lys Asn Lys Ile Ala Leu Leu Ser Cys Ala Asp Ser
340 345 350
Leu Lys Met Lys Ile Ser Leu Glu Ser His Asp Trp Glu Ala Ile Glu
355 360 365
Gln Ile Val Arg Val Leu Lys Tyr Phe Tyr Ser Ala Thr Asn Ile Val
370 375 380
Ser Ala Gln Lys Tyr Ile Thr Ile Ser His Val Gly Leu Leu Cys Asn
385 390 395 400
Val Leu Leu Thr Lys Thr Ser Gln Phe Arg Asn Asp Glu Asp Ile Ala
405 410 415
Glu Asn Ile Gln Asn Leu Val Ala Leu Leu Ile Glu Gly Leu Gln Asn
420 425 430
Lys Leu Lys Ile Tyr Arg Ser Asn Glu Gln Ile Leu Lys Ser Met Ile
435 440 445
Leu Asp Pro Arg Ile Lys Gln Leu Gly Phe Gln Asp Asp Val Glu Lys
450 455 460
Phe Lys Asn Ile Cys Glu Ser Ile Ile Ser Glu Leu Leu Pro Leu Gln
465 470 475 480
Lys Pro Ala Val Glu Val Glu Lys Val Val Lys Lys Val Ser Lys Asp
485 490 495
Val Asp Met Leu Phe Gly Asp Leu Leu Lys Asn Lys Gly Ala Gln Asn
500 505 510
Tyr Lys Thr Pro Arg Gln Ile Ala Glu Asn Glu Leu His Gln Tyr Leu
515 520 525
Ser Val Glu Asn Ile Asp Leu Glu Asn Asp Pro Leu Leu Trp Trp Lys
530 535 540
Glu His Gln Val Leu Tyr Pro Ser Leu Tyr Thr Leu Ala Met Ser Thr
545 550 555 560
Leu Cys Ile Pro Gly Thr Ser Val Pro Cys Glu Arg Leu Phe Ser Lys
565 570 575
Ala Gly Gln Ile Tyr Ser Glu Lys Arg Ser Arg Leu Ala Pro Lys Lys
580 585 590
Leu Gln Glu Ile Leu Phe Ile Gln Gln Asn Ala
595 600
<210> 55
<211> 341
<212> PRT
<213> 斑马鱼(Danio rerio)
<400> 55
Met Met Gly Lys Asn Lys Glu Leu Ser Gln Asp Leu Arg Ser Leu Ile
1 5 10 15
Val Glu Lys His Phe Asp Gly Asn Gly Tyr Arg Arg Ile Ser Arg Met
20 25 30
Leu Asn Val Pro Val Ser Thr Val Gly Ala Ile Ile Arg Lys Trp Lys
35 40 45
Lys His Lys Phe Thr Ile Asn Arg Pro Arg Ser Gly Ala Pro Arg Lys
50 55 60
Ile Pro Val Arg Gly Val Gln Arg Ile Ile Arg Arg Val Leu Gln Glu
65 70 75 80
Pro Arg Thr Thr Arg Ala Glu Leu Gln Glu Asp Leu Ala Ser Ala Gly
85 90 95
Thr Ile Val Ser Lys Lys Thr Ile Ser Asn Ala Leu Asn His His Gly
100 105 110
Ile His Ala Arg Ser Pro Arg Lys Thr Pro Leu Leu Asn Lys Lys His
115 120 125
Val Glu Ala Arg Leu Lys Phe Ala Lys Gln His Leu Glu Lys Pro Val
130 135 140
Asp Tyr Trp Glu Thr Ile Val Trp Ser Asp Glu Ser Lys Ile Glu Leu
145 150 155 160
Phe Gly Ser His Ser Thr His His Val Trp Arg Arg Asn Gly Thr Ala
165 170 175
His His Pro Lys Asn Thr Ile Pro Thr Val Lys Phe Gly Gly Gly Ser
180 185 190
Ile Met Val Trp Gly Cys Phe Ser Ala Arg Gly Thr Gly Arg Leu His
195 200 205
Ile Ile Glu Gly Arg Met Asn Gly Glu Met Tyr Arg Asp Ile Leu Asp
210 215 220
Lys Asn Leu Leu Pro Ser Thr Arg Lys Leu Lys Met Lys Arg Gly Trp
225 230 235 240
Thr Phe Gln Gln Asp Asn Asp Pro Lys His Lys Ala Lys Glu Thr Met
245 250 255
Lys Trp Phe Gln Arg Lys Lys Ile Lys Leu Leu Glu Trp Pro Ser Gln
260 265 270
Ser Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Arg Glu Leu Lys Ile
275 280 285
Lys Val His Lys Arg Gly Pro Arg Asn Leu Gln Asp Leu Lys Thr Val
290 295 300
Cys Val Glu Glu Trp Ala Arg Ile Thr Pro Glu Gln Cys Arg Arg Leu
305 310 315 320
Val Ser Pro Tyr Lys Arg Arg Leu Glu Ala Val Ile Thr Asn Lys Gly
325 330 335
Phe Ser Thr Lys Tyr
340
<210> 56
<211> 645
<212> PRT
<213> 海七鳃鳗(Petromyzon marinus)
<400> 56
Met Ala Lys Arg Lys Lys Asp Asp Glu Tyr Arg Thr Phe Gln Asp Glu
1 5 10 15
Trp Thr Glu Glu Phe Ala Phe Val Glu Arg Ala Gly Ser Ala Val Cys
20 25 30
Leu Ile Cys Asn Asp Lys Ile Thr Ser Leu Lys Arg Ser Asn Val Lys
35 40 45
Arg His Phe Asp Thr Arg His Ala Thr Phe Ala Ser Lys Tyr Pro Ala
50 55 60
Gly Asp Ser Arg Lys Lys Ala Cys Gln Glu Leu Leu Ser Arg Val Gln
65 70 75 80
Ala Ser Gln Gln Gln Leu Arg Val Trp Thr Arg Gln Gly Asp Tyr Asn
85 90 95
Ser Ala Ser Phe Ala Gly Ser Leu Ala Ile Val Arg Asn Gly Lys Pro
100 105 110
Phe Thr Asp Gly Glu Tyr Ala Lys Thr Phe Met Leu Asp Val Ala Asn
115 120 125
Glu Leu Phe Asp Asp Leu Pro Asn Lys Asp Lys Ile Ile Lys Arg Ile
130 135 140
Gln Asp Met Pro Leu Ser Ala Arg Thr Val His Asp Arg Thr Ile Val
145 150 155 160
Met Ala Asn Lys Val Glu Glu Thr Gln Val Lys Asp Ile Asn Ala Ala
165 170 175
Pro Phe Phe Ser Leu Ala Leu Asp Glu Ser Thr Asp Val Ser His Leu
180 185 190
Ser Gln Phe Ser Val Ile Ala Arg Tyr Ala Val Gly Asp Thr Leu Arg
195 200 205
Glu Glu Ser Leu Ala Val Leu Pro Leu Lys Gly Ser Thr Arg Gly Glu
210 215 220
Asp Leu Phe Lys Ser Phe Met Glu Phe Ala Gln Glu Lys Ser Leu Pro
225 230 235 240
Met Asp Lys Leu Leu Ser Val Cys Thr Asp Gly Ala Pro Cys Met Val
245 250 255
Gly Lys Asn Lys Gly Phe Val Ala Leu Leu Arg Glu His Glu Asn Arg
260 265 270
Pro Ile Leu Ser Phe His Cys Ile Ile His Gln Glu Ala Leu Cys Ala
275 280 285
Gln Met Cys Asp Arg Gln Phe Gly Glu Val Met Ser Leu Val Ile Arg
290 295 300
Val Ile Asn Phe Ile Val Ala Arg Ala Leu Asn Asp Arg Gln Phe Lys
305 310 315 320
Thr Leu Leu Asp Glu Val Val Asn Asn Tyr Pro Gly Leu Leu Leu His
325 330 335
Ser Asn Val Arg Trp Leu Ser Arg Gly Lys Val Leu Ser Arg Phe Ala
340 345 350
Ala Cys Leu Asn Glu Ile Arg Thr Phe Leu Glu Met Lys Gly Val Gly
355 360 365
His Pro Glu Leu Ala Asp Thr Glu Trp Leu Leu Lys Phe Tyr Tyr Leu
370 375 380
Val Asp Leu Thr Glu His Leu Asn Gln Leu Asn Val Lys Met Gln Gly
385 390 395 400
Ile Gly Asn Thr Val Leu Ser Leu Gln Gln Ala Val Phe Ala Phe Glu
405 410 415
Asn Lys Leu Glu Leu Phe Ile Thr Asp Leu Glu Thr Gly Arg Leu Leu
420 425 430
His Phe Glu Lys Leu Ser Gln Phe Lys Asp Ala Cys Thr Ala Ser Glu
435 440 445
Pro Ile Gln Asn Leu Asp Leu His Gln Leu Ala Gly Cys Thr Ser Ser
450 455 460
Leu Leu Gln Ser Phe Lys Ala Arg Phe Gly Glu Phe Arg Glu His Thr
465 470 475 480
Arg Leu Phe Lys Phe Ile Thr His Pro Asn Glu Cys Ser Leu Asn Thr
485 490 495
Ala Asp Leu Asn Tyr Ile Pro Gly Val Ser Val Arg Asp Phe Glu Ala
500 505 510
Glu Val Ala Asp Leu Lys Ala Ser Asp Met Trp Val Asn Lys Phe Lys
515 520 525
Ser Leu Asn Glu Asp Leu Glu Arg Ile Thr Arg Gln Lys Ala Glu Leu
530 535 540
Ala Ser Lys His Met Trp Thr Glu Met Lys Lys Leu Gln Pro Glu Asp
545 550 555 560
Gln Leu Ile Leu Lys Thr Trp Asn Ala Leu Pro Val Thr Tyr His Thr
565 570 575
Leu Gln Arg Val Ser Ile Ala Val Leu Thr Met Phe Gly Ser Thr Tyr
580 585 590
Ala Cys Glu Gln Ser Phe Ser His Leu Lys Asn Ile Lys Ser Asn Leu
595 600 605
Arg Ser Arg Leu Thr Asp Glu Ser Leu Asn Ala Cys Met Lys Leu Asn
610 615 620
Leu Thr Lys Tyr Gln Pro Asp Tyr Lys Asp Ile Ser Lys Ser Met Gln
625 630 635 640
His Gln Lys Ser His
645
<210> 57
<211> 612
<212> PRT
<213> 热带爪蟾(Xenopus tropicalis)
<400> 57
Met Thr Ser Ser Gln Pro Ala Val Lys Arg Lys Ile Asp Asp Glu His
1 5 10 15
Arg Gln Phe Gln Glu Lys Trp Glu Met Gln Tyr Phe Phe Val Glu His
20 25 30
Arg Gly Ile Pro Thr Cys Leu Ile Cys Ala Glu Lys Val Ala Val His
35 40 45
Lys Glu Tyr Asn Leu Lys Arg His Tyr Ser Thr Lys His Ala Glu Glu
50 55 60
Cys Ala Lys Tyr Gln Gly Asp Glu Arg Ala Lys Arg Val Ala Ser Leu
65 70 75 80
Lys Ala Cys Leu Met Arg Gln Gln Asp Phe Phe Lys Lys Ala Thr Lys
85 90 95
Glu Asn Val Ala Ser Val Gln Ala Ser Tyr Met Val Ser Glu Met Ile
100 105 110
Ala Lys Ala Gly Lys Pro Phe Thr Glu Gly Glu Phe Val Lys Lys Cys
115 120 125
Met Leu Gln Val Ala Ser Ile Ile Cys Pro Glu Lys Lys Gly Gln Phe
130 135 140
Ser Lys Ile Ser Leu Ser Ala Asn Thr Val Ala Glu Arg Ile Ser Asp
145 150 155 160
Met Ser Ser Asp Ile Tyr His Gln Leu Cys Glu Lys Ala Lys Cys Phe
165 170 175
Asp Ala Tyr Ser Val Ala Leu Asp Glu Ser Thr Asp Ile Thr Gly Thr
180 185 190
Ala Gln Leu Thr Ile Tyr Val Arg Gly Val Asp Cys Asn Phe Glu Leu
195 200 205
Thr Glu Glu Leu Leu Thr Ile Ile Pro Met His Gly Gln Thr Thr Ala
210 215 220
Asn Glu Ile Phe His His Leu Cys Asp Ala Ile Glu Asn Ala Gly Leu
225 230 235 240
Pro Trp Lys Arg Phe Val Gly Ile Ile Thr Asp Gly Ala Pro Ser Met
245 250 255
Thr Gly Arg Lys Asn Gly Leu Val Ala Leu Val Lys Lys Lys Leu Glu
260 265 270
Glu Glu Gly Ile Glu Glu Glu Ala Ile Ala Leu His Cys Ile Ile His
275 280 285
Gln Gln Ala Leu Cys Ser Lys Cys Leu Pro Cys Asp Asn Val Met Ser
290 295 300
Val Val Val Lys Cys Val Asn Gln Ile Arg Ser Arg Gly Leu Thr His
305 310 315 320
Arg Arg Phe Arg Ala Phe Leu Glu Glu Met Gly Ser Glu Tyr Gly Asp
325 330 335
Val Leu Tyr Phe Thr Glu Val Arg Trp Leu Ser Arg Gly Asn Val Leu
340 345 350
Lys Arg Phe Phe Glu Leu Arg Glu Glu Val Lys Ala Phe Met Glu Lys
355 360 365
Asn Gly Lys Ala Val Ser Glu Leu Ser Asp His Lys Trp Leu Met Asp
370 375 380
Leu Ala Phe Leu Val Asp Ile Thr Gln Arg Leu Asn Val Leu Asn Lys
385 390 395 400
Met Leu Gln Gly Gln Gly Gln Leu Val Ser Ala Ala Tyr Asp Asn Val
405 410 415
Arg Ala Phe Ser Thr Lys Leu Val Leu Trp Lys Ser Gln Leu Ser Gln
420 425 430
Thr Asn Leu Cys His Phe Pro Ala Cys Lys Glu Leu Val Asp Ala Gly
435 440 445
Ile Pro Phe Ser Gly Glu Lys Tyr Val Asp Ala Ile Phe Lys Leu Glu
450 455 460
Lys Glu Phe Asp His Arg Phe Ala Asp Phe Lys Thr His Arg Ala Thr
465 470 475 480
Phe Gln Ile Phe Val Asp Pro Phe Ser Phe Asp Val Gln Asp Ala Pro
485 490 495
Pro Val Leu Gln Met Glu Leu Ile Asp Leu Gln Cys Asn Ser Asp Ile
500 505 510
Lys Ala Lys Phe Arg Glu Met Ser Gly Lys Ala Asp Thr His Val Gln
515 520 525
Phe Leu Arg Glu Leu Pro Pro Ser Phe Pro Glu Leu Ser Arg Met Phe
530 535 540
Lys Arg Thr Met Cys Leu Phe Gly Ser Thr Tyr Leu Cys Glu Lys Leu
545 550 555 560
Phe Ser Thr Leu Asn Phe Asn Lys Ser Lys Tyr Arg Ser Arg Leu Asn
565 570 575
Asp Asp His Leu Gln Ala Ile Leu Arg Val Ser Thr Ala Ser Ser Leu
580 585 590
Lys Pro Asn Val Val Gln Ile Cys Glu Lys Lys Arg Cys Gln Val Ser
595 600 605
Gly Ser Lys Glu
610
<210> 58
<211> 340
<212> PRT
<213> 热带爪蟾(Xenopus tropicalis)
<400> 58
Met Gly Lys Thr Lys Glu Leu Ser Lys Asp Val Arg Asp Lys Ile Val
1 5 10 15
Asp Leu His Lys Ala Gly Met Gly Tyr Lys Thr Ile Ser Lys Lys Leu
20 25 30
Gly Glu Lys Val Thr Thr Val Gly Ala Ile Val Arg Lys Trp Lys Glu
35 40 45
His Lys Met Thr Ile Asn Arg Pro Arg Ser Gly Ala Pro Arg Lys Ile
50 55 60
Ser Pro Arg Gly Val Ser Met Ile Leu Arg Lys Val Lys Lys His Pro
65 70 75 80
Arg Thr Thr Arg Glu Glu Leu Val Asn Asp Leu Lys Leu Ala Gly Thr
85 90 95
Thr Val Thr Lys Lys Thr Ile Gly Asn Thr Leu His Arg Asn Gly Leu
100 105 110
Lys Ser Cys Arg Ala Arg Lys Val Pro Leu Leu Lys Lys Ala His Val
115 120 125
Gln Ala Arg Leu Lys Phe Ala Asn Glu His Leu Asn Asp Ser Val Ser
130 135 140
Asp Trp Glu Lys Val Leu Trp Ser Asp Glu Thr Lys Ile Glu Leu Phe
145 150 155 160
Gly Ile Asn Ser Thr Arg Cys Val Trp Arg Lys Lys Asn Ala Ala Tyr
165 170 175
Asp Pro Gln Asn Thr Val Pro Thr Val Lys His Gly Gly Gly Asn Ile
180 185 190
Leu Leu Trp Gly Cys Phe Ser Ala Lys Gly Thr Gly Gln Leu Ile Arg
195 200 205
Ile Asn Gly Lys Met Asp Gly Ala Met Tyr Arg Glu Ile Leu Asn Asp
210 215 220
Asn Leu Leu Pro Ser Ala Arg Lys Leu Lys Met Gly Arg Gly Trp Val
225 230 235 240
Phe Gln His Asp Asn Asp Pro Lys His Thr Ala Lys Ala Thr Lys Glu
245 250 255
Trp Leu Lys Lys Lys His Ile Lys Val Met Glu Trp Pro Ser Gln Ser
260 265 270
Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Arg Glu Leu Lys Leu Arg
275 280 285
Val Ala Gln Arg Gln Pro Arg Asn Leu Arg Asp Leu Glu Met Ile Cys
290 295 300
Lys Glu Glu Trp Thr Asn Ile Pro Pro Lys Met Cys Ala Asn Leu Val
305 310 315 320
Ile Asn Tyr Lys Lys Arg Leu Thr Ser Val Leu Ala Asn Lys Gly Phe
325 330 335
Ser Thr Lys Tyr
340
<210> 59
<211> 616
<212> PRT
<213> 斑马鱼(Danio rerio)
<400> 59
Met Ala Glu Ser Gly Lys Arg Thr Ala Lys Arg Lys Tyr Glu Asp Glu
1 5 10 15
Arg Arg Thr Phe Leu Ser Glu Trp Glu Asp Leu Tyr Phe Phe Val Glu
20 25 30
Arg Asn Gly Lys Pro Phe Cys Leu Ile Cys Gln Thr Ser Leu Ser His
35 40 45
Phe Lys Ala Ser Asn Leu Glu Arg His Phe Thr Ser Leu His Ser Ala
50 55 60
Val Ala Arg Glu Phe Pro Lys Gly Ser Glu Leu Arg Lys His Lys Val
65 70 75 80
Lys Thr Leu Lys Gly Gln Ala Glu Lys Gln Thr Gln Leu Phe Arg Lys
85 90 95
Phe Thr Lys His Ser Glu Thr Val Thr Leu Ala Ser Tyr Gln Leu Ala
100 105 110
Trp Asn Ile Ala Arg Ala Lys Lys Pro Tyr Leu Glu Gly Glu Phe Val
115 120 125
Lys Lys Cys Leu Ser Asp Ala Val Ala Ile Leu Cys Pro Glu Asn Glu
130 135 140
Asn Leu Lys Arg Ser Val Lys Asp Leu Gln Leu Ser Arg His Thr Val
145 150 155 160
Glu Gln Arg Ile Ser Asp Ile Asp Asn Ser Val Glu Thr His Leu Leu
165 170 175
Ser Asp Leu Gln Lys Cys Gln Tyr Phe Ser Ile Ala Leu Asp Glu Ser
180 185 190
Cys Asp Val Gln Asp Lys Pro Gln Leu Ala Ile Phe Val Arg Phe Val
195 200 205
Ser Glu Asp Cys Thr Ile Arg Glu Glu Leu Leu Asp Ile Val Pro Leu
210 215 220
Lys Asp Arg Thr Arg Gly Ile Asp Leu Lys Glu Thr Leu Met Thr Val
225 230 235 240
Val Glu Lys Ala Asn Leu Gln Leu Ser Lys Leu Thr Ala Ile Val Thr
245 250 255
Asp Gly Ala Pro Ala Met Leu Gly Ser Glu Arg Gly Leu Val Gly Leu
260 265 270
Cys Lys Ala Asp Asp Arg Phe Pro Ala Phe Trp Thr Phe His Cys Ile
275 280 285
Ile His Gln Glu His Leu Val Ser Lys Lys Leu Asn Leu Asp His Ile
290 295 300
Met Lys Pro Val Leu Glu Ile Val Asn Phe Val Arg Thr His Ala Leu
305 310 315 320
Asn His Arg Gln Phe Lys Asn Leu Ile Asp Glu Leu Asp Glu Asp Leu
325 330 335
Pro Ser Asp Leu Leu Phe His Cys Ala Val Arg Trp Leu Ser Arg Gly
340 345 350
His Val Leu Ser Arg Phe Phe Glu Leu Leu Asn Pro Val Lys Leu Phe
355 360 365
Leu Ala Glu Lys His Lys Glu Tyr Pro Glu Leu His Asp Pro Gln Trp
370 375 380
Ile Ser Asp Leu Ala Phe Leu Val Asp Val Leu His Tyr Leu Asn Gly
385 390 395 400
Leu Asn Val Asp Leu Gln Gly Lys Leu Lys Met Leu Pro Asp Leu Val
405 410 415
Gln Ser Val Phe Ala Phe Val Asn Lys Leu Lys Leu Phe Lys Thr His
420 425 430
Leu Gln Lys Arg Asp Tyr Thr His Phe Pro Thr Leu Leu Lys Ala Ser
435 440 445
Gly Gln Glu Ala Glu Val Val Lys Gly Ser Thr Ala Arg Tyr Ala Thr
450 455 460
Leu Leu Glu Asn Leu Glu Gln Ser Phe Glu Glu Arg Phe Ser Asn Leu
465 470 475 480
Arg Gln Lys Arg Gln Gln Ile Thr Phe Leu Ile Asn Pro Phe Thr Ala
485 490 495
Glu Ser Gly Cys Leu Lys Ala Pro Leu Val Glu Asp Glu Ala Ala Ser
500 505 510
Gln Leu Glu Met Ile Glu Leu Ser Glu Asp Asp Arg Leu Lys Ser Val
515 520 525
Leu Arg Glu Gly Thr Val Glu Phe Trp Lys Ile Val Pro Val Glu Arg
530 535 540
Tyr Pro Asn Val Lys Gln Ala Ala Leu Lys Leu Leu Ser Met Phe Gly
545 550 555 560
Ser Thr Tyr Val Cys Glu Ser Leu Phe Ser Thr Leu Lys Leu Val Lys
565 570 575
Ser Lys His Arg Ser Val Leu Thr Asp Thr His Val Lys Glu Leu Leu
580 585 590
Arg Val Ala Thr Thr Glu Tyr Glu Pro Asp Leu Lys Lys Ile Val Glu
595 600 605
Thr Lys Glu Cys Gln Val Ser His
610 615
<210> 60
<211> 340
<212> PRT
<213> 红鳍东方鲀(Takifugu rubripes)
<400> 60
Met Gly Lys Thr Lys Glu Leu Ser Gln Asp Leu Arg Asp Arg Ile Val
1 5 10 15
Asp Leu His Lys Ser Gly Met Gly Tyr Lys Asn Ile Ser Lys Leu Leu
20 25 30
Gly Ile Lys Val Thr Thr Ile Gly Ala Ile Val Arg Lys Phe Lys Lys
35 40 45
Tyr Asn Met Thr Ile Asn Arg Pro Arg Ser Gly Ala Pro Gln Lys Ile
50 55 60
Ser Pro Arg Gly Val Ala Met Ile Met Arg Thr Val Arg Asn Arg Pro
65 70 75 80
Ala Thr Thr Gln Gln Glu Leu Val Asn Asp Leu Gln Ala Ala Gly Thr
85 90 95
Lys Val Thr Arg Lys Thr Ile Gly Asn Thr Leu Arg Arg Asn Gly Leu
100 105 110
Lys Ser Cys Ser Ala Arg Lys Val Pro Leu Leu Lys Lys Ala His Val
115 120 125
Glu Ala Arg Leu Lys Tyr Ala Asn Asp His Leu Lys Asp Ala Gln Ser
130 135 140
Asp Trp Glu Lys Val Leu Trp Ser Asp Glu Thr Lys Ile Glu Leu Phe
145 150 155 160
Gly Leu Asn Ser Thr Arg His Val Trp Arg Lys Lys Asn Ala Ala Tyr
165 170 175
Asp Pro Arg Asn Thr Val Pro Thr Val Lys His Gly Gly Gly Asn Ile
180 185 190
Met Phe Trp Gly Cys Phe Ser Ala Lys Gly Thr Gly Leu Leu His Arg
195 200 205
Ile Thr Gly Lys Met Asp Gly Ala Met Tyr Arg Ala Val Leu Arg Asp
210 215 220
Asn Leu Leu Pro Ser Ala Arg Lys Leu Lys Met Gly Arg Gly Trp Val
225 230 235 240
Phe Gln His Asp Asn Asp Pro Lys His Thr Ala Lys Ala Thr Lys Glu
245 250 255
Trp Leu Lys Lys Asn His Ile Lys Val Met Glu Trp Pro Ser Gln Ser
260 265 270
Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Arg Glu Leu Lys Val Arg
275 280 285
Val Ala Lys Arg Gln Pro Thr Asn Leu Asn Asp Leu Glu Arg Ile Cys
290 295 300
Lys Glu Glu Trp Ala Lys Ile Pro Pro Asp Met Cys Ala Asn Leu Val
305 310 315 320
Val Asn Tyr Asn Lys Arg Leu Thr Ala Val Leu Ala Asn Asn Gly Phe
325 330 335
Ala Thr Lys Tyr
340
<210> 61
<211> 358
<212> PRT
<213> 热带爪蟾(Xenopus tropicalis)
<400> 61
Met Ile Gly Tyr Lys Lys Ser Phe Ser Glu Trp Gln Cys Leu Ser Glu
1 5 10 15
Ala Lys Met Gly Arg Gly Ser Pro Ile Pro Thr Met Leu Arg Arg Lys
20 25 30
Ile Val Glu Gln Tyr Gln Lys Gly Val Thr Gln Arg Lys Ile Ala Lys
35 40 45
Ile Leu His Leu Ser Ser Ser Thr Val His Asn Ile Ile Arg Arg Phe
50 55 60
Arg Glu Ser Gly Thr Ile Ser Val Arg Lys Gly Gln Gly Arg Lys Thr
65 70 75 80
Ile Leu Asp Ala Arg Asp Leu Arg Ala Leu Lys Arg His Cys Thr Thr
85 90 95
Asn Arg Asn Ala Thr Val Lys Glu Ile Thr Glu Trp Ala Gln Glu Tyr
100 105 110
Phe Gln Lys Pro Leu Ser Val Asn Thr Ile His Arg Ala Ile Arg Arg
115 120 125
Cys Gln Leu Lys Leu Tyr Ser Ala Lys Lys Lys Pro Phe Leu Ser Lys
130 135 140
Ile His Lys Leu Arg Arg Phe His Trp Ala Arg Asp His Leu Lys Trp
145 150 155 160
Ser Val Ala Lys Trp Lys Thr Val Leu Trp Ser Asp Glu Ser Arg Phe
165 170 175
Glu Val Leu Phe Gly Asn Leu Gly Arg His Val Ile Arg Thr Lys Glu
180 185 190
Asp Lys Asp Asn Pro Ser Cys Tyr Gln Arg Ser Val Gln Lys Pro Ala
195 200 205
Ser Leu Met Val Trp Gly Cys Met Ser Ala Cys Gly Met Gly Ser Leu
210 215 220
His Val Trp Lys Gly Ser Ile Asn Ala Glu Lys Tyr Ile Gln Val Leu
225 230 235 240
Glu Gln His Met Leu Pro Ser Arg Arg His Leu Phe Gln Gly Arg Pro
245 250 255
Cys Ile Phe Gln Gln Asp Asn Ala Arg Pro His Ser Ala Ser Ile Thr
260 265 270
Thr Ser Trp Leu Arg Arg Arg Arg Ile Arg Val Leu Lys Trp Pro Val
275 280 285
Cys Ser Pro Asp Leu Ser Pro Ile Glu Asn Ile Trp Arg Ile Ile Lys
290 295 300
Arg Lys Val Arg Gln Arg Arg Pro Lys Thr Ile Glu Gln Leu Glu Ala
305 310 315 320
Cys Ile Arg Gln Glu Trp Glu Ser Ile Pro Ile Pro Lys Leu Glu Lys
325 330 335
Leu Val Ser Ser Val Pro Arg Arg Leu Leu Ser Val Val Arg Arg Arg
340 345 350
Gly Asp Ala Thr Gln Trp
355
<210> 62
<211> 339
<212> PRT
<213> 热带爪蟾(Xenopus tropicalis)
<400> 62
Met Lys Ser Lys Glu His Thr Arg Gln Val Arg Asp Lys Val Ile Glu
1 5 10 15
Lys Phe Lys Ala Gly Leu Gly Tyr Lys Lys Ile Ser Lys Ala Leu Asn
20 25 30
Ile Pro Arg Ser Thr Val Gln Ala Ile Ile Gln Lys Trp Lys Glu Tyr
35 40 45
Gly Thr Thr Val Asn Leu Pro Arg Gln Gly Arg Pro Pro Lys Leu Thr
50 55 60
Gly Arg Thr Arg Arg Ala Leu Ile Arg Asn Ala Ala Lys Arg Pro Met
65 70 75 80
Val Thr Leu Asp Glu Leu Gln Arg Ser Thr Ala Gln Val Gly Glu Ser
85 90 95
Val His Arg Thr Thr Ile Ser Arg Ala Leu His Lys Val Gly Leu Tyr
100 105 110
Gly Arg Val Ala Arg Arg Lys Pro Leu Leu Thr Glu Asn His Lys Lys
115 120 125
Ser Arg Leu Gln Phe Ala Thr Ser His Val Gly Asp Thr Ala Asn Met
130 135 140
Trp Lys Lys Val Leu Trp Ser Asp Glu Thr Lys Met Glu Leu Phe Gly
145 150 155 160
Gln Asn Ala Lys Arg Tyr Val Trp Arg Lys Thr Asn Thr Ala His His
165 170 175
Ser Glu His Thr Ile Pro Thr Val Lys Tyr Gly Gly Gly Ser Ile Met
180 185 190
Leu Trp Gly Cys Phe Ser Ser Ala Gly Thr Gly Lys Leu Val Arg Val
195 200 205
Asp Gly Lys Met Asp Gly Ala Lys Tyr Arg Ala Ile Leu Glu Glu Asn
210 215 220
Leu Leu Glu Ser Ala Lys Asp Leu Arg Leu Gly Arg Arg Phe Thr Phe
225 230 235 240
Gln Gln Asp Asn Asp Pro Lys His Lys Ala Arg Ala Thr Met Glu Trp
245 250 255
Phe Lys Thr Lys His Ile His Val Leu Glu Trp Pro Ser Gln Ser Pro
260 265 270
Asp Leu Asn Pro Ile Glu Asn Leu Trp Gln Asp Leu Lys Thr Ala Val
275 280 285
His Lys Arg Cys Pro Ser Asn Leu Thr Glu Leu Glu Leu Phe Cys Lys
290 295 300
Glu Glu Trp Ala Arg Ile Ser Val Ser Arg Cys Ala Lys Leu Val Glu
305 310 315 320
Thr Tyr Pro Lys Arg Leu Ala Ala Val Ile Ala Ala Lys Gly Gly Ser
325 330 335
Thr Lys Tyr
<210> 63
<211> 333
<212> PRT
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 63
Met Gly Arg Ser Ala His Ser Thr Gln Gln Gln Arg Leu Asp Ile Lys
1 5 10 15
Arg Leu Ser Ala Ala Gly Tyr Ser Gln Arg Lys Ile Ala Glu Ile Leu
20 25 30
Gly Arg Ser Lys Thr Phe Val Tyr Asn Ala Leu His Ser Thr Gly Thr
35 40 45
Lys Ile Pro Thr Gly Arg Pro Arg Lys Thr Ser Ala Arg Asp Asp Ala
50 55 60
Arg Met Thr Arg Leu Cys Lys Ala Asp Pro Phe Lys Ser Ala Arg Ala
65 70 75 80
Ile Arg Asp Glu Leu Gln Leu Ser Val Ser Asp Arg Thr Val Gln Arg
85 90 95
Arg Leu Phe Glu Asn Asn Leu Val Gly Arg Asn Pro Arg Lys Val Pro
100 105 110
Leu Leu Arg Arg Cys His Val Gln Ala Arg Leu Gln Phe Ala Arg Glu
115 120 125
His Tyr Asp Trp Ala Gly Glu Asn Leu Asn Lys Trp Arg Asn Val Leu
130 135 140
Trp Ser Asp Glu Ser Lys Val Asn Leu Val Gly Ser Asp Gly Lys Arg
145 150 155 160
Phe Val Arg Arg Pro Lys Asn Thr Ala Tyr Arg Pro Gln Tyr Thr Leu
165 170 175
Lys Thr Val Lys His Gly Gly Gly Asn Ile Met Val Trp Ala Cys Phe
180 185 190
Ser Trp Tyr Gly Val Gly Pro Ile Phe Trp Ile Lys Asp Ile Met Asp
195 200 205
Gln His Arg Tyr Leu Asn Ile Ile Gln Thr Val Met Leu Pro His Ala
210 215 220
Glu Trp Glu Met Pro Leu Lys Trp Gln Phe Met His Asp Asn Asp Pro
225 230 235 240
Lys His Thr Ala Lys Ala Val Lys Lys Trp Phe Val Asp Gln Lys Ile
245 250 255
Asp Val Met Asn Trp Pro Ala Gln Ser Pro Asp Leu Asn Pro Ile Glu
260 265 270
Asn Leu Trp Lys Ile Val Lys Ala Lys Leu Pro Pro Ala Gly Ser Arg
275 280 285
Thr Lys Glu Lys Leu Trp Lys His Ile Glu Asn Ala Trp Tyr Ser Ile
290 295 300
Pro Pro Ser Thr Cys Lys Ser Leu Val Glu Ser Met Pro Lys Arg Met
305 310 315 320
Arg Ala Val Ile Arg Asn Asn Gly His Ala Thr Lys Tyr
325 330
<210> 64
<211> 340
<212> PRT
<213> 非洲爪蟾(Xenopus laevis)
<400> 64
Met Pro Arg Ser Lys Glu Ile Gln Glu Gln Met Arg Thr Lys Val Ile
1 5 10 15
Glu Ile Tyr Gln Ser Gly Lys Gly Tyr Lys Ala Ile Ser Lys Ala Leu
20 25 30
Gly Leu Gln Arg Thr Thr Val Arg Ala Ile Ile His Lys Trp Gln Lys
35 40 45
His Gly Thr Val Val Asn Leu Pro Arg Ser Gly Arg Pro Thr Lys Ile
50 55 60
Thr Pro Arg Ala Gln Arg Gln Leu Ile Arg Glu Ala Thr Lys Asp Pro
65 70 75 80
Arg Thr Thr Ser Lys Glu Leu Gln Ala Ser Leu Ala Ser Ile Lys Val
85 90 95
Ser Val His Asp Ser Thr Ile Arg Lys Arg Leu Gly Lys Asn Gly Leu
100 105 110
His Gly Arg Phe Pro Arg Arg Lys Pro Leu Leu Ser Lys Lys Asn Ile
115 120 125
Lys Ala Arg Leu Asn Phe Ala Lys Lys His Leu Asn Asp Cys Gln Asp
130 135 140
Phe Trp Glu Asn Thr Leu Trp Thr Asp Glu Thr Lys Val Glu Leu Phe
145 150 155 160
Gly Arg Cys Val Ser Arg Tyr Ile Trp Arg Lys Ser Asn Thr Ala Phe
165 170 175
Gln Lys Lys Asn Ile Ile Pro Thr Val Lys Tyr Gly Gly Gly Ser Val
180 185 190
Met Val Trp Gly Cys Phe Ala Ala Ser Gly Pro Gly Arg Leu Ala Val
195 200 205
Ile Asp Gly Thr Met Asn Ser Thr Val Tyr Gln Lys Ile Leu Lys Glu
210 215 220
Asn Val Arg Pro Ser Val Arg Gln Leu Lys Leu Lys Arg Ser Trp Val
225 230 235 240
Leu Gln Gln Asp Asn Asp Pro Lys His Thr Ser Lys Ser Thr Ser Glu
245 250 255
Trp Leu Lys Lys Asn Lys Met Lys Thr Leu Glu Trp Pro Ser Gln Ser
260 265 270
Pro Asp Leu Asn Pro Ile Glu Met Leu Trp His Asp Leu Lys Lys Ala
275 280 285
Val His Ala Arg Lys Pro Ser Asn Lys Ala Glu Leu Gln Gln Phe Cys
290 295 300
Lys Asp Glu Trp Ala Lys Ile Pro Pro Glu Arg Cys Lys Arg Leu Val
305 310 315 320
Ala Ser Tyr Arg Lys Arg Leu Ile Ala Val Ile Ala Ala Lys Gly Gly
325 330 335
Pro Thr Ser Tyr
340
<210> 65
<211> 332
<212> PRT
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 65
Met Gly Arg Gly Lys His Cys Thr Pro Glu Glu Arg Lys His Ile Gln
1 5 10 15
Gly Leu Tyr Arg Glu Asn Val Pro Ile Lys Thr Ile Cys Lys Ala Phe
20 25 30
Gly Arg Ser Arg Thr Phe Val Asp Asn Ala Ile Arg Ser Glu Ala Thr
35 40 45
Gly Lys Ser Thr Gly Arg Pro Arg Lys Thr Thr Ala Asp Val Asp Ala
50 55 60
Gln Ile Val Glu Met Ile Arg Ala Asp Pro Phe Lys Thr Cys Thr Arg
65 70 75 80
Ile Lys Gln Glu Leu Gly Leu Gln Val Ser Ala Lys Thr Val Ser Arg
85 90 95
Arg Leu His Ala Ala Gly Phe Cys Ala Arg Arg Pro Arg Lys Val Arg
100 105 110
Lys Leu Leu Pro His His Val Glu Ala Arg Ile Arg Phe Ala Glu Glu
115 120 125
His Leu Ala Ala Ser Ile Phe Trp Trp Ser Lys Ile Ile Phe Ser Asp
130 135 140
Glu Ser Arg Ile Asn Leu Asp Gly Ser Asp Gly Ile Lys Tyr Val Trp
145 150 155 160
Arg Phe Pro Asn Gln Ala Tyr His Pro Lys Asn Thr Ile Lys Thr Leu
165 170 175
Ser His Gly Gly Gly His Val Met Val Trp Gly Cys Phe Ser Trp His
180 185 190
Gly Thr Gly Pro Leu Phe Arg Ile Asn Gly Thr Leu Asn Ser Glu Gly
195 200 205
Tyr Arg Lys Ile Leu Ser Arg Lys Met Leu Pro Tyr Ala Arg Gln Gln
210 215 220
Phe Gly Asp Glu Glu His Tyr Ile Phe Gln His Asp Asn Asp Ser Lys
225 230 235 240
His Thr Ser Arg Thr Val Lys Cys Tyr Leu Ala Asn Gln Asp Val Gln
245 250 255
Val Leu Pro Trp Pro Ala Leu Ser Pro Asp Leu Asn Pro Ile Glu Asn
260 265 270
Leu Trp Ser Thr Leu Lys Arg Gln Leu Lys Asn Gln Pro Ala Arg Ser
275 280 285
Ala Asp Asp Leu Trp Thr Arg Cys Lys Val Met Trp Glu Arg Ile Pro
290 295 300
Arg Ser Glu Cys Arg Asn Leu Ile Gly Asp Met Ala Lys Arg Cys Gln
305 310 315 320
Glu Val Ile Ala Asn Asn Gly His Gln Ile Asp Arg
325 330
<210> 66
<211> 346
<212> PRT
<213> 热带爪蟾(Xenopus tropicalis)
<400> 66
Met Gly Lys Lys Gly Asp Leu Ser Asn Phe Glu Arg Gly Met Val Val
1 5 10 15
Gly Ala Arg Arg Ala Gly Leu Ser Ile Ser Gln Ser Ala Gln Leu Leu
20 25 30
Gly Phe Ser Arg Thr Thr Ile Ser Arg Val Tyr Lys Glu Trp Cys Glu
35 40 45
Lys Gly Lys Thr Ser Ser Met Arg Gln Ser Cys Gly Arg Lys Cys Leu
50 55 60
Val Asp Ala Arg Gly Gln Arg Arg Met Gly Arg Leu Ile Gln Ala Asp
65 70 75 80
Arg Arg Ala Thr Leu Thr Glu Ile Thr Thr Arg Tyr Asn Arg Gly Met
85 90 95
Gln Gln Ser Ile Cys Glu Ala Thr Thr Arg Thr Thr Leu Arg Arg Met
100 105 110
Gly Tyr Asn Ser Arg Arg Pro His Arg Val Pro Leu Ile Ser Thr Thr
115 120 125
Asn Arg Lys Lys Arg Leu Gln Phe Ala Gln Ala His Gln Asn Trp Thr
130 135 140
Val Glu Asp Trp Lys Asn Val Ala Trp Ser Asp Glu Ser Arg Phe Leu
145 150 155 160
Leu Arg His Ser Asn Gly Arg Val Arg Ile Trp Arg Lys Gln Asn Glu
165 170 175
Asn Met Asp Pro Ser Cys Leu Val Thr Thr Val Gln Ala Gly Gly Gly
180 185 190
Gly Val Met Val Trp Gly Met Phe Ser Trp His Thr Leu Gly Pro Leu
195 200 205
Val Pro Ile Gly His Arg Leu Asn Ala Thr Ala Tyr Leu Ser Ile Val
210 215 220
Ser Asp His Val His Pro Phe Met Thr Thr Met Tyr Pro Ser Ser Asp
225 230 235 240
Gly Tyr Phe Gln Gln Asp Asn Ala Pro Cys His Lys Ala Arg Ile Ile
245 250 255
Ser Asn Trp Phe Leu Glu His Asp Asn Glu Phe Thr Val Leu Lys Trp
260 265 270
Pro Pro Gln Ser Pro Asp Leu Asn Pro Ile Glu His Leu Trp Asp Val
275 280 285
Val Glu Arg Glu Leu Arg Ala Leu Asp Val His Pro Thr Asn Leu His
290 295 300
Gln Leu Gln Asp Ala Ile Leu Ser Ile Trp Ala Asn Ile Ser Lys Glu
305 310 315 320
Cys Phe Gln His Leu Val Glu Ser Met Pro Arg Arg Ile Lys Ala Val
325 330 335
Leu Lys Ala Lys Gly Gly Gln Thr Pro Tyr
340 345
<210> 67
<211> 602
<212> PRT
<213> 海七鳃鳗(Petromyzon marinus)
<400> 67
Met Ala Thr Lys Lys Arg Lys Val Asp Ala Glu Cys Arg Val Phe Asn
1 5 10 15
Glu Glu Trp Gly Val Lys Tyr Phe Phe Val Glu Thr Lys Asp Gln Lys
20 25 30
Ala Ser Cys Val Ile Cys Ser Glu Ser Val Ala Val Leu Lys Glu Tyr
35 40 45
Asn Leu Arg Arg His Tyr Glu Thr Lys His Leu Ser Thr Tyr Ser Lys
50 55 60
Phe Ser Gly Lys Leu Arg Ser Glu Lys Tyr Glu Ser Met Lys Arg Gly
65 70 75 80
Leu Glu Thr Gln Arg Asn Leu Phe Thr Arg Lys Phe Ala Glu Asn Glu
85 90 95
Ser Val Thr Arg Thr Ser Tyr Lys Ile Val His Lys Met Ala Glu Arg
100 105 110
Gly Lys Pro Phe Thr Asp Gly Asn Phe Ile Lys Glu Cys Met Met Glu
115 120 125
Ala Ala Asn Asp Leu Cys Pro Glu Arg Ala Asp Leu Phe Gly Ser Ile
130 135 140
Ser Leu Ser Ala Ser Ser Val Val Arg Arg Thr Glu Glu Leu Gly Glu
145 150 155 160
Asn Ile Val Leu Gln Ile Arg Glu Lys Ala Arg Asn Leu Leu Trp Tyr
165 170 175
Ser Leu Ala Leu Asp Glu Ser Thr Asp Leu Ser Ser Thr Ser Gln Leu
180 185 190
Leu Val Phe Ile Arg Gly Val Asn Leu Asp Phe Gln Ile Thr Glu Glu
195 200 205
Leu Ala Ser Val Cys Ser Met His Gly Thr Thr Thr Gly Lys Asp Ile
210 215 220
Phe Met Glu Val Gln Lys Thr Leu Gln Asp Tyr Asn Leu Gln Trp Asn
225 230 235 240
Gln Leu Arg Gly Val Thr Val Asp Gly Gly Lys Asn Met Ala Gly Val
245 250 255
Arg Lys Gly Leu Val Gly Gln Ile Arg Thr Gln Leu Glu Asp Leu Gln
260 265 270
Ile Pro Gly Ala Leu Phe Ile His Cys Ile Ile His Gln Gln Ala Leu
275 280 285
Cys Gly Lys Asp Leu Asp Ile Ser Cys Val Leu Lys Pro Val Val Ser
290 295 300
Ala Val Asn Phe Ile Arg Gly His Ala Leu Asn His Arg Gln Phe Gln
305 310 315 320
Ala Phe Leu Glu Glu Met Asp Ser Asp Phe Cys Asp Leu Pro Tyr His
325 330 335
Thr Ala Val Arg Trp Leu Ser Cys Gly Lys Val Leu Phe Arg Phe Tyr
340 345 350
Lys Leu Arg Asn Glu Ile Asp Val Phe Leu Thr Glu Lys Asp Arg Ala
355 360 365
Asp Pro Gln Leu Ser Asp Pro Thr Trp Leu Ser Lys Leu Ser Phe Leu
370 375 380
Val Asp Ile Thr Ser His Met Asn Glu Leu Asn Leu Lys Leu Gln Gly
385 390 395 400
Lys Asp Asn Leu Val Cys Asp Leu Tyr Arg Ile Ile Lys Gly Phe Arg
405 410 415
Arg Lys Leu Ser Leu Phe Glu Ala Gln Leu Glu Gly Glu Asn Phe Ser
420 425 430
His Phe His Cys Phe Lys Glu Phe Cys Ala Thr Ile Ala Glu Asp Val
435 440 445
Asn Leu Asp Phe Pro Lys Lys Ile Ile Arg Asp Leu Lys Lys His Phe
450 455 460
Leu Lys Arg Phe Ser Asp Leu Asp Arg Ile Glu Ser Asp Ile Leu Leu
465 470 475 480
Phe Gln Asn Pro Phe Asp Cys Asn Leu Asp Asp Val Pro Val Glu Leu
485 490 495
Gln Leu Glu Leu Ile Asp Leu Gln Ala Asn Asp Leu Leu Lys Glu Lys
500 505 510
His Arg Glu Gly Lys Leu Val Glu Phe Tyr Arg Cys Leu Pro Asp Val
515 520 525
Glu Phe Pro Lys Leu Lys Lys Phe Ala Ala Gly Met Ala Ser Val Phe
530 535 540
Gly Thr Thr Tyr Val Cys Glu Gln Thr Phe Ser Lys Met Lys Tyr Val
545 550 555 560
Lys Ser Thr His Arg Thr Arg Leu Thr Asp Glu His Leu Lys Ala Ile
565 570 575
Leu Leu Ile Gly Cys Ser Asn Ser Lys Pro Asn Ile Asp Asp Ile Leu
580 585 590
Lys Ala Lys Arg Gln Phe His Lys Ser His
595 600
<210> 68
<211> 340
<212> PRT
<213> 海七鳃鳗(Petromyzon marinus)
<400> 68
Met Ala Lys Thr Lys Glu Leu Ser Lys Asp Val Arg Asp Lys Ile Val
1 5 10 15
Asp Leu His Lys Ala Gly Met Gly Tyr Lys Thr Ile Ala Lys Gln Leu
20 25 30
Gly Glu Lys Val Thr Thr Val Gly Ala Ile Ile Arg Lys Trp Lys Lys
35 40 45
His Lys Arg Thr Val Asn Leu Pro Arg Pro Gly Ala Pro Cys Lys Ile
50 55 60
Ser Pro Arg Gly Val Ala Met Ile Met Arg Thr Val Arg Asn Gln Pro
65 70 75 80
Arg Thr Thr Arg Glu Asp Leu Val Asn Asp Leu Lys Ala Ala Gly Thr
85 90 95
Ile Val Thr Lys Lys Thr Ile Gly Asn Thr Leu Arg Arg Glu Gly Leu
100 105 110
Lys Ser Cys Ser Ala Arg Lys Val Pro Leu Leu Lys Lys Ala His Ile
115 120 125
His Ala Arg Leu Lys Phe Ala Asn Glu His Leu Asn Asp Ser Glu Asp
130 135 140
Asn Trp Val Lys Val Leu Trp Ser Asp Glu Thr Lys Met Glu Leu Phe
145 150 155 160
Gly Ile Asn Ser Thr Arg Arg Val Trp Arg Arg Arg Asn Ala Ala Tyr
165 170 175
Asp Pro Lys Asn Thr Ile Pro Thr Val Lys His Gly Gly Gly Asn Ile
180 185 190
Met Leu Trp Gly Cys Phe Ser Ala Lys Gly Thr Gly Gln Leu His Arg
195 200 205
Ile Lys Gly Thr Met Asp Gly Ala Met Tyr Arg Gln Ile Leu Gly Glu
210 215 220
Asn Leu Leu Pro Ser Ala Arg Ala Leu Lys Met Gly Arg Gly Trp Val
225 230 235 240
Phe Gln His Asp Asn Asp Pro Lys His Thr Ala Lys Ala Thr Lys Glu
245 250 255
Trp Leu Lys Lys Lys His Ile Lys Val Leu Glu Trp Pro Ser Gln Ser
260 265 270
Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Arg Glu Leu Lys Val Arg
275 280 285
Val Ala Lys Arg Gln Pro Arg Asn Leu Asn Asp Leu Glu Lys Ile Cys
290 295 300
Lys Glu Glu Trp Asp Lys Ile Pro Pro Glu Met Cys Ala Asn Leu Val
305 310 315 320
Ala Asn Tyr Lys Lys Arg Leu Thr Ser Val Ile Ala Asn Lys Gly Phe
325 330 335
Ala Thr Lys Tyr
340
<210> 69
<211> 550
<212> PRT
<213> 密河鳄(Alligator mississippiensis)
<400> 69
Met Ser Ala Lys Arg Lys Ser Met Thr Ser Pro Gly Gly Ser Ala Lys
1 5 10 15
Lys Gln Arg Lys Ala Ile Asp Leu Glu Met Lys Met Lys Ile Ile Asn
20 25 30
Asp Tyr Glu Ala Gly Lys Lys Val Lys Ala Ile Ala Arg Asp Leu Glu
35 40 45
Leu Ala His Ser Thr Ile Ser Thr Ile Leu Lys Asp Lys Asp Arg Val
50 55 60
Lys Glu Ala Val Gln Ala Ser Thr Gly Phe Lys Ala Ile Ile Thr Arg
65 70 75 80
Gln Arg Lys Gly Leu Ile His Glu Met Glu Lys Leu Leu Ala Ile Trp
85 90 95
Phe Asp Asp Gln Ile Gln Lys Arg Met Pro Met Ser Leu Leu Ile Ile
100 105 110
Gln Ala Lys Ala Arg Ser Ile Phe Glu Thr Leu Lys Ala Arg Glu Gly
115 120 125
Glu Glu Ser Thr Glu Thr Phe Thr Ala Ser Arg Gly Trp Phe Gln Arg
130 135 140
Phe Arg Arg Arg Phe Asn Val His Asn Arg Ser Ile Ser Gly Glu Ala
145 150 155 160
Ala Ser Ala Asp Val Glu Ala Ala Glu Lys Phe Val Asp Gln Phe Asp
165 170 175
Glu Ile Ile Glu Lys Gly Gly Tyr Arg Pro Glu Gln Ile Phe Asn Val
180 185 190
Asp Glu Thr Gly Leu Phe Trp Lys Lys Met Pro Glu Arg Ser Tyr Ile
195 200 205
His Lys Glu Ala Lys Ala Met Pro Gly Phe Lys Ala Phe Lys Asp Arg
210 215 220
Val Thr Leu Leu Leu Gly Gly Asn Val Ala Gly Phe Lys Leu Lys Pro
225 230 235 240
Phe Leu Ile His Arg Ser Glu Asn Pro Arg Ala Leu Lys Gln Val Ser
245 250 255
Lys His Thr Leu Pro Val Tyr Tyr Arg Ala Asn Ser Lys Ala Trp Met
260 265 270
Thr Gln Ala Leu Phe Glu Asp Trp Phe Ile Asn Cys Phe Ile Pro Ser
275 280 285
Val Lys His Tyr Cys Leu Glu Lys Gly Val Pro Phe Lys Ile Ile Leu
290 295 300
Leu Leu Asp Asn Ala Pro Gly His Pro Gln His Leu Asp Asp Leu His
305 310 315 320
Pro Asp Val Lys Val Val Tyr Leu Pro Lys Asn Thr Thr Ala Ile Leu
325 330 335
Gln Pro Met Asp Gln Gly Ala Ile Ala Thr Phe Lys Val Tyr Tyr Leu
340 345 350
Arg Ala Thr Phe Ser Lys Ala Val Ala Ala Thr Glu Ser Asp Glu Val
355 360 365
Thr Leu Arg Asp Phe Trp Lys Ser Tyr Asn Ile Leu His Cys Ile Lys
370 375 380
Asn Ile Glu Ser Ala Trp Glu Gly Val Thr Glu Lys Cys Met Gln Gly
385 390 395 400
Ile Trp Lys Lys Cys Leu Lys Val Phe Val Asn Asn Phe Glu Gly Phe
405 410 415
Asp Lys Asp Glu His Val Asp Val Ile Asn Lys Lys Ile Val Glu Leu
420 425 430
Ala Asn Val Leu Asn Leu Asp Val Glu Val Lys Asp Ile Glu Glu Leu
435 440 445
Val Glu Tyr Val Glu Gly Glu Leu Thr Asn Glu Asp Leu Ile Glu Leu
450 455 460
Glu Ala Gln Gln His Leu Glu Glu Glu Glu Glu Glu Glu Glu Glu Arg
465 470 475 480
Met Glu Glu Val Gln Lys Lys Phe Thr Val Asn Gly Leu Ala Gly Val
485 490 495
Phe Ser Lys Val Asn Ala Ala Ile Leu Glu Leu Glu Gly Met Asp Pro
500 505 510
Asn Val Glu Arg Phe Thr Lys Val Glu Arg Gln Met Asn Glu Leu Leu
515 520 525
Arg Cys Tyr Cys Glu Ile Tyr Glu Glu Lys Lys Lys Lys Lys Arg Lys
530 535 540
Leu Gln Ser Arg Pro His
545 550
<210> 70
<211> 643
<212> PRT
<213> 小棕蝠(Myotis lucifugus)
<400> 70
Met Glu Asn Gln Lys Asn Lys Lys Ala Arg Leu Asn Asp Lys Gly Ser
1 5 10 15
Gly Ser Ser Ser Ser Arg Pro Phe Gln Asp Ile Trp Thr Glu Met Tyr
20 25 30
Gly Ile Val Asp Arg Asn Asn Arg Ser Leu Cys Ile Leu Cys Asn Glu
35 40 45
Thr Val Val Ser Arg Thr Trp Asn Val Lys Arg His Phe Glu Thr Asn
50 55 60
His Cys Gln Leu Leu Lys Lys Ser Ile Asp Glu Arg Lys Glu Tyr Ile
65 70 75 80
Ser Arg Gln Leu His Leu Tyr Lys Ser Gln Ser Asn Ser Ile Ile Lys
85 90 95
Phe Val Arg Cys Ser Thr Asn Leu Thr Ser Ala Ser Tyr Cys Ile Ala
100 105 110
His Ser Ile Ala Gln His Gly Lys Ala Leu Ser Asp Gly Glu Phe Ile
115 120 125
Lys Glu Thr Phe Leu Arg Cys Ala Pro Ala Leu Phe His Asp Met Lys
130 135 140
Asn Lys Asp Asp Ile Ile Lys Arg Ile Ser Glu Leu Pro Leu Ser Arg
145 150 155 160
Asn Thr Ile Lys Asp Arg Ile Ile Asp Leu Asn Lys Asn Val Gln His
165 170 175
Gln Leu Lys Lys Asp Leu Asn Ser Cys Lys Tyr Phe Ser Ile Ser Leu
180 185 190
Asp Glu Thr Thr Asp Val Thr Ser Asn Ala Arg Leu Ala Ile Ile Ala
195 200 205
Arg Tyr Ser Asp Gly Leu Thr Met Arg Glu Glu Leu Ile Lys Leu Glu
210 215 220
Ser Val Pro Ile Ser Thr Ser Gly Asn Glu Ile Cys Lys Val Val Ile
225 230 235 240
Lys Thr Phe Ser Asp Leu Asn Ile Asp Ile Ser Lys Ile Val Ser Val
245 250 255
Thr Thr Asp Gly Ala Pro Asn Met Val Gly Lys Asn Val Gly Phe Leu
260 265 270
Lys Leu Phe Met Glu Ala Ile Arg His Pro Leu Val Pro Phe His Cys
275 280 285
Ile Ile His Gln Glu Val Leu Cys Ala Lys Ser Gly Phe Ser Glu Leu
290 295 300
Asn Asp Leu Met Ser Val Val Thr Lys Ile Val Asn Phe Ile Ala Ser
305 310 315 320
Arg Pro Leu His Lys Arg Glu Phe Ser Ala Leu Leu Gln Glu Val Asp
325 330 335
Ser Thr Tyr Ser Gly Leu Leu Met Phe Asn Asn Val Arg Trp Leu Ser
340 345 350
Arg Gly Lys Val Leu Glu Arg Phe Val Glu Cys Phe Glu Glu Ile Thr
355 360 365
Val Phe Ile Glu Asn Lys Asp Leu Ala Asn Phe Pro Gln Ile Asn Asp
370 375 380
His Lys Trp Val Ser Asn Leu Met Phe Phe Thr Asp Leu Ser Val His
385 390 395 400
Met Asn Glu Leu Asn Leu Lys Leu Gln Gly Phe Gly Lys Ser Ile Asp
405 410 415
Val Met Phe Gly Tyr Ile Lys Ser Phe Glu Ser Lys Leu Lys Ile Phe
420 425 430
Lys Arg Asp Ile Glu Thr Lys Thr Tyr Lys Tyr Phe Pro Arg Ile Lys
435 440 445
Lys Tyr Phe Glu Lys Ala Thr Thr Thr Ser Val Met Glu Ser Ile Leu
450 455 460
Met Tyr Gln Asn Ile Val Asn Ser Leu Phe Glu Gln Phe Ser Glu Arg
465 470 475 480
Phe Asp Gln Phe Arg Ser Leu Glu Gln Thr Ile Lys Ile Ile Lys Tyr
485 490 495
Pro Asp Val Val Val Tyr Ser Thr Leu Glu Leu Lys Asp Phe Gln Trp
500 505 510
Met Gln Ile Asp Asp Leu Glu Met Gln Leu Ala Asp Phe Gln Gly Ser
515 520 525
Ile Trp Thr His Val Phe Val Asp Leu Arg Ser Lys Leu Glu Asn Leu
530 535 540
Glu Arg Asn Arg Leu Asn Asn Glu Glu Glu Cys Asn Tyr Glu Gln Glu
545 550 555 560
Ile Leu Ser Ala Trp Asn Arg Val Pro Asp Thr Phe Ser Asp Ile Lys
565 570 575
Asn Leu Ala Met Ala Leu Leu Thr Ile Phe Ser Ser Thr Tyr Phe Cys
580 585 590
Glu Thr Leu Phe Ser Ala Leu Asn Asn Ile Lys Thr Asn Lys Arg Asn
595 600 605
Arg Leu Thr Asp Glu Val Ser Gly Ala Cys Leu Ala Leu Lys Cys Thr
610 615 620
Lys Tyr Glu Pro Ala Ile Glu Glu Leu Ala Asp Lys Leu Gln His Gln
625 630 635 640
Lys Ser His
<210> 71
<211> 602
<212> PRT
<213> 海七鳃鳗(Petromyzon marinus)
<400> 71
Met Ser Gly Ser Arg Lys Arg Lys Val Asp Asn Glu Cys Arg Val Phe
1 5 10 15
Asn Thr Glu Trp Thr Thr Lys Tyr Phe Phe Thr Glu Val Gln Ser Lys
20 25 30
Ala Val Cys Leu Ile Cys Arg Glu Thr Val Ala Val Phe Lys Glu Tyr
35 40 45
Asn Ile Ser Arg His Phe Ala Thr Lys His Ala Asn Tyr Ala Ser Lys
50 55 60
Gln Ser Thr Gln Glu Arg Ala Ala Thr Ala Gln Arg Leu Ala Ala Asn
65 70 75 80
Leu Gln Thr Gln Gln His Phe Phe His Arg Gln Thr Ala Ile Gln Glu
85 90 95
Ser Thr Thr Lys Ala Ser Phe Leu Val Ala Phe Glu Ile Ala Lys Ala
100 105 110
Ser Lys Pro Phe Ser Glu Gly Glu Phe Val Lys Glu Cys Met Val Gln
115 120 125
Thr Ala Asp Ile Leu Cys Pro Glu Ile Lys Ser Lys Phe Glu Lys Val
130 135 140
Ser Leu Ser Arg Arg Thr Val Thr Arg Arg Val Glu Leu Ile Asp Glu
145 150 155 160
Asn Ile Ala Ser Gln Leu Asn Lys Lys Ser Asp Ser Phe Glu Leu Tyr
165 170 175
Ser Leu Ala Leu Asp Glu Ser Thr Asp Val Lys Asp Thr Ala Gln Leu
180 185 190
Leu Ile Phe Ile Arg Gly Ile Asp Asp Ser Phe Ala Ile Thr Glu Glu
195 200 205
Phe Leu Thr Met Glu Ser Leu Lys Gly Thr Thr Arg Gly Glu Asp Leu
210 215 220
Tyr Asn Gln Val Ser Ala Val Ile Glu Arg Met Lys Leu Pro Trp Ser
225 230 235 240
Lys Leu Val Asn Val Thr Thr Asp Gly Ser Pro Asn Leu Thr Gly Lys
245 250 255
Asn Val Gly Leu Leu Lys Arg Ile Gln Asn Lys Val Lys Glu Glu Asn
260 265 270
Pro Asp Gln Asp Leu Ile Phe Leu His Cys Ile Ile His Gln Glu Ser
275 280 285
Leu Cys Lys Ser Val Leu Gln Leu Asn His Val Val Asn Pro Ala Val
290 295 300
Lys Leu Val Asn Phe Ile Arg Ala Arg Gly Leu Gln His Arg Gln Phe
305 310 315 320
Ile Thr Phe Leu Glu Glu Thr Asp Ala Asp His Gln Asp Leu Leu Tyr
325 330 335
His Ser Arg Val Arg Trp Leu Ser Leu Gly Lys Val Leu Gln Arg Val
340 345 350
Trp Glu Leu Lys Glu Asp Ile Ile Ala Phe Leu Glu Leu Met Gly Lys
355 360 365
Ser Asp Glu Phe Pro Glu Leu Ser Asp Lys Asn Trp Leu Ser Asp Phe
370 375 380
Ala Phe Ala Val Asp Ile Phe Ser His Met Asn Glu Leu Asn Val Lys
385 390 395 400
Leu Gln Gly Lys Asp Gln Phe Val His Asp Met Tyr Lys His Val Lys
405 410 415
Ala Phe Lys Ser Lys Leu Thr Leu Phe Ser Arg Gln Ile Ala Asn Lys
420 425 430
Ser Phe Ala His Phe Pro Thr Leu Ala Met Gln Glu Glu Ala Pro Arg
435 440 445
Asn Ala Lys Lys Tyr Ser Lys Ser Leu Glu Asp Leu His Gly Glu Phe
450 455 460
Cys Arg Arg Phe Ser Asp Phe Glu Asn Ile Glu Gln Ser Leu Gln Leu
465 470 475 480
Val Ser Cys Pro Leu Ser Gln Asp Ser Glu Thr Ala Pro Gln Glu Leu
485 490 495
Gln Leu Glu Leu Ile Asp Leu Gln Ser Asp Ser Val Leu Lys Glu Lys
500 505 510
Phe Asn Ser Val Lys Leu Asn Asp Phe Tyr Ala Ser Leu Asn Arg Ala
515 520 525
Thr Phe Pro Asn Leu Arg Arg Thr Ala Gln Lys Met Leu Thr Leu Phe
530 535 540
Gly Ser Thr Tyr Val Cys Glu Gln Thr Phe Ser Val Met Asn Ala Asn
545 550 555 560
Lys Ala Arg His Arg Ser Lys Leu Thr Asp Gln His Leu Arg Ser Ile
565 570 575
Leu Arg Ile Ala Thr Thr Lys Ile Thr Pro Asp Leu Asp Ala Leu Ala
580 585 590
Lys Met Gly Asp Gln Gln His Cys Ser His
595 600
<210> 72
<211> 339
<212> PRT
<213> 热带爪蟾(Xenopus tropicalis)
<400> 72
Met Val His Arg Glu Leu Pro Lys His Gln Arg Asp Leu Ile Val Lys
1 5 10 15
Arg Tyr Gln Ser Gly Glu Gly Tyr Lys Arg Ile Ser Lys Ala Leu Asp
20 25 30
Ile Pro Trp Asn Thr Val Lys Thr Val Ile Ile Lys Trp Arg Lys Tyr
35 40 45
Gly Thr Thr Val Thr Leu Pro Arg Thr Gly Arg Pro Ser Lys Ile Asp
50 55 60
Glu Lys Thr Arg Arg Lys Leu Val Arg Glu Ala Thr Lys Arg Pro Thr
65 70 75 80
Ala Thr Leu Lys Glu Leu Gln Glu Tyr Leu Ala Ser Thr Gly Cys Val
85 90 95
Val His Val Thr Thr Ile Ser Arg Ile Leu His Met Ser Gly Leu Trp
100 105 110
Gly Arg Val Ala Arg Arg Lys Pro Phe Leu Thr Lys Lys Asn Ile Gln
115 120 125
Ala Arg Leu His Phe Ala Lys Thr His Leu Lys Ser Pro Lys Ser Met
130 135 140
Trp Glu Lys Val Leu Trp Ser Asp Glu Thr Lys Val Glu Leu Phe Gly
145 150 155 160
His Asn Ser Lys Lys Tyr Val Trp Arg Lys Asn Asn Thr Ala His His
165 170 175
Gln Lys Asn Thr Ile Pro Thr Val Lys His Gly Gly Gly Ser Ile Met
180 185 190
Leu Trp Gly Cys Phe Ser Ser Ala Gly Thr Gly Ala Leu Val Lys Ile
195 200 205
Glu Gly Ile Met Asn Ser Ser Lys Tyr Gln Ser Ile Leu Ala Gln Asn
210 215 220
Leu Gln Ala Ser Ala Arg Lys Leu Asn Met Arg Arg Asn Phe Ile Phe
225 230 235 240
Gln His Asp Asn Asp Pro Lys His Thr Ser Lys Ser Thr Lys Glu Trp
245 250 255
Leu His Arg Lys Lys Ile Lys Val Leu Glu Trp Pro Ser Gln Ser Pro
260 265 270
Asp Leu Asn Pro Ile Glu Asn Leu Trp Gly Asp Leu Lys Arg Ala Val
275 280 285
His Arg Arg Cys Pro Arg Asn Leu Thr Asp Leu Glu Cys Phe Cys Lys
290 295 300
Glu Glu Trp Ala Asn Leu Ala Lys Ser Lys Cys Ala Met Leu Ile Asp
305 310 315 320
Ser Tyr Pro Lys Arg Leu Ser Ala Val Ile Lys Ser Lys Gly Ala Ser
325 330 335
Thr Lys Tyr
<210> 73
<211> 344
<212> PRT
<213> 热带爪蟾(Xenopus tropicalis)
<400> 73
Met Asp Asn Arg Lys Arg Arg Arg Glu Leu Ser Glu Asp Leu Arg Thr
1 5 10 15
Lys Ile Val Glu Lys Tyr Gln Gln Ser Gln Gly Tyr Lys Ser Ile Ser
20 25 30
Arg Asp Leu Asp Leu Pro Leu Ser Thr Val Arg Asn Ile Ile Lys Lys
35 40 45
Phe Ala Thr His Gly Thr Val Ala Asn Leu Pro Gly Arg Gly Arg Lys
50 55 60
Arg Lys Ile Asp Glu Arg Leu Gln Arg Arg Ile Val Arg Met Val Asp
65 70 75 80
Lys Gln Pro Gln Thr Ser Ser Lys Glu Ile Gln Ala Val Leu Gln Ala
85 90 95
Gln Gly Ala Ser Val Ser Ala Arg Thr Ile Arg Arg His Leu Asn Glu
100 105 110
Met Lys Arg Tyr Gly Arg Arg Pro Arg Arg Thr Pro Leu Leu Thr Gln
115 120 125
Arg His Lys Lys Ala Arg Leu Gln Phe Ala Lys Met Tyr Leu Ser Lys
130 135 140
Pro Gln Ser Phe Trp Glu Asn Val Leu Trp Thr Asp Glu Thr Lys Ile
145 150 155 160
Glu Leu Phe Gly Lys Ala His His Ser Thr Val Tyr Arg Lys Arg Asn
165 170 175
Glu Ala Tyr Lys Glu Lys Asn Thr Val Pro Thr Val Lys Tyr Gly Gly
180 185 190
Gly Ser Met Met Phe Trp Gly Cys Phe Ala Ala Ser Gly Thr Gly Cys
195 200 205
Leu Glu Cys Val Gln Gly Ile Met Lys Ser Glu Asp Tyr Gln Arg Ile
210 215 220
Leu Gly Arg Thr Val Glu Pro Ser Val Arg Lys Leu Gly Leu Arg Pro
225 230 235 240
Arg Ser Trp Val Phe Gln Gln Asp Asn Asp Pro Lys His Thr Ser Lys
245 250 255
Ser Thr Gln Lys Trp Met Ala Thr Lys Arg Trp Arg Val Leu Lys Trp
260 265 270
Pro Ala Met Ser Pro Asp Leu Asn Pro Ile Glu His Leu Trp Arg Asp
275 280 285
Leu Lys Ile Ala Val Gly Lys Arg Arg Pro Ser Asn Lys Arg Asp Leu
290 295 300
Glu Gln Phe Ala Lys Glu Glu Trp Ser Lys Ile Pro Gly Glu Arg Cys
305 310 315 320
Lys Lys Leu Ile Asp Gly Tyr Arg Lys Arg Leu Ile Ser Val Ile Phe
325 330 335
Ser Lys Gly Cys Ala Thr Lys Tyr
340
<210> 74
<211> 340
<212> PRT
<213> 热带爪蟾(Xenopus tropicalis)
<400> 74
Met Gly Lys Thr Lys Glu Leu Ser Lys Asp Thr Arg Asp Lys Ile Val
1 5 10 15
Asp Leu His Lys Ala Gly Lys Gly Tyr Gly Ala Ile Ala Lys Gln Leu
20 25 30
Gly Glu Asn Arg Ser Thr Val Gly Ala Ile Val Arg Lys Trp Lys Arg
35 40 45
Leu Lys Thr Thr Val Ser Leu Pro Arg Thr Gly Ala Pro Cys Lys Ile
50 55 60
Ser Pro Arg Gly Val Ser Leu Met Ile Arg Lys Val Arg Asn Gln Pro
65 70 75 80
Arg Thr Thr Arg Glu Glu Leu Val Asn Asp Met Lys Arg Ala Gly Thr
85 90 95
Thr Val Ser Lys Val Thr Val Gly Arg Thr Leu Arg Arg His Gly Phe
100 105 110
Lys Ser Cys Ile Ala Arg Lys Val Pro Leu Leu Lys Ser Ser His Val
115 120 125
Gln Ala Arg Leu Lys Phe Ala Asn Asp His Leu Asp Asp Pro Glu Glu
130 135 140
Ala Trp Glu Lys Val Met Trp Ser Asp Glu Thr Lys Val Glu Leu Phe
145 150 155 160
Gly Leu Asn Phe Thr Arg Arg Val Trp Arg Lys Asn Lys Asp Glu Leu
165 170 175
His Pro Lys Asn Thr Ile Pro Thr Val Lys His Gly Gly Gly Asn Ile
180 185 190
Met Leu Trp Gly Cys Phe Ser Ala Lys Gly Thr Gly Arg Leu His Cys
195 200 205
Ile Lys Glu Arg Met Asn Gly Ala Met Tyr Cys Glu Ile Leu Ser Asn
210 215 220
Asn Leu Leu Pro Ser Val Arg Ala Leu Lys Met Gly Arg Gly Trp Val
225 230 235 240
Phe Gln His Asp Asn Asp Pro Lys His Thr Ala Arg Ile Thr Lys Glu
245 250 255
Trp Leu Arg Lys Arg His Ile Lys Val Leu Glu Trp Pro Ser Gln Ser
260 265 270
Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Arg Glu Leu Lys Leu Arg
275 280 285
Val Ala Gln Arg Gln Pro Arg Asn Leu Thr Asp Leu Glu Glu Ile Cys
290 295 300
Val Glu Glu Trp Ala Lys Ile Pro Val Ala Val Cys Ala Asn Leu Val
305 310 315 320
Lys Asn Tyr Arg Lys Arg Leu Thr Ser Val Ile Ala Asn Lys Gly Phe
325 330 335
Cys Thr Lys Tyr
340
<210> 75
<211> 341
<212> PRT
<213> 热带爪蟾(Xenopus tropicalis)
<400> 75
Met Arg Arg Ser Leu Gln Pro Thr Gln Met Ala Gln Val Val Gln Leu
1 5 10 15
Ile Gln Asp Gly Thr Ser Met Arg Ala Val Ala Arg Arg Phe Ala Val
20 25 30
Ser Val Ser Val Val Ser Arg Ala Trp Arg Arg Tyr Gln Glu Thr Gly
35 40 45
Gln Tyr Ile Arg Arg Arg Gly Gly Gly Arg Arg Arg Ala Thr Thr Gln
50 55 60
Gln Gln Asp Arg Tyr Leu Arg Leu Cys Ala Arg Arg Asn Arg Arg Ser
65 70 75 80
Thr Ala Arg Ala Leu Gln Asn Asp Leu Gln Arg Ala Thr Asn Val His
85 90 95
Val Ser Ala Gln Thr Val Arg Asn Arg Leu His Glu Gly Gly Met Arg
100 105 110
Ala Arg Arg Pro Gln Val Gly Val Val Leu Thr Ala Gln His Arg Ala
115 120 125
Gly Arg Leu Ala Phe Ala Arg Glu His Gln Asp Trp Gln Ile Arg His
130 135 140
Trp Arg Pro Val Leu Phe Thr Asp Glu Ser Arg Phe Thr Leu Ser Thr
145 150 155 160
Cys Asp Arg Arg Asp Arg Val Trp Arg Arg Arg Gly Glu Arg Ser Ala
165 170 175
Ala Cys Asn Ile Leu Gln His Asp Arg Phe Gly Ser Gly Ser Val Met
180 185 190
Val Trp Gly Gly Ile Ser Leu Gly Gly Arg Thr Ala Leu His Val Leu
195 200 205
Ala Arg Gly Ser Leu Thr Ala Ile Arg Tyr Arg Asp Glu Ile Leu Arg
210 215 220
Pro Leu Val Arg Pro Tyr Ala Gly Ala Val Gly Pro Gly Phe Leu Leu
225 230 235 240
Met Gln Asp Asn Ala Arg Pro His Val Ala Gly Val Cys Gln Gln Phe
245 250 255
Leu Gln Asp Glu Gly Ile Asp Ala Met Asp Trp Pro Ala Arg Ser Pro
260 265 270
Asp Leu Asn Pro Ile Glu His Ile Trp Asp Ile Met Ser Arg Ser Ile
275 280 285
His Gln Arg His Val Ala Pro Gln Thr Val Gln Glu Leu Val Asp Ala
290 295 300
Leu Val Gln Val Trp Glu Glu Ile Pro Gln Glu Thr Ile Arg His Leu
305 310 315 320
Ile Arg Ser Met Pro Arg Arg Cys Arg Glu Val Ile Gln Ala Arg Gly
325 330 335
Gly His Thr His Tyr
340
<210> 76
<211> 341
<212> PRT
<213> 红鳍东方鲀(Takifugu rubripes)
<400> 76
Met Val Arg Tyr Leu Asp Ala Thr Glu Val Ala Gln Val Val Gln Leu
1 5 10 15
Leu Gln Asp Gly Thr Ser Ile Arg Ala Val Ala Arg Arg Phe Ala Val
20 25 30
Ser Pro Ser Thr Val Ser Arg Ala Trp Arg Arg Phe Gln Glu Thr Gly
35 40 45
Ser Tyr Ser Arg Arg Ala Gly Gln Gly Arg Arg Arg Ser Leu Asn Pro
50 55 60
Gln Gln Asp Arg Tyr Leu Leu Leu Cys Ala Arg Arg Asn Arg Met Ser
65 70 75 80
Thr Ala Arg Ala Leu Gln Asn Asp Leu Gln Gln Ala Thr Gly Val Asn
85 90 95
Val Ser Asp Gln Thr Ile Arg Asn Arg Leu His Glu Gly Gly Leu Arg
100 105 110
Ala Arg Arg Pro Val Val Gly Pro Val Leu Thr Ala Arg His Arg Arg
115 120 125
Ala Arg Leu Ala Phe Ala Ile Asp His Gln Asn Trp Gln Leu Arg His
130 135 140
Trp Arg Pro Val Leu Phe Thr Asp Glu Ser Arg Phe Asn Leu Ser Thr
145 150 155 160
Cys Asp Arg Arg Glu Arg Val Trp Arg Cys Arg Gly Glu Arg Tyr Ala
165 170 175
Ala Cys Asn Ile Ile Gln His Asp Arg Phe Gly Gly Gly Ser Val Met
180 185 190
Val Trp Gly Gly Ile Ser Leu Glu Gly Arg Thr Asp Leu Tyr Arg Leu
195 200 205
Asp Asn Gly Thr Leu Thr Ala Ile Arg Tyr Arg Asp Glu Ile Leu Gly
210 215 220
Pro Ile Val Arg Thr Tyr Ala Gly Ala Val Gly Pro Gly Phe Leu Leu
225 230 235 240
Val His Asp Asn Ala Arg Pro His Val Ala Arg Val Cys Arg Gln Phe
245 250 255
Leu Glu Asp Glu Gly Ile Asp Thr Ile Asp Trp Pro Pro Arg Ser Pro
260 265 270
Asp Leu Asn Pro Ile Glu His Leu Trp Asp Ile Met Phe Arg Ser Ile
275 280 285
Arg Arg Arg Gln Val Asp Pro Gln Thr Val Gln Glu Leu Ser Asp Ala
290 295 300
Leu Val Gln Ile Trp Glu Glu Ile Pro Gln Asp Thr Ile Arg Arg Leu
305 310 315 320
Ile Arg Ser Met Pro Arg Arg Cys Gln Ala Cys Val Gln Ala Arg Gly
325 330 335
Gly His Thr Asn Tyr
340
<210> 77
<211> 1073
<212> PRT
<213> 热带爪蟾(Xenopus tropicalis)
<400> 77
Met Pro Gly Lys Gly Arg Pro Pro Arg Arg Gly Thr Arg Gly Arg Ala
1 5 10 15
Ala Met Ile Ser Cys Gly Pro Arg Lys Leu Pro Ser Phe Pro Lys Ala
20 25 30
Leu Thr Leu Asn Ser Gln Asn Ala Glu Glu Val Val Asp Trp Leu Thr
35 40 45
Gln His Thr Pro Ser Ser Thr Val Ser Asn Phe Ala Thr Thr Ser Ser
50 55 60
Ser Ser Ser Ala Met Gly Thr Pro Arg Thr Thr Ser Ser Thr Thr Ala
65 70 75 80
Ala Pro Ser Ser Leu Glu Ser Glu Glu Leu Phe Thr His Glu Phe Val
85 90 95
Glu Leu Ser Asp Ala Gln Pro Leu Leu Pro Glu Glu Asp Glu Gly Asp
100 105 110
Glu Asp Val Thr Pro Asp Ile Ile Ile Gln Ala Gly Asn Thr Thr Glu
115 120 125
Met Asp Ile Arg Cys Asp Glu Val Pro Ala Ala Ala Val Phe Cys Glu
130 135 140
Leu Ser Glu Glu Ile Asp Ala Ser Glu Glu Asn Asp Asp Glu Glu Ile
145 150 155 160
Asp Ile Leu Trp Val Pro Thr Arg Arg Glu Gln Glu Glu Asp Ser Ser
165 170 175
Asp Gly Glu Thr Glu Ser Gln Arg Gly Arg Arg Arg Ile Arg Leu Arg
180 185 190
Arg Ser Arg Asp Ser Ser Gln Gly Thr Val Gly Gln Gln His Glu Ser
195 200 205
Ala Pro Val Val Ser Gln Pro Thr His Pro Pro Thr Ser Thr Val Thr
210 215 220
Ala Arg Lys Pro Thr Ser Lys Gly Ser Ala Val Trp His Phe Phe Asn
225 230 235 240
Val Cys Ala Ser Asp Lys Ser Ala Val Ile Cys Asn Glu Cys Ser Gln
245 250 255
Lys Leu Ser Leu Gly Lys Pro Asn Thr His Leu Gly Thr Thr Ala Met
260 265 270
Arg Arg His Met Asn Ala Lys His Lys Ala Leu Trp Glu Gln His Leu
275 280 285
Lys Gly Ser Ser Gln Thr Leu Ser His Pro Pro Ser Ala Pro Ala Ser
290 295 300
Tyr Cys Ser Thr Ser Ala Val Leu Asp Pro Ser Gln Pro Pro Ser Thr
305 310 315 320
Pro Pro Ser Thr Leu Thr Thr Ser Ser Cys Ser Ser Ala Pro Ser Gln
325 330 335
Val Ser Val Arg Ala Met Phe Glu Arg Lys Lys Pro Met Pro Pro Ser
340 345 350
His Pro Leu Ala Arg Arg Leu Thr Ala Gly Leu Ser Ala Leu Leu Ala
355 360 365
Arg Gln Leu Leu Pro Tyr Gln Leu Val Asp Ser Glu Ala Phe His Gln
370 375 380
Phe Val Ala Ile Gly Thr Pro Gln Trp Lys Val Pro Ser Arg Asn Phe
385 390 395 400
Phe Ser Gln Lys Gly Ile Pro His Leu Tyr Gln His Val Gln Ser Gln
405 410 415
Val Thr Ala Ser Leu Ser Phe Ser Val Gly Ala Lys Val His Met Thr
420 425 430
Thr Asp Thr Trp Ser Ser Lys His Gly Gln Gly Arg Tyr Val Thr Tyr
435 440 445
Thr Ala His Trp Val Asn Leu Val Met Ala Gly Lys Gln Gly Met Arg
450 455 460
Gly Ser Thr Thr Val Glu Leu Val Ser Pro Pro Arg Val Ala Cys Gly
465 470 475 480
Ser Ala Thr Thr Ser Thr Pro Pro Leu Leu Ser Asn Ser Ser Ser Lys
485 490 495
Ser Ser Ser Asn Ser Ser Ser Asn Leu Ala Ser Ser Ser Ala Ser Ser
500 505 510
Ser Ser Ala Ala Val Ser Ser Ser Thr Pro Val His Pro Gln Leu His
515 520 525
Ile Gly Tyr Ser Thr Cys Gln Val Arg Arg Cys His Ala Val Leu Gly
530 535 540
Met Thr Cys Leu Glu Ser Arg Asn His Thr Gly Ser Ala Leu Leu Ser
545 550 555 560
Ser Leu His Ser Gln Ala Asp Arg Trp Leu Thr Pro His Gln Leu Lys
565 570 575
Ile Gly Lys Val Val Cys Asp Asn Gly Ser Asn Leu Leu Ala Ala Leu
580 585 590
Arg Leu Gly Asn Leu Thr His Val Pro Cys Met Ala His Val Leu Asn
595 600 605
Leu Ile Val Gln Arg Phe Val Ser Lys Tyr Pro Gly Leu Gln Asp Ile
610 615 620
Leu Arg Gln Ser Arg Lys Val Ser Gly His Phe Arg Arg Ser Tyr Thr
625 630 635 640
Ala Met Ala Arg Leu Ala Asp Ile Gln Arg Arg His Asn Leu Pro Val
645 650 655
Arg Arg Leu Ile Cys Asp Ser Gln Thr Arg Trp Asn Ser Thr Leu Met
660 665 670
Met Phe Glu Arg Leu Leu Gln Gln Gln Arg Ala Val Asn Glu Tyr Leu
675 680 685
Phe Glu Leu Gly Gly Arg Thr Gly Ser Ala Glu Leu Gly Ile Phe Phe
690 695 700
Pro Arg Tyr Trp Val Leu Met Arg Asp Ala Cys Arg Leu Met Arg Pro
705 710 715 720
Phe Asp Glu Val Thr Asn Met Val Ser Arg Thr Glu Gly Thr Ile Ser
725 730 735
Asp Leu Ile Pro Phe Ala Phe Phe Leu Glu Arg Ala Val Arg Arg Val
740 745 750
Thr Asp Asp Ala Val Asp Gln Arg Asp Gln Glu His Asp Phe Trp Ala
755 760 765
Glu Ser Pro Glu Arg Ser Gln Ala Pro Ala Ala Thr Gln Gly Glu Val
770 775 780
Ser Glu Val Glu Ser Glu Glu Glu Gly Gly Phe Val Glu Ala Glu Asp
785 790 795 800
Gln Gln Glu Gln Ala Ser Arg Gly Ala Cys Gly His Leu Leu Trp Ser
805 810 815
Pro Gly Leu Val Arg Gly Trp Gly Glu Glu Thr Val Val Asp Glu Asp
820 825 830
Val Val Leu Asp Asn Glu Glu Gly Glu Met Asp Thr Ser Ala Ser Asn
835 840 845
Leu Val Arg Met Gly Ser Phe Met Leu Ser Cys Leu Leu Lys Asp Pro
850 855 860
Arg Ile Lys Arg Leu Lys Glu Lys Asp Leu Tyr Trp Val Ala Thr Leu
865 870 875 880
Leu Asp Pro Arg Tyr Lys His Lys Val Ala Glu Met Leu Pro Thr Tyr
885 890 895
His Lys Ser Glu Arg Met Leu His Phe Gln Thr Ser Leu Gln Asn Met
900 905 910
Leu Tyr Asn Ala Phe Lys Gly Asp Val Thr Pro His Ser Arg Gly Arg
915 920 925
Gly Ala Gly Asn Pro Pro Thr Ser Thr Pro Ala Arg Thr Met His Phe
930 935 940
Gly His Ser Val Thr Ser Asp Met Gln Ser Phe Phe Ser Pro Arg Gln
945 950 955 960
Arg Gln Asp Pro Ser Gly Ser Thr Leu Arg Glu Arg Leu Asp Arg Gln
965 970 975
Val Ala Asp Tyr Leu Ala Leu Thr Ala Asp Ile Asp Thr Leu Arg Ser
980 985 990
Asp Glu Pro Leu Asp Tyr Trp Val Arg Arg Leu Asp Leu Trp Pro Glu
995 1000 1005
Leu Ser Gln Phe Ala Ile Asn Leu Leu Ser Cys Pro Ala Ser Ser Val
1010 1015 1020
Leu Ser Glu Arg Thr Phe Ser Ala Ala Gly Gly Ile Val Thr Glu Lys
1025 1030 1035 1040
Arg Thr Arg Leu Gly His Lys Ser Val Asp Tyr Leu Thr Phe Ile Lys
1045 1050 1055
Met Asn Glu Ala Trp Ile Ser Glu Gly Tyr Cys Thr Pro Glu Asp Leu
1060 1065 1070
Phe
<210> 78
<211> 429
<212> PRT
<213> 热带爪蟾(Xenopus tropicalis)
<400> 78
Met Ala Pro Lys Lys Arg His Ala Tyr Glu Ala Gln Phe Lys Leu Gln
1 5 10 15
Ala Ala Ser Tyr Ala Val Val Asn Gly Asn Arg Ala Ala Ala Lys Glu
20 25 30
Phe Asn Ile Asn Glu Ser Met Val Arg Lys Trp Arg Lys Gln Glu Asn
35 40 45
Glu Leu Arg Gln Val Lys Lys Thr Lys Gln Ser Phe Arg Gly Asn Lys
50 55 60
Ala Arg Trp Pro Gln Leu Glu Asp Gln Leu Glu Gln Trp Val Ile Glu
65 70 75 80
Gln Arg Thr Ala Gly Arg Ser Val Ser Thr Val Thr Ile Arg Leu Lys
85 90 95
Ala Thr Thr Ile Ala Gln Asp Leu Glu Ile Glu His Phe Gln Gly Gly
100 105 110
Pro Ser Trp Cys Phe Arg Phe Met Lys Arg Arg His Leu Ser Ile Arg
115 120 125
Ala Arg Thr Thr Val Ala Gln Gln Leu Pro Ala Asp Tyr Lys Glu Lys
130 135 140
Met Ala Ile Phe Arg Thr Tyr Cys Ser Asn Lys Ile Thr Asp Lys Lys
145 150 155 160
Ile Gln Pro Asn His Ile Thr Asn Met Asp Glu Val Pro Leu Thr Phe
165 170 175
Asp Ile Pro Val Asn His Thr Val Glu Ile Lys Gly Thr Ser Thr Val
180 185 190
Ser Ile Arg Thr Thr Gly His Glu Lys Ser Ala Phe Thr Val Val Leu
195 200 205
Ser Cys His Gly Asn Gly Gln Lys Leu Pro Pro Met Val Ile Phe Lys
210 215 220
Arg Lys Thr Leu Pro Lys Glu Lys Phe Pro Ala Gly Val Ile Val Lys
225 230 235 240
Ala Asn Gln Lys Gly Trp Met Asp Glu Glu Lys Met Arg Glu Trp Leu
245 250 255
Arg Glu Val Tyr Val Lys Arg Pro Asp Gly Phe Phe His Thr Ser Pro
260 265 270
Ser Leu Leu Ile Cys Asp Ser Met Arg Ala His Leu Thr Ala Thr Val
275 280 285
Lys Lys Gln Val Lys Gln Met Asn Ser Glu Leu Ala Ile Ile Pro Gly
290 295 300
Gly Leu Thr Lys Glu Leu Gln Pro Leu Asp Val Gly Val Asn Arg Ala
305 310 315 320
Phe Lys Val Lys Leu Arg Thr Ala Trp Glu Arg Trp Met Thr Asp Gly
325 330 335
Glu His Thr Phe Thr Lys Thr Gly Lys Gln Arg Arg Ala Ser Tyr Ala
340 345 350
Thr Ile Cys Glu Trp Ile Val Asp Ala Trp Ala Lys Val Ser Ala Ile
355 360 365
Thr Val Val Arg Ala Phe Ala Lys Thr Gly Ile Ile Ala Glu Gln Pro
370 375 380
Pro Gly Asn Asp Thr Gly Asn Glu Thr Asp Ser Asp Asn Asp Glu Arg
385 390 395 400
Glu Pro Gly Met Phe Asp Gly Glu Ile Ala Gln Leu Phe Asn Ser Asp
405 410 415
Thr Glu Asp Glu Asp Phe Asp Gly Phe Val Gly Glu Asp
420 425
<210> 79
<211> 12
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 79
ccgtattttc tc 12
<210> 80
<211> 6
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 80
cccttt 6
<210> 81
<211> 18
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 81
ccttcatacg ttcccatg 18
<210> 82
<211> 13
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 82
cagtagaacc ccg 13
<210> 83
<211> 16
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 83
cagtggttct taacct 16
<210> 84
<211> 15
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 84
tagggctgtg cgaaa 15
<210> 85
<211> 9
<212> DNA
<213> 倭狐猴(Microcebus murinus)
<400> 85
caggttgag 9
<210> 86
<211> 23
<212> DNA
<213> 西印度海牛(Trichechus manatus)
<400> 86
cagtagtccc cccttatccg cgg 23
<210> 87
<211> 5
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 87
taggg 5
<210> 88
<211> 4
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 88
tagg 4
<210> 89
<400> 89
000
<210> 90
<211> 216
<212> DNA
<213> yakuba果蝇(Drosophila yakuba)
<400> 90
tacagtggcg agcaaaactg agtgcatgtt cacaactctc actttggcca tcaataaaaa 60
cacaaccgct tatgcaaatt caataatttt ttttatatta ttaatcttaa ttaatttata 120
acttatttta tgagaaaaaa caaatttagc atatatattc aaagacttag aataaaaaaa 180
ctaaataaac tcacataaac tcaattttgc acgttt 216
<210> 91
<211> 12
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 91
gagaaaatac gg 12
<210> 92
<211> 6
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 92
aaaggg 6
<210> 93
<211> 18
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 93
catgagaacg gatgaggg 18
<210> 94
<211> 13
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 94
cggggttcta ctg 13
<210> 95
<211> 16
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 95
aggttaagaa ccactg 16
<210> 96
<211> 15
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 96
tttcgcacag cccta 15
<210> 97
<211> 9
<212> DNA
<213> 倭狐猴(Microcebus murinus)
<400> 97
ctcaacctg 9
<210> 98
<211> 23
<212> DNA
<213> 西印度海牛(Trichechus manatus)
<400> 98
ccgcggataa ggggggacta ctg 23
<210> 99
<211> 5
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 99
cccta 5
<210> 100
<211> 4
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 100
ccta 4
<210> 101
<400> 101
000
<210> 102
<211> 216
<212> DNA
<213> yakuba果蝇(Drosophila yakuba)
<400> 102
aaacgtgcaa aattgagttt atgtgagttt atttagtttt tttattctaa gtctttgaat 60
atatatgcta aatttgtttt ttctcataaa ataagttata aattaattaa gattaataat 120
ataaaaaaaa ttattgaatt tgcataagcg gttgtgtttt tattgatggc caaagtgaga 180
gttgtgaaca tgcactcagt tttgctcgcc actgta 216
<210> 103
<211> 431
<212> PRT
<213> 密河鳄(Alligator mississippiensis)
<400> 103
Met Pro Lys Arg Lys Ser Tyr Thr Phe Asp Phe Lys Leu Ser Val Ile
1 5 10 15
Asp Tyr Ala Lys Lys His Gly Asn Arg Ala Ala Gly Arg Glu Phe Ser
20 25 30
Val Asp Glu Lys Ser Val Arg Glu Trp Arg Lys Glu Glu Asp Ile Leu
35 40 45
Lys Thr Leu Asn Pro Arg Lys Arg Ala Arg Arg Gly Lys His Cys Lys
50 55 60
Trp Pro Thr Leu Glu Ala Asn Leu Lys Glu Trp Val Val Ala Gln Arg
65 70 75 80
Glu Ser Asn Lys Val Val Ser Thr Ile Ala Ile Arg Gln Lys Ala Arg
85 90 95
Val Met Ala Asn Glu Met Lys Ile Thr Asp Phe Gly Gly Gly Cys Asn
100 105 110
Trp Val His Lys Phe Met His Arg Asn Asn Leu Ala Val Arg Ser Arg
115 120 125
Thr Thr Val Gly Gln Lys Leu Pro Asp Asp Trp Glu Glu Lys Leu Thr
130 135 140
Lys Phe Arg Asp Phe Val Arg Lys Glu Cys Arg Val His Asn Leu Cys
145 150 155 160
Pro Ala Asp Ile Ile Asn Met Asp Glu Val Pro Ile Ser Phe Asp Val
165 170 175
Pro Ala Thr Arg Thr Val Asp Gln Arg Gly Lys Lys Thr Ile Ala Ile
180 185 190
Ser Thr Thr Gly His Glu Arg Thr Asn Phe Thr Val Val Leu Ala Cys
195 200 205
Thr Ala Ser Gly Val Lys Leu Lys Pro Met Val Ile Phe Lys Arg Val
210 215 220
Thr Met Pro Arg Glu Lys Ile Pro Asn Gly Val Ala Val Ile Cys Asn
225 230 235 240
Lys Lys Gly Trp Met Asn Glu Asp Ile Met Lys Glu Trp Thr Glu Arg
245 250 255
Cys Phe Arg Thr Arg Gln Gly Gly Phe Phe Ala Pro Lys Ser Leu Leu
260 265 270
Ile Phe Asp Ala Met Ala Ala His Lys His Ser Ser Val Gln Lys Gln
275 280 285
Ile Asn Lys Ala Gly Ala His Ile Ala Val Ile Pro Gly Gly Leu Thr
290 295 300
Cys Lys Leu Gln Pro Leu Asp Ile Ser Val Asn His Ser Phe Lys Cys
305 310 315 320
Phe Met Arg Lys Glu Trp Glu Lys Trp Met Ser Gln Gly Val His Ser
325 330 335
Phe Thr Pro Ser Gly Lys Gln Arg Arg Ala Thr Tyr Thr Glu Val Cys
340 345 350
Asn Trp Ile Val Ala Ala Trp Arg Ala Val Lys Pro Ser Ser Ile Ile
355 360 365
Asn Gly Phe Phe Lys Ala Gly Ile Leu Asp Gly Ala Ser Gly Glu Glu
370 375 380
Ser Asp Tyr Thr Asp Ser Glu Asp Tyr Ala Asp Glu Leu Asp Asp Ala
385 390 395 400
Ala Phe Val Asp Ala Tyr Phe Gly Glu Ser Ser Tyr Asp Thr Asp Phe
405 410 415
Glu Gly Phe Pro Ala Ser Glu Lys Glu Glu Ala Pro Asn Trp Val
420 425 430
<210> 104
<211> 589
<212> PRT
<213> 热带爪蟾(Xenopus tropicalis)
<400> 104
Met Ala Lys Arg Phe Tyr Ser Ala Glu Glu Ala Ala Ala His Cys Met
1 5 10 15
Ala Ser Ser Ser Glu Glu Phe Ser Gly Ser Asp Ser Glu Tyr Val Pro
20 25 30
Pro Ala Ser Glu Ser Asp Ser Ser Thr Glu Glu Ser Trp Cys Ser Ser
35 40 45
Ser Thr Val Ser Ala Leu Glu Glu Pro Met Glu Val Asp Glu Asp Val
50 55 60
Asp Asp Leu Glu Asp Gln Glu Ala Gly Asp Arg Ala Asp Ala Ala Ala
65 70 75 80
Gly Gly Glu Pro Ala Trp Gly Pro Pro Cys Asn Phe Pro Pro Glu Ile
85 90 95
Pro Pro Phe Thr Thr Val Pro Gly Val Lys Val Asp Thr Ser Asn Phe
100 105 110
Glu Pro Ile Asn Phe Phe Gln Leu Phe Met Thr Glu Ala Ile Leu Gln
115 120 125
Asp Met Val Leu Tyr Thr Asn Val Tyr Ala Glu Gln Tyr Leu Thr Gln
130 135 140
Asn Pro Leu Pro Arg Tyr Ala Arg Ala His Ala Trp His Pro Thr Asp
145 150 155 160
Ile Ala Glu Met Lys Arg Phe Val Gly Leu Thr Leu Ala Met Gly Leu
165 170 175
Ile Lys Ala Asn Ser Leu Glu Ser Tyr Trp Asp Thr Thr Thr Val Leu
180 185 190
Ser Ile Pro Val Phe Ser Ala Thr Met Ser Arg Asn Arg Tyr Gln Leu
195 200 205
Leu Leu Arg Phe Leu His Phe Asn Asn Asn Ala Thr Ala Val Pro Pro
210 215 220
Asp Gln Pro Gly His Asp Arg Leu His Lys Leu Arg Pro Leu Ile Asp
225 230 235 240
Ser Leu Ser Glu Arg Phe Ala Ala Val Tyr Thr Pro Cys Gln Asn Ile
245 250 255
Cys Ile Asp Glu Ser Leu Leu Leu Phe Lys Gly Arg Leu Gln Phe Arg
260 265 270
Gln Tyr Ile Pro Ser Lys Arg Ala Arg Tyr Gly Ile Lys Phe Tyr Lys
275 280 285
Leu Cys Glu Ser Ser Ser Gly Tyr Thr Ser Tyr Phe Leu Ile Tyr Glu
290 295 300
Gly Lys Asp Ser Lys Leu Asp Pro Pro Gly Cys Pro Pro Asp Leu Thr
305 310 315 320
Val Ser Gly Lys Ile Val Trp Glu Leu Ile Ser Pro Leu Leu Gly Gln
325 330 335
Gly Phe His Leu Tyr Val Asp Asn Phe Tyr Ser Ser Ile Pro Leu Phe
340 345 350
Thr Ala Leu Tyr Cys Leu Asp Thr Pro Ala Cys Gly Thr Ile Asn Arg
355 360 365
Asn Arg Lys Gly Leu Pro Arg Ala Leu Leu Asp Lys Lys Leu Asn Arg
370 375 380
Gly Glu Thr Tyr Ala Leu Arg Lys Asn Glu Leu Leu Ala Ile Lys Phe
385 390 395 400
Phe Asp Lys Lys Asn Val Phe Met Leu Thr Ser Ile His Asp Glu Ser
405 410 415
Val Ile Arg Glu Gln Arg Val Gly Arg Pro Pro Lys Asn Lys Pro Leu
420 425 430
Cys Ser Lys Glu Tyr Ser Lys Tyr Met Gly Gly Val Asp Arg Thr Asp
435 440 445
Gln Leu Gln His Tyr Tyr Asn Ala Thr Arg Lys Thr Arg Ala Trp Tyr
450 455 460
Lys Lys Val Gly Ile Tyr Leu Ile Gln Met Ala Leu Arg Asn Ser Tyr
465 470 475 480
Ile Val Tyr Lys Ala Ala Val Pro Gly Pro Lys Leu Ser Tyr Tyr Lys
485 490 495
Tyr Gln Leu Gln Ile Leu Pro Ala Leu Leu Phe Gly Gly Val Glu Glu
500 505 510
Gln Thr Val Pro Glu Met Pro Pro Ser Asp Asn Val Ala Arg Leu Ile
515 520 525
Gly Lys His Phe Ile Asp Thr Leu Pro Pro Thr Pro Gly Lys Gln Arg
530 535 540
Pro Gln Lys Gly Cys Lys Val Cys Arg Lys Arg Gly Ile Arg Arg Asp
545 550 555 560
Thr Arg Tyr Tyr Cys Pro Lys Cys Pro Arg Asn Pro Gly Leu Cys Phe
565 570 575
Lys Pro Cys Phe Glu Ile Tyr His Thr Gln Leu His Tyr
580 585
<210> 105
<211> 626
<212> PRT
<213> 密河鳄(Alligator mississippiensis)
<400> 105
Met Arg Arg Gln Arg Ile Phe Ser Ala Glu Ala Cys Leu Ala Gln Val
1 5 10 15
Thr Gly Asp Asp Ser Asp Thr Ser Thr Asp Glu Ile Leu Ser Gln Gly
20 25 30
Ser Glu Asp Ala Asp Phe Val Pro Asp Met Gly Asp Cys Ser Glu Gln
35 40 45
Glu Asp His Ala Ser Thr Glu Ala Ser Ser Ser Ser Asp Glu Glu Glu
50 55 60
Leu Val Pro Gln Ala Glu Val Met Pro Thr Leu Pro Val Gly Lys Gly
65 70 75 80
Arg Gly Pro Ala Arg Gly Arg Arg Gly Arg Pro Arg Arg Ala Thr Ala
85 90 95
Gly Arg Gly Ala Glu Pro Leu Pro Pro Pro Pro Glu Asn Ile Ala Asp
100 105 110
Asp Asp Thr Phe Arg Gly Arg Asn Gly Arg Val Trp Gly Lys Ser Pro
115 120 125
Gln Leu Ile His His Arg Arg Thr Ala Lys Asp Ile Val His Glu Ser
130 135 140
Ala Gly Pro Thr Arg Glu Ser Asn Lys Asp Thr Val Val Glu Thr Phe
145 150 155 160
His Leu Phe Leu Ser Gln Asp Ile Leu Thr Val Ile Ile Arg Glu Thr
165 170 175
Asn Arg Glu Ala Glu Arg Arg Phe Arg Glu Trp Asn Asp Ser His Pro
180 185 190
Glu Asn Arg Lys Glu Trp Lys Lys Leu Asp Glu Thr Glu Leu Lys Ala
195 200 205
Tyr Ile Gly Leu Leu Leu Leu Ser Gly Leu Tyr His Gly Gly His Glu
210 215 220
Ala Leu Glu Glu Leu Trp Glu Gln Arg Thr Gly Arg Pro Cys Phe Arg
225 230 235 240
Ala Thr Met Ser Leu Lys Arg Phe Arg Gln Ile Thr Asn Tyr Leu Arg
245 250 255
Phe Asp Asn Lys Leu Thr Arg Glu Glu Arg Arg Ala Val Asp Lys Leu
260 265 270
Ala Ala Phe Arg Asp Ile Trp Thr Gln Phe Val Glu Gln Leu Arg Lys
275 280 285
Trp Tyr Ile Pro Gly Ile His Leu Thr Val Asp Glu Gln Leu Ile Ala
290 295 300
Phe Arg Gly Arg Cys Pro Phe Arg Gln Tyr Met Pro Ser Lys Pro Ala
305 310 315 320
Lys Tyr Gly Leu Lys Ile Trp Trp Cys Cys Asp Ala Ala Thr Ser Phe
325 330 335
Pro Leu Ser Gly Asp Ile Tyr Leu Gly Lys Gln Pro Glu Ala Pro Arg
340 345 350
Gln Gly Asn Leu Gly Thr Gln Val Ile Glu Lys Leu Val His Pro Trp
355 360 365
Tyr Lys Thr Gly Arg Asn Ile Val Gly Asp Asn Phe Phe Thr Ser Thr
370 375 380
Asp Leu Ala Glu Arg Leu Leu Gln Gln Asp Leu Thr Tyr Val Gly Thr
385 390 395 400
Ile Arg Lys Asn Lys Ala Asp Ile Pro Asn Glu Met Gln Ala Asn Arg
405 410 415
Arg Arg Glu Thr Phe Ser Ser Ile Phe Ala Phe Asp Gly Glu Leu Thr
420 425 430
Leu Val Ser Tyr Val Pro Lys Lys Ser Lys Val Val Leu Leu Leu Ser
435 440 445
Ser Met His His Asp Leu Ser Val Gly Gly Glu Gln Arg Lys Pro Asp
450 455 460
Ile Ile His Asp Tyr Asn Lys Asn Lys Gly Gly Val Asp Asn Leu Asp
465 470 475 480
His Leu Val Arg Met Thr Thr Cys Arg Arg Lys Ile Asn Arg Trp Pro
485 490 495
Met Thr Leu Phe Phe Asn Met Leu Asp Val Ala Ala Ile Ala Ser Leu
500 505 510
Ile Ile Trp Leu Gly His Asn Ala Asn Trp Lys Gln Arg Ser His Leu
515 520 525
Arg Arg Arg Arg Phe Phe Leu Gln Glu Leu Gly Glu Gln Leu Ile Asp
530 535 540
Gly Gln Ile Lys Arg Arg Met Met Asp Thr Arg Asn Leu Ser Lys Ser
545 550 555 560
Val Lys Ser Gly Met Thr Ala Leu Asn Tyr Lys Leu Pro Gln Arg Thr
565 570 575
Pro Val Glu Pro Ser Ala Ser Met Ser Gly Arg Cys Ala Phe Cys Pro
580 585 590
Arg Thr Asp Asp Arg Lys Thr Arg Lys Arg Cys Glu Asp Cys Lys Arg
595 600 605
Phe Ala Cys Val His His Ser Thr Ser Leu Leu Leu Cys Glu Glu Cys
610 615 620
Asn Ile
625
<210> 106
<211> 627
<212> PRT
<213> 密河鳄(Alligator mississippiensis)
<400> 106
Met Arg Arg Pro Ser Gln Met Glu Leu Arg Ala Ala Trp Val Pro Lys
1 5 10 15
Gln Asp Ser Gly Phe Ser Leu Ser Val Ala Ile Val Phe Lys Met Ser
20 25 30
Ala Ser Asn Thr Asp Ser Thr Ser Ala Ser Ala Ser Thr Arg Lys Arg
35 40 45
Lys Ala Ile Thr Leu Glu Glu Lys Leu Glu Val Val Lys Arg Tyr Glu
50 55 60
Arg Gly Glu Lys Thr Lys Glu Ile Arg Cys Ala Thr Gly Leu Ser Glu
65 70 75 80
Ser Thr Leu Arg Thr Ile Arg Asp Asn Ala Glu Lys Ile Lys Glu Ser
85 90 95
Cys Lys Ser Ala Thr Arg Leu Ser Thr Ala Arg Val Ser Leu Thr Arg
100 105 110
Ser Ala Ile Met Glu Lys Met Glu Arg Met Leu Thr Thr Trp Ile Glu
115 120 125
His Gln Asn Gln Glu His Val Pro Leu Ser Thr Gln Val Ile Gln Ala
130 135 140
Lys Ala Arg Ser Ile Tyr Glu Val Leu Lys Arg Asp Asp Pro Glu Ala
145 150 155 160
Lys Pro Phe Asn Ala Ser Ala Gly Trp Phe Asp Arg Phe Lys Ala Arg
165 170 175
His Gly Phe His Asn Leu Lys Leu Thr Gly Glu Ala Ala Ala Ala Asp
180 185 190
Lys Ser Ala Ala Asp Lys Phe Pro Ser Ile Leu Gln Ala Ala Ile Glu
195 200 205
Glu Gly Ser Tyr Asp Pro Arg Gln Val Phe Asn Leu Asp Glu Thr Gly
210 215 220
Leu Phe Trp Lys Arg Met Pro Ser Arg Thr Phe Ile Ser Val Glu Glu
225 230 235 240
Arg Thr Ala Pro Gly Phe Lys Ala Ala Lys Asp Arg Cys Thr Leu Leu
245 250 255
Leu Gly Ala Asn Ala Ala Gly Asp Phe Lys Leu Lys Pro Leu Met Val
260 265 270
Tyr His Ala Glu Asn Pro Arg Ala Leu Lys Gly Tyr Ala Lys Gly His
275 280 285
Leu Pro Val Tyr Trp Arg Ala Asn Arg Lys Gly Trp Val Thr Gly Ser
290 295 300
Leu Phe Glu Asp Tyr Phe Ser Ser Leu Leu His Leu Glu Leu Arg Ala
305 310 315 320
Tyr Cys Asp Arg Gln Asn Leu Pro Phe Lys Ile Leu Leu Leu Leu Asp
325 330 335
Asn Ala Pro Gly His Pro Pro Ser Leu Gly Asp Leu Ser Glu Asn Ile
340 345 350
Lys Val Leu Phe Leu Pro Pro Asn Thr Thr Ser Leu Ile Gln Pro Met
355 360 365
Asp Gln Gly Val Ile Arg Ala Phe Lys Ser Tyr Tyr Leu Arg Arg Thr
370 375 380
Phe Lys Lys Leu Ile Asn Glu Thr Glu Ser Lys Glu Lys Ala Asn Val
385 390 395 400
Lys Glu Phe Trp Lys Ala Phe Asn Ile Lys Met Ala Ile Asp Ile Ile
405 410 415
Gly Asp Ala Trp Asn Asp Val Thr Gln Gln Cys Leu Asn Gly Val Trp
420 425 430
Lys Asn Ile Trp Pro Ala Val Val Asn Asp Phe Arg Gly Phe Ala Ala
435 440 445
Asp Glu Phe Ile Ser Asp Ala Arg His Glu Ile Val Glu Met Ala Lys
450 455 460
Ser Val Gly Phe Glu Gln Val Asp Glu Glu Asn Val Ala Glu Leu Leu
465 470 475 480
Asp Ser His Arg Glu Glu Leu Ser Asn Glu Asp Leu Leu Glu Leu Asp
485 490 495
Arg Glu Arg His Glu Glu Glu Glu Pro Met Glu Glu Asn Glu Arg Pro
500 505 510
Ser Pro Arg Val Leu Thr Met Lys Gly Met Ala Asp Ala Phe Lys Leu
515 520 525
Leu Asp Gly Tyr Leu Ala Phe Phe Asp Glu Asn Asp Pro Asn Arg Glu
530 535 540
Arg Ser Ala Lys Val Ala Arg Leu Met Lys Glu Ala Asn Ala Cys Tyr
545 550 555 560
Thr Glu Leu Tyr Arg Glu Lys Arg Arg Cys Ser Val Gln Ser Ser Leu
565 570 575
Asp Lys Phe Phe Arg Lys Arg Asp Ser Thr Ile Ser Thr Gln Ser Thr
580 585 590
Asp Ser Gln Pro Ser Thr Ser Gly Gly Glu Pro Ala Thr Ser Gly Gly
595 600 605
Glu Ile Ser Pro Pro Ser Phe Asp Val Phe Asp Leu Asp Glu Asp Ser
610 615 620
Ala Pro His
625
<210> 107
<211> 602
<212> PRT
<213> 海七鳃鳗(Petromyzon marinus)
<400> 107
Met Ser Gly Lys Arg Arg Lys Trp Ser Asp Glu Tyr Val Gln His Gly
1 5 10 15
Phe Ser Cys Ile Thr Glu Arg Asp Gly Ser Glu Arg Pro Ile Cys Met
20 25 30
Ile Cys Asn Ala Lys Leu Ser Asn Ser Ser Leu Ala Pro Ala Lys Leu
35 40 45
Lys Glu His Phe Leu Lys Leu His Gly Asp Gly Glu Tyr Lys Asn Thr
50 55 60
Thr Leu Ala Glu Phe Arg Val Lys Arg Ala Arg Phe Asp Glu Arg Ala
65 70 75 80
Thr Leu Pro Ala Leu Gly Phe Val Pro Val Asn Lys Pro Ile Leu Thr
85 90 95
Ala Ser Tyr Glu Val Ala Tyr Leu Ile Ala Lys Gln Gly Lys Pro His
100 105 110
Thr Ile Gly Glu Thr Leu Val Lys Pro Ala Ala Leu Lys Met Ala Asn
115 120 125
Leu Ile Leu Gly Thr Ala Ala Glu Gly Lys Leu Ser Gln Ile Pro Leu
130 135 140
Ser Asn Asp Thr Val Ser Asp Arg Ile Glu Asp Met Ser Lys Asp Ile
145 150 155 160
Leu Ala Gln Val Val Ala Asp Leu Ile Ser Ser Pro Ala Lys Phe Ser
165 170 175
Leu Gln Leu Asp Glu Thr Thr Asp Val Ser Asp Leu Ser Gln Leu Ala
180 185 190
Val Phe Val Arg Tyr Val Lys Asp Asp Met Ile Lys Glu Glu Phe Leu
195 200 205
Phe Cys Lys Pro Leu Thr Thr Thr Thr Lys Ala Ala Asp Val Lys Lys
210 215 220
Leu Val Asp Asp Phe Phe Arg Asp Asn Asn Leu Ser Trp Asp Met Val
225 230 235 240
Ser Ala Val Cys Thr Asp Gly Ala Pro Val Met Leu Gly Arg Lys Ser
245 250 255
Gly Phe Gly Ala Leu Val Lys Ala Asp Ala Pro His Ile Ile Val Thr
260 265 270
His Cys Ile Leu His Arg His Ala Leu Ala Thr Lys Thr Leu Pro Pro
275 280 285
Lys Met Ala Glu Val Leu Lys Thr Val Val Glu Cys Val Asn Tyr Val
290 295 300
Arg Lys Ser Ala Leu Arg His Arg Ile Phe Ser Glu Leu Cys Lys Glu
305 310 315 320
Met Gly Ser Glu Phe Glu Val Leu Leu Leu His Ser Asn Ile Arg Trp
325 330 335
Leu Ser Arg Gly Gln Val Leu Asn Arg Val Phe Ala Met Arg Val Glu
340 345 350
Leu Ala Leu Phe Leu Gln Glu His Gln His Cys His Ala Asp Cys Phe
355 360 365
Lys Asn Pro Glu Phe Ile Leu Ile Leu Ala Tyr Met Ala Asp Ile Phe
370 375 380
Ala Ala Leu Asn His Leu Asn Gln Gln Met Gln Gly Gly Gly Val Asn
385 390 395 400
Ile Met Glu Ala Glu Glu His Leu Lys Ala Phe Gln Lys Lys Leu Pro
405 410 415
Leu Trp Lys Arg Arg Thr Glu Asn Asn Asn Phe Ala Asn Phe Pro Leu
420 425 430
Leu Asp Asp Cys Ala Ser Lys Ile Glu Asp Val Ser Gly Ile Gly Asp
435 440 445
Ile Ser Val Ser Thr Glu Leu Lys Gln Thr Ile Ala Thr His Leu Asp
450 455 460
Glu Leu Ala Lys Ser Leu Asp Gly Tyr Phe Pro Thr Arg Glu Ser Tyr
465 470 475 480
Pro Ala Trp Val Arg Gln Pro Phe Thr Phe Ala Val Glu Thr Ala Asp
485 490 495
Val Asn Asp Glu Phe Leu Asp Glu Ile Ile Glu Ile Gln Gln Ser Gln
500 505 510
Val Gln Gln Gln Leu Phe Arg Thr Thr Thr Leu Ser Thr Phe Trp Cys
515 520 525
Arg Gln Met Asn Lys Tyr Pro Val Ile Ala Lys Lys Ala Leu Asp Phe
530 535 540
Phe Ile Pro Phe Val Thr Thr Tyr Leu Cys Glu Gln Ser Phe Ser Arg
545 550 555 560
Met Leu Asp Ile Lys Thr Lys Lys Arg Asn Arg Leu Cys Cys Glu Asn
565 570 575
Asp Met Arg Val Ala Leu Ala Lys Val Lys Pro Arg Ile Ser Glu Leu
580 585 590
Ile Ser Gln Arg Gln Gln Gln Lys Ser His
595 600
<210> 108
<211> 757
<212> PRT
<213> 密河鳄(Alligator mississippiensis)
<400> 108
Met Thr Val Ser Ser Thr Pro Ile Ser Leu Pro Met Leu Ser Leu Pro
1 5 10 15
Val Pro Glu Glu Glu Leu Glu Leu Asp Leu Asp Leu Ser Ala Ile Ala
20 25 30
Arg Glu Ile Leu Gly Lys Glu Gly Glu Ser Ser Glu Phe Val Leu His
35 40 45
Thr Pro Gln Val Ser Pro Arg Ala Arg Ser Pro Ser Pro Glu Gly Thr
50 55 60
Ser Glu Glu Ala Glu Val Glu Val Ala Glu Ala Ser Gly Ser Ala Glu
65 70 75 80
Ser Ala Pro Pro Val Ala Val Pro Leu Pro Ala Glu Glu Gly Glu Lys
85 90 95
Ala Ala Ser Ala His Ala Pro Ala Pro Gln Lys Arg Ala Gly Ser Val
100 105 110
Val Trp Asp His Phe Glu Leu Ala Asp Asp Pro Thr Tyr Ala Ile Cys
115 120 125
Leu His Cys Arg Ala Lys Thr Ser Arg Gly Lys Gly Thr Lys His Met
130 135 140
Ser Thr Thr Gly Met Leu Met His Leu Arg Arg His His Pro Leu Ala
145 150 155 160
Leu Ala Pro Pro Gln Pro Gly Thr Ser Gly Ser Val Pro Lys Gly Lys
165 170 175
Ser Pro Ser Arg Ser Lys Ala Pro Val Pro Pro Lys Gln Arg Gln Ala
180 185 190
Thr Leu Glu Gln Trp Gly Lys Gly Gly Gln Lys Gly Gly Arg Val Ala
195 200 205
Arg Ala Ser Glu Ile Thr Gln Ser Ile Gly Glu Met Leu Ala Val Asp
210 215 220
Gly Gln Pro Phe Ser Leu Val Glu Arg Pro Gly Phe Arg Arg Leu Met
225 230 235 240
Ala Leu Val Ala Pro Ser Tyr Gln Val Pro Ala Arg Thr Thr Phe Ser
245 250 255
Arg Thr Val Val Pro Ser Leu Tyr Glu Ala Cys Arg Glu Tyr Leu Arg
260 265 270
Glu Glu Leu Arg Lys Ala Gly Pro Gln Val Ala Leu His Phe Thr Ser
275 280 285
Asp Ile Trp Ser Ser Arg Gly Gly Asp His Ala Tyr Leu Ser Leu Thr
290 295 300
Gly His Trp Cys Asp Gln Ser Gly Arg Arg Trp Ala Leu Leu Gln Ala
305 310 315 320
Glu Val Met Asp Glu Ser His Thr Ala Thr Glu Ile Met Gly Ala Met
325 330 335
Asn Arg Leu Val Gln Gly Trp Leu Val Gly Gln Gly Glu Leu Thr Arg
340 345 350
Gly Phe Met Val Thr Asp Asn Gly Ala Asn Met Val Lys Ala Val Arg
355 360 365
Asp Ala Asn Phe Val Gly Ile Arg Cys Val Ala His Lys Phe His Leu
370 375 380
Ile Val Arg Asp Ala Leu Glu Gly Asp Arg Ala Ala Gly Asp Gly Ala
385 390 395 400
Ser Thr Thr Ser Lys Leu Ile Ser Lys Cys Arg Lys Val Ala Gly Tyr
405 410 415
Phe His Arg Ser Ile Lys Gly Gly Lys Met Leu Arg Asp Lys Gln Ala
420 425 430
Glu Leu Asn Ile Pro Gln His Lys Ile Met Gln Asp Val Glu Thr Arg
435 440 445
Trp Asn Ser Thr Tyr Leu Met Leu Glu Arg Leu Val Glu Gln Gln Lys
450 455 460
Ala Ile His Glu Met Ala Leu Leu Gly Glu Ile Gly Ile Ser Gly Pro
465 470 475 480
Leu Asn Arg Ala Glu Trp Asp Thr Ile Ser Gln Ile Leu Val Val Leu
485 490 495
Lys Pro Phe Leu Glu Ala Thr Glu Thr Leu Ser Ala Gly Asp Ala Leu
500 505 510
Leu Ser Gln Val Ile Pro Val Val Arg Glu Leu Gln Ser Gln Met Glu
515 520 525
Ser Phe Gln Gly Ile Asn Val Pro Gly Trp Gly Lys Pro Leu Ser Pro
530 535 540
Asp Val Gln Ala Leu Val Arg Arg Leu Lys Glu Gly Ile Arg Lys Arg
545 550 555 560
Leu Asp Pro Leu Arg Ser Ser Thr Val His Val Leu Ala Ala Thr Cys
565 570 575
Asp Pro Arg Val Lys Gly Ser Val Cys Gly Ser Gln Ser Leu Asn Gln
580 585 590
Trp Thr Glu Val Leu Val Lys Arg Val Arg Glu Ala Glu Arg Arg Arg
595 600 605
Arg Gly Asp Val Glu Glu Gly Asp Pro Leu Ser Arg Ala Ser Thr Pro
610 615 620
Ser Thr Ser Gln Ser Pro Pro Pro Pro Gln Ala Leu Pro Met Trp Ala
625 630 635 640
Lys Gly Met Ala Ser Met Val Gly Ser Arg Gly Thr Arg Pro His His
645 650 655
Gln Ala Gly Ser Ala Gln Ala Leu Val Ala Ala Tyr Leu Ala Glu Asp
660 665 670
Val Glu Pro Leu Leu Cys Asp Pro Leu Ala Tyr Trp Ala Ser Arg Ser
675 680 685
Gln Met Trp Pro Asp Leu Ala Thr Val Ala Arg Glu His Leu Ser Cys
690 695 700
Pro Pro Thr Ser Val Pro Ser Glu Arg Val Phe Ser Ile Ala Gly Asp
705 710 715 720
Val Val Thr Pro His Arg Thr Ser Leu Asp Pro Gly Leu Val Glu Gln
725 730 735
Leu Val Phe Leu Lys Val Asn Leu Pro Leu Leu Gly Phe Pro Lys Leu
740 745 750
Gln Val Gln Thr Glu
755
<210> 109
<211> 554
<212> PRT
<213> 倭狐猴(Microcebus murinus)
<400> 109
Met Ser Lys Arg Pro Ala Asp Thr Pro Met Gly Asn Ser Asp Lys Lys
1 5 10 15
Lys Arg Lys His Leu Cys Leu Ser Ile Ala Gln Lys Val Lys Leu Leu
20 25 30
Glu Lys Leu Asp Ser Gly Val Ser Val Lys Arg Leu Thr Glu Glu Tyr
35 40 45
Gly Val Gly Met Thr Thr Ile Tyr Asp Leu Lys Lys Gln Lys Asp Lys
50 55 60
Leu Leu Lys Phe Tyr Ala Glu Ser Asp Glu Gln Lys Leu Met Lys Asn
65 70 75 80
Arg Lys Thr Leu His Lys Ala Lys Asn Glu Asp Leu Asp Arg Val Leu
85 90 95
Lys Glu Trp Ile Arg Gln Arg Arg Ser Glu His Met Pro Leu Asn Gly
100 105 110
Met Leu Ile Met Lys Gln Ala Lys Ile Tyr His Asp Glu Leu Lys Ile
115 120 125
Glu Gly Asn Cys Glu Tyr Ser Thr Gly Trp Leu Gln Lys Phe Lys Lys
130 135 140
Arg His Gly Ile Lys Phe Leu Lys Ile Cys Gly Asp Lys Ala Ser Ala
145 150 155 160
Asp His Glu Ala Ala Glu Lys Phe Ile Asp Glu Phe Ala Lys Val Ile
165 170 175
Ala Asp Glu Asn Leu Thr Pro Glu Gln Val Tyr Asn Ala Asp Glu Thr
180 185 190
Ser Leu Phe Trp Arg Tyr Cys Pro Arg Lys Thr Leu Thr Thr Ala Asp
195 200 205
Glu Thr Ala Pro Thr Gly Ile Lys Asp Ala Lys Asp Arg Ile Thr Val
210 215 220
Leu Gly Cys Ala Asn Ala Ala Gly Thr His Lys Cys Lys Leu Ala Val
225 230 235 240
Ile Gly Lys Ser Leu Arg Pro Arg Cys Phe Gln Gly Val Asn Phe Leu
245 250 255
Pro Val His Tyr Tyr Ala Asn Lys Lys Ala Trp Ile Thr Arg Asp Ile
260 265 270
Phe Ser Asp Trp Phe His Lys His Phe Val Pro Ala Ala Arg Ala His
275 280 285
Cys Arg Glu Ala Gly Leu Asp Asp Asp Cys Lys Ile Leu Leu Phe Leu
290 295 300
Asp Asn Cys Ser Ala His Pro Pro Ala Glu Ile Leu Ile Lys Asn Asn
305 310 315 320
Val Tyr Ala Met Tyr Phe Pro Pro Asn Val Thr Ser Leu Ile Gln Pro
325 330 335
Cys Asp Gln Gly Ile Leu Arg Ser Met Lys Ser Lys Tyr Lys Asn Thr
340 345 350
Phe Leu Asn Ser Met Leu Ala Ala Val Asn Arg Gly Val Gly Val Glu
355 360 365
Gly Phe Gln Lys Glu Phe Ser Met Lys Asp Ala Ile Tyr Ala Val Ala
370 375 380
Asn Ala Trp Asn Thr Val Thr Lys Asp Thr Val Val His Ala Trp His
385 390 395 400
Asn Leu Trp Pro Ala Thr Met Phe Ser Asp Asp Asp Glu Gln Gly Gly
405 410 415
Asp Phe Glu Gly Phe Arg Met Ser Ser Glu Lys Lys Met Met Ser Asp
420 425 430
Leu Leu Thr Tyr Ala Lys Asn Ile Pro Ser Glu Ser Val Ser Lys Leu
435 440 445
Glu Glu Val Asp Ile Glu Glu Val Phe Asn Ile Asp Asn Glu Ala Pro
450 455 460
Val Val His Ser Leu Thr Asp Gly Glu Ile Ala Glu Met Val Leu Asn
465 470 475 480
Gln Gly Asp Arg Asp Asn Ser Asp Asp Glu Asp Asp Val Val Asn Thr
485 490 495
Ala Glu Lys Val Pro Ile Asp Asp Met Val Lys Met Cys Asp Gly Leu
500 505 510
Ile Glu Gly Leu Glu Gln Arg Ala Phe Ile Thr Glu Gln Glu Ile Met
515 520 525
Ser Val Tyr Lys Ile Lys Glu Arg Leu Leu Arg Gln Lys Pro Leu Leu
530 535 540
Met Arg Gln Met Thr Leu Glu Glu Thr Phe
545 550
<210> 110
<211> 642
<212> PRT
<213> 西印度海牛(Trichechus manatus)
<400> 110
Met Ala Pro Lys Arg Lys Ser Ser Asp Ala Gly Asn Ser Asp Met Pro
1 5 10 15
Lys Arg Ser Arg Lys Val Leu Pro Leu Ser Glu Lys Val Lys Val Leu
20 25 30
Asp Leu Ile Arg Lys Glu Lys Lys Ser Tyr Ala Glu Val Ala Lys Ile
35 40 45
Tyr Gly Lys Asn Glu Ser Ser Ile Arg Glu Ile Val Lys Lys Glu Lys
50 55 60
Glu Ile Arg Ala Ser Phe Ala Val Ala Pro Gln Thr Ala Lys Val Thr
65 70 75 80
Ala Thr Val Arg Asp Lys Cys Leu Val Lys Met Glu Lys Ala Leu Asn
85 90 95
Leu Trp Val Glu Asp Met Asn Arg Lys Arg Val Pro Ile Asp Gly Asn
100 105 110
Val Leu Arg Gln Lys Ala Leu Ser Leu Tyr Glu Asp Phe Ser Lys Gly
115 120 125
Ser Pro Glu Thr Ser Asp Thr Lys Pro Phe Thr Ala Ser Lys Gly Trp
130 135 140
Leu His Arg Phe Arg Asn Arg Phe Gly Leu Lys Asn Ile Lys Ile Thr
145 150 155 160
Gly Glu Ala Ala Ser Ala Asn Glu Glu Ala Ala Ala Thr Phe Pro Ala
165 170 175
Glu Leu Lys Lys Leu Ile Lys Glu Lys Gly Tyr His Pro Lys Gln Val
180 185 190
Phe Asn Cys Asp Glu Thr Gly Leu Phe Trp Lys Lys Met Pro Asn Arg
195 200 205
Thr Tyr Ile His Lys Ser Ala Lys Glu Ala Pro Gly His Lys Thr Trp
210 215 220
Lys Asp Arg Leu Thr Leu Val Leu Cys Gly Asn Ala Ala Gly His Met
225 230 235 240
Ile Lys Pro Gly Val Val Tyr Arg Ala Lys Asn Pro Arg Ala Leu Lys
245 250 255
Asn Lys Asn Lys Asn Tyr Leu Pro Val Phe Trp Gln His Asn Gln Lys
260 265 270
Ala Trp Val Thr Ala Ile Leu Phe Met Glu Trp Phe His Gln Cys Phe
275 280 285
Ile Pro Glu Val Lys Lys Tyr Leu Glu Glu Glu Gly Leu Glu Phe Lys
290 295 300
Val Leu Leu Ile Ile Asp Asn Ala Pro Gly His Pro Glu Ser Val Cys
305 310 315 320
Tyr Glu Asn Glu Asn Val Glu Val Val Phe Leu Pro Pro Asn Thr Thr
325 330 335
Ser Leu Leu Gln Pro Leu Asp Gln Gly Ile Ile Arg Phe Val Lys Ala
340 345 350
Thr Tyr Thr Arg Leu Val Phe Asp Arg Ile Arg Ser Ala Ile Asp Ala
355 360 365
Asp Pro Asn Leu Asp Ile Met Gln Cys Trp Lys Ser Phe Thr Ile Ala
370 375 380
Asp Ala Ile Thr Phe Ile Lys Ala Ala Met Asp Glu Leu Lys Pro Glu
385 390 395 400
Thr Val Asn Ala Cys Trp Lys Asn Leu Trp Ser Glu Val Val Asn Asp
405 410 415
Phe Lys Gly Phe Pro Gly Ile Asp Gly Glu Val Arg Lys Ile Ile His
420 425 430
Ala Ala Arg Gln Val Gly Gly Glu Gly Phe Ala Asp Met Leu Asp Glu
435 440 445
Glu Val Glu Glu His Ile Glu Gly His Arg Glu Val Leu Thr Asn Glu
450 455 460
Glu Leu Glu Glu Leu Val Glu Ser Ser Thr Glu Glu Glu Glu Asp Glu
465 470 475 480
Glu Glu Thr Glu Ala Glu Pro Ala Met Trp Thr Leu Pro Lys Phe Ala
485 490 495
Glu Val Phe Arg Ile Ala Gln Thr Leu Lys Asp Lys Ile Met Glu Tyr
500 505 510
Asp Pro Arg Met Glu Arg Ser Ile Lys Val Thr Arg Met Ile Thr Glu
515 520 525
Gly Leu Gln Pro Leu Gln Gln His Phe Asp Glu Leu Lys Arg Lys Arg
530 535 540
Gln Gln Leu Pro Ile Thr Met Phe Phe Gln Lys Ile Ser Ala Lys Asn
545 550 555 560
Leu Gln Leu Ser Arg Ile Pro Asn His Arg His Arg Leu Leu Leu Thr
565 570 575
Ser Asn His Arg His Arg His Gly Ser Met Ile Gln Asp His Pro Lys
580 585 590
Gln Met Ile Leu Leu Leu Thr Tyr Arg Gln Lys Val Asn Ser Ser Leu
595 600 605
Thr Leu Arg His Asn Ala Tyr Val Ile His Leu Thr Ser Ser His His
610 615 620
Val Gly Ile Val Ser Ser His Ile Ile Thr Arg Arg Arg Val Ser Thr
625 630 635 640
Val Gln
<210> 111
<211> 582
<212> PRT
<213> 密河鳄(Alligator mississippiensis)
<400> 111
Met Asn Ala Lys Lys Ser Ser Lys Thr Ala Lys Tyr Val Ser Ala Leu
1 5 10 15
Asp Arg Ala Arg Gln Tyr Pro Ala Gly Thr Leu His Ala Asp Gly Gly
20 25 30
Arg Leu Phe Cys Thr Ser Cys Asn Val Thr Leu Asp Val Ser Arg Lys
35 40 45
Thr Ser Ile Asp Arg His Leu Glu Ser Glu Ala His Met Lys Arg Lys
50 55 60
Ala Ala Ala Glu Ala Glu Gly Gln Ser Lys Lys Gln Ala Thr Val Ser
65 70 75 80
Ser Leu Phe Lys Arg Thr Thr Glu Ser Ser Leu Ala Arg Arg Glu Ala
85 90 95
Ala Phe Ser Leu Val Glu Ala Phe Ala Ala Ala Asn Ile Pro Leu Glu
100 105 110
Lys Leu Asp His Pro Lys Leu Arg Asp Tyr Leu Asn Gln Asn Val Pro
115 120 125
Asn Ala Gly Ser Phe Pro Arg Ala Asn Lys Leu Arg Gln Asp Tyr Leu
130 135 140
Pro Ala Val Ile Ala Ser His Val Gln Ser Thr Lys Ala Ala Leu Ala
145 150 155 160
Glu Tyr His Ser Phe Ser Ile Val Ala Asp Glu Ala Thr Asp Pro Gln
165 170 175
Asp Asn Tyr Val Leu His Ile Leu Phe Val Pro Gly Ser Trp Thr Asp
180 185 190
Arg Asp Leu Pro Val Phe Gln Thr Glu Pro Val His Leu Thr Ser Val
195 200 205
Asn Phe Ser Thr Val Ser Gln Ala Ile Val Lys Val Ile Val Ser Tyr
210 215 220
Gly Val Asp Phe Asn Lys Ile Ser Ala Phe Leu Ser Asp Asn Ala Met
225 230 235 240
Tyr Met Cys Lys Ala Phe Ser Asp Val Leu Gln Gly Met Leu Pro Asn
245 250 255
Ala Val His Val Thr Cys Asn Ala His Ile Leu Ser Leu Val Ser Asp
260 265 270
Ile Trp Arg Thr Gln Phe Pro Glu Val Asp Ser Leu Val Ser Ser Phe
275 280 285
Lys Lys Ala Phe Lys His Cys Pro Gly Arg Lys Val Arg Tyr Arg Glu
290 295 300
Ser Val Ala Ser Gln Ser Gly Asp Ser His Gly Thr Val Pro Leu Pro
305 310 315 320
Pro Glu Pro Val Leu Thr Arg Trp Asn Ser Trp Phe Asn Ala Val Arg
325 330 335
Tyr His Ala Lys His Met Gln His Tyr Gln Gln Phe Val Ser Glu Glu
340 345 350
Leu Glu Ile Thr Pro Ser Thr Gln Cys Met Leu Lys Leu Arg Asp Leu
355 360 365
Leu Gly Arg Gly Asp Ile Gln Asp Gln Val Thr Phe Val Ala Asp Asn
370 375 380
Ala Thr Arg Phe Met Glu Leu Leu Thr Trp Phe Glu Gly Arg Gln Ala
385 390 395 400
Val Ile His His Ala His Asn Lys Leu Met Asp Leu Ile Ser Trp Val
405 410 415
Glu Asp Arg Ala Ser Gln Glu Leu Ser Ser Cys Pro Arg Glu Asn Gln
420 425 430
Arg Arg Arg Asp Leu Phe Gln Ala Ile Ala Val Lys Leu Asn Gln Tyr
435 440 445
Tyr Arg Tyr Asp Pro Ser Leu Pro Pro Arg Phe Arg Gln Pro Ala Ala
450 455 460
Pro Phe Leu Ser Ala Val Arg Ile Leu Asp Pro Asn Gln Val Pro Leu
465 470 475 480
Leu Ser Cys Asp Pro Gln Leu Leu Lys Ala Ile Pro Gly Trp Gly Lys
485 490 495
Glu His Asp Asn Glu Arg Ala Ala Tyr Val Asn Phe Val Lys Glu Cys
500 505 510
Gln Met Pro Val Pro Val Pro Val Phe Trp Asp Ser Val Cys Asp Arg
515 520 525
Phe Pro His Leu Tyr Ala Leu Ala Arg Arg Cys Leu Thr Ile Pro Thr
530 535 540
Asn Ser Val Asp Ala Glu Arg Ala Ile Ser Val Tyr Gly Gln Val Phe
545 550 555 560
Thr Pro Gln Arg Gln Arg Met Ser Pro Ala Thr Ala Ala Gly Cys Ser
565 570 575
Met Leu Ala Phe Asn Thr
580
<210> 112
<211> 754
<212> PRT
<213> 密河鳄(Alligator mississippiensis)
<400> 112
Met Thr Val Ser Ser Thr Pro Ile Ser Ser Pro Ser Val Ser Leu Pro
1 5 10 15
Val Pro Glu Glu Glu Leu Asp Leu Glu Ala Gly Asp Leu Ser Ala Leu
20 25 30
Ala Lys Glu Ile Leu Gly Thr Glu Gly Glu Ser Glu Phe Val Leu His
35 40 45
Thr Pro Gln Ser Ser Pro Arg Ala Arg Ser Pro Ser Pro Glu Gly Thr
50 55 60
Ser Glu Glu Val Glu Val Val Glu Ala Ser Gly Ser Ala Glu Ser Ala
65 70 75 80
Pro Pro Val Val Val Pro Leu Pro Ala Glu Glu Gly Asp Lys Ala Gly
85 90 95
Ser Pro Pro Ser Thr Gln Lys Arg Gly Gly Ser Val Val Trp Asp His
100 105 110
Phe Glu Val Ala Asp Asp Pro Lys Tyr Ala Ile Cys Gln His Cys Arg
115 120 125
Arg Gln Ile Ser Arg Gly Lys Glu Val Lys His Phe Thr Thr Thr Ala
130 135 140
Met Leu Leu His Leu Arg Arg Gln His Pro Leu Ala Leu Ala Pro Pro
145 150 155 160
Gln Pro Gly Thr Ser Gly Ser Val Pro Lys Gly Lys Ser Pro Ser Arg
165 170 175
Ser Lys Ala Pro Val Pro Thr Lys Gln Arg Gln Ala Thr Leu Glu Arg
180 185 190
Trp Gly Lys Ala Ala Asp Lys Gly Gly Arg Val Ala Arg Ala Ser Glu
195 200 205
Val Thr Gln Ser Ile Gly Glu Met Leu Ala Leu Asp Gly Gln Pro Phe
210 215 220
Ser Leu Val Glu Arg Pro Gly Phe Arg Arg Leu Met Ala Leu Val Ala
225 230 235 240
Pro Ser Tyr Gln Val Pro Ala Arg Thr Thr Phe Ser Arg Thr Val Val
245 250 255
Pro Ser Leu Tyr Glu Ala Cys Arg Glu Tyr Leu Arg Glu Glu Leu Arg
260 265 270
Lys Ala Gly Pro Gln Val Ala Leu His Phe Thr Ser Asp Ile Trp Ser
275 280 285
Ser Arg Gly Gly Asp His Ala Tyr Leu Ser Leu Thr Gly His Trp Cys
290 295 300
Asp Gln Ser Gly Arg Arg Trp Ala Leu Leu Gln Ala Glu Val Met Asp
305 310 315 320
Glu Ser His Thr Ala Arg Glu Ile Met Val Ala Met Asn Arg Met Val
325 330 335
Gln Gly Trp Leu Val Gly Gln Gly Glu Leu Thr Arg Gly Phe Met Val
340 345 350
Thr Asp Asn Gly Ala Asn Met Val Lys Ala Val Arg Asp Ala Asn Phe
355 360 365
Val Gly Ile Arg Cys Val Ala His Lys Leu His Leu Ile Val Arg Asp
370 375 380
Ala Leu Glu Gly Asp Arg Ala Ala Gly Asp Gly Ala Val Thr Thr Thr
385 390 395 400
Gln Leu Ile Ser Lys Cys Arg Lys Val Ala Gly Tyr Phe His Arg Ser
405 410 415
Ile Lys Gly Gly Lys Met Leu Arg Asp Lys Gln Ala Glu Leu Ser Val
420 425 430
Pro Gln His Lys Ile Met Gln Asp Val Glu Thr Arg Trp Asn Ser Thr
435 440 445
Tyr Leu Met Leu Glu Arg Leu Val Glu Gln Gln Lys Ala Ile His Glu
450 455 460
Met Ala Leu Leu Gly Glu Ile Gly Ile Ser Gly Pro Leu Asn Lys Ala
465 470 475 480
Glu Trp Asp Thr Ile Ser Gln Ile Leu Val Val Leu Lys Pro Phe Leu
485 490 495
Glu Ala Thr Glu Thr Leu Ser Ala Gly Asp Ala Leu Leu Ser Gln Val
500 505 510
Ile Pro Val Val Arg Glu Leu Glu Asn Gln Met Glu Lys Phe Gln Gly
515 520 525
Ile Asp Val Pro Gly Trp Gly Lys Pro Leu Ser Pro Glu Val Gln Ala
530 535 540
Leu Val Lys Arg Leu Lys Glu Gly Ile Lys Lys Trp Leu Asp Pro Leu
545 550 555 560
Arg Ser Ser Thr Val His Val Leu Ala Gly Met Cys Asp Pro Arg Val
565 570 575
Lys Gly Ser Met Cys Thr Gly Ser Thr Lys Thr Leu Asp His Trp Thr
580 585 590
Glu Val Leu Val Asn Arg Val Arg Glu Ala Glu Gly Gln Arg Arg Gly
595 600 605
Asp Val Glu Glu Gly Asp Pro Leu Ser Arg Ala Ser Thr Pro Ser Thr
610 615 620
Ser Gln Ser Pro Pro Arg Gln Pro Leu Pro Met Trp Ala Lys Gly Met
625 630 635 640
Ala Ser Met Leu Gly Ser Arg Arg Thr Arg Pro Gln Pro Arg Ala Gly
645 650 655
Ser Ala Glu Ala Ser Val Ala Thr Tyr Leu Ala Glu Asp Val Glu Pro
660 665 670
Leu Asp Cys Asp Pro Leu Ala Tyr Trp Ala Thr Arg Ser Gln Met Trp
675 680 685
Gln Asp Leu Ala Thr Val Ala Arg Glu His Leu Ser Cys Pro Pro Thr
690 695 700
Ser Val Pro Ser Glu Arg Val Phe Ser Ile Ala Gly Asp Val Val Thr
705 710 715 720
Pro His Arg Thr Ser Leu Asp Pro Gly Leu Val Glu Gln Leu Val Phe
725 730 735
Leu Lys Val Asn Leu Pro Leu Leu Gly Phe Pro Glu Leu His Leu Gln
740 745 750
Thr Glu
<210> 113
<211> 1156
<212> PRT
<213> 热带爪蟾(Xenopus tropicalis)
<400> 113
Met Thr Gly Arg Gly Arg Gly Arg Lys Gly Gly Met Gly Gly Lys Gly
1 5 10 15
Gly Glu Gly Gly Arg Lys Gly Gly Val Gly Gly Glu Gly Gly Arg Lys
20 25 30
Gly Gly Val Gly Gly Glu Gly Gly Val Gly Gly Lys Gly Gly Leu Gly
35 40 45
Gly Arg Ser Arg Gly Ala Gly Cys Gly Gln Glu Pro Ser Thr Arg Ala
50 55 60
Met Pro Ser Leu Gly Asn Ile Gly Gln Gln Pro Gln Gln Gln Ser Gln
65 70 75 80
Gln Gln Gln Gln Gln Leu Gln Gln Gln Gln Val Ala Gly Arg Ser Gly
85 90 95
Ala Thr Gly Ser Arg Lys Thr Leu Pro Asp Phe Phe Ala Thr Thr Ser
100 105 110
Arg Pro Ile Gln Ser Gln Gln Ala Glu Ala Val Met Asp Trp Leu Thr
115 120 125
Gln Ala Thr Ser Ser Ala Ala Asp Ser Ser Glu Gln Gln Glu Val Ala
130 135 140
Ser Pro Ala Ser Ser Val Ile Arg Gly Met Leu Ser Pro Leu Leu Phe
145 150 155 160
Asp Pro Glu Val Asp Phe Ser Pro Asp Thr Gln Asp Leu Phe Asp Asp
165 170 175
Gln Thr Gly Met Gly Gly Ala Phe Leu Ser Asp Glu Glu Glu Val Tyr
180 185 190
Val Ala Gln His Thr Thr Ser Ala Val Gly Asp Val Gly Gln Gly Pro
195 200 205
Leu Met Ala Gly Gln Gln Ala Asp Glu Pro Asp Val Asp Val Asp Ala
210 215 220
Gly Ser Asp Leu Gly Glu Asp Val Glu Asp Asp Gly Asp Arg Ser Trp
225 230 235 240
Val Pro Ala Gln Glu Asp Asn Ser Ser Ser Ser Glu Gly Glu Leu Cys
245 250 255
Val Val Val Ser Asp Ala Asp Glu Glu Pro Ala Pro Lys Lys Gln Lys
260 265 270
Thr Pro Pro Thr Thr Ala Arg Gly Gly Arg Gln Gln Gly Ser Thr Ala
275 280 285
Pro Gly Ser Thr Gly Ser Gly Arg Met Gly Arg Asp Leu Gln Pro Ser
290 295 300
Gly Pro Gln Pro Ser Thr Ala Gly Lys Val Val Ala Arg Thr Ser Ala
305 310 315 320
Val Trp Ala Phe Phe Thr Cys Gln Ser Gln Asp Pro Ser Val Ala Val
325 330 335
Cys His Leu Cys Arg Gln Lys Val Arg Arg Gly Gln Thr Gly Ser His
340 345 350
Met Gly Thr Ser Ala Leu Ser Ser His Met Lys Arg His His Arg Met
355 360 365
Thr Trp Glu Gln His Gln Ser Gly Arg Ala Pro Gly Gly Ser Gly Ala
370 375 380
Ser Cys Pro Pro Pro Pro Ile Pro Gln Gly Thr Gly Ala Ser Ser Pro
385 390 395 400
Ile Pro Val Ala Arg Glu Glu Asp Ser Glu Ala His Ser Trp Arg Arg
405 410 415
Pro Leu Cys Ser Ser Ala Ser Ser Ala Ala Pro Ser Val Ser Ser Ser
420 425 430
Ser Leu Leu Pro Ser Ala Gln Pro Leu Ser Arg Gln Val Ser Leu Pro
435 440 445
Gln Phe Leu Gly Arg Lys Ala Pro Leu Ser Ser Ser His Pro Gln Val
450 455 460
Gln Arg Leu Asn Ala Cys Leu Ala Lys Leu Leu Ala Val Gln Leu Leu
465 470 475 480
Pro Tyr Gln Leu Val Asp Ala Ala Pro Phe Arg Gln Leu Met Ala Cys
485 490 495
Ala Ala Pro Asn Trp Arg Ile Pro Ser Arg His Tyr Phe Ala Arg Lys
500 505 510
Ala Val Pro Ala Leu His Gln Gln Val Val Asp Asn Val Ser Leu Ser
515 520 525
Leu Asp Tyr Ala Val Gly Gly Arg Val His Cys Thr Thr Asp Thr Trp
530 535 540
Thr Ser Arg His Gly Gln Gly Arg Tyr Ile Ser Tyr Thr Ala His Trp
545 550 555 560
Val Thr Leu Met Ser Ala Gly Glu Gly Ala Gly Ser Arg Thr Pro Leu
565 570 575
Arg Leu Glu Val Pro Pro Arg Gly Val Lys Gly Lys Pro His Thr Ala
580 585 590
Thr Ser Ser Ser Ser Ser Ser Thr Met Asp Glu Pro Pro Leu Lys Arg
595 600 605
Pro Arg Ser Tyr Ala Ser Val Gln Tyr Lys Arg Cys Gln Ala Val Leu
610 615 620
Gln Leu Leu Cys Leu Gly Glu Arg Ser His Thr Ala Pro Glu Leu His
625 630 635 640
Ala Ala Phe Gln Thr Gln Val Gln Arg Trp Phe Thr Pro Arg Gln Leu
645 650 655
Gln Ala Gly Asn Val Val Cys Asp Asn Gly Arg Asn Leu Leu Ala Ala
660 665 670
Leu His Leu Gly Arg Leu Thr His Val Pro Cys Phe Ala His Val Leu
675 680 685
Asn Leu Val Val Gln His Phe Leu Lys Ser Tyr Thr Gly Leu Gly Val
690 695 700
Val Leu Glu Lys Ala Arg Arg Val Cys Gly His Phe Arg Arg Ser Pro
705 710 715 720
Thr Ala Ser Ala Ser Leu Ser Arg Met Gln Arg Gln His Ser Leu Pro
725 730 735
Pro His Arg Leu Ile Cys Asp Leu Pro Thr Arg Trp Asn Ser Thr Leu
740 745 750
His Met Val Glu Arg Leu Val Glu Gln Arg Trp Ala Val Ser Asn Tyr
755 760 765
Leu Leu Glu His Ser Ala Arg Gly Thr Gln Gly Ala Asn Leu Gly Tyr
770 775 780
Phe Ser Thr Glu Gln Trp Gln Gln Met Arg Gln Leu Cys Arg Val Leu
785 790 795 800
Ala Pro Phe Glu Gln Ala Thr Arg Phe Val Ser Arg Asp Asn Ala Cys
805 810 815
Val Ser Asp Ile Ile Pro Leu Val Phe Leu Leu Lys Arg Thr Leu Asp
820 825 830
Gly Leu Leu Glu Glu Gly Asp Val Pro Glu Glu Glu Glu Cys Arg Pro
835 840 845
Arg Arg Gln Val Glu Gly Ala Ala Arg His Asp Glu Glu Asp Met Pro
850 855 860
Asn Glu Glu Asp Glu Gly Glu Glu Asp Trp Val Pro Ala Glu Gln Gly
865 870 875 880
Glu Gln Gly Pro Arg His Pro Thr Thr Pro Ala Val Val Arg Gly Trp
885 890 895
Glu Asp Thr Glu Gln Gly Glu Glu Ala Gly Asp Asp Leu Leu His Leu
900 905 910
Gln Gly Ser Gln Glu Glu Val Gly Arg Gly His Leu Phe Tyr Met Ala
915 920 925
Ala His Met Gln Thr Cys Leu Arg Ser Asp Ser Arg Ile Cys Ala Ile
930 935 940
Lys Asp Arg Glu Asp Tyr Trp Val Ala Thr Met Ile Asp Pro Arg Tyr
945 950 955 960
Lys Glu Lys Met Ala Gln Phe Leu Val Pro Ser Gln Arg Glu Arg Arg
965 970 975
Val Gly Gln Leu Lys Arg Ala Leu Cys Ala Lys Leu Met Glu Ala Phe
980 985 990
Pro Gln Pro Asp Thr Gln Ala Ser Thr Thr Pro His Ile Gln Gln Arg
995 1000 1005
Gln Glu Ser Ser Ser Ser Ser Ser Ser Ala Ala Arg Gly Gly Gly Asn
1010 1015 1020
Leu Met Asp Val Trp Arg Ser Phe Phe Glu Pro Arg Gln Ala Ala Ala
1025 1030 1035 1040
Gly Leu Val Ser Thr Gln Ser His His Gln Gln Arg Leu Asp Asn Met
1045 1050 1055
Val Ala Asp Tyr Met Gly Ser Val Ser Val Gln Asp Ala Met His Thr
1060 1065 1070
Asp Asp Asp Pro Met Asn Phe Trp Val Ser Arg Leu Asp Gln Trp Pro
1075 1080 1085
Glu Leu Ala Gln Tyr Ala Leu Glu Val Leu Ala Cys Pro Pro Ala Ser
1090 1095 1100
Val Leu Ser Glu Arg Val Phe Ser Ala Ala Gly Gly Val Val Thr Glu
1105 1110 1115 1120
Lys Arg Thr Arg Leu Ser Thr Gly Ser Val Asp Arg Leu Ser Phe Ile
1125 1130 1135
Lys Met Asn Glu Ala Trp Ile Ser Gly Asp Ile His Val Pro Ile Ala
1140 1145 1150
Asp Ile Arg Asp
1155
<210> 114
<211> 334
<212> PRT
<213> yakuba果蝇(Drosophila yakuba)
<400> 114
Met Arg Lys Leu Ser Gly Glu Ile Gln Asn Asn Ile Val Ser Leu Thr
1 5 10 15
Glu Ser Gly Asn Ser Thr Arg Gln Ile Ala Glu Arg Leu Gly Ile Ser
20 25 30
Gln Ser Ala Val Val Ser Ile Gln Lys Arg Arg Lys Leu Thr Pro Lys
35 40 45
Pro Gln Val Ser Gly Arg Lys Lys Leu Leu Lys Asp Ser Asp Ala Arg
50 55 60
Leu Met Met Ser Glu Met Arg Lys Asn Lys Asn Leu Thr Pro Lys Gly
65 70 75 80
Ala Cys Leu Ala Ile Asn Lys Asn Val Ser Glu Trp Thr Ala Arg Arg
85 90 95
Ala Leu Gln Asp Ile Gly Tyr Met Ser Ile Val Lys Lys Asn Lys Pro
100 105 110
Ala Leu Ser Asp Lys Asn Val Lys Ala Arg Leu Lys Phe Ala Lys Asp
115 120 125
His Lys Asn Trp Thr Ile Asp Asp Trp Lys Arg Val Val Trp Ser Asp
130 135 140
Glu Ser Lys Phe Asn Arg Phe Gln Ser Asp Gly Lys Gln Tyr Cys Trp
145 150 155 160
Ile Arg Pro Gly Asp Arg Val Gln Arg His His Val Lys Gln Thr Val
165 170 175
Lys His Gly Gly Gly Asn Ile Met Val Trp Gly Cys Phe Thr Trp Trp
180 185 190
His Ile Gly Pro Leu Gln Leu Val Glu Gly Ile Met Lys Lys Glu Asp
195 200 205
Tyr Leu Arg Ile Leu Gln Thr Asn Leu Pro Asn Tyr Phe Asp Lys Cys
210 215 220
Ala Tyr Pro Glu Lys Asp Ile Ile Phe Gln Gln Asp Gly Asp Pro Lys
225 230 235 240
His Thr Ala Lys Ile Val Lys Glu Trp Ile Gly Lys Gln His Phe Gln
245 250 255
Leu Met Glu Trp Pro Ala Gln Ser Pro Asp Leu Asn Pro Ile Glu Asn
260 265 270
Leu Trp Ser Ile Val Lys Arg Arg Leu Gly Gln Tyr Asp Ser Ala Pro
275 280 285
Lys Asn Met Gly Asp Leu Trp Glu Arg Val Ala Val Glu Trp Ser Arg
290 295 300
Ile Pro Gln Asp Ile Leu Arg Asn Leu Val Glu Ser Met Pro Lys Arg
305 310 315 320
Val Thr Glu Val Ile Val Asn Lys Gly Leu Trp Thr Lys Tyr
325 330
<210> 115
<211> 2687
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 115
taggcatggg ctaattgtgc gagacctatg ccgcacactc agttcactca agtgtgcggc 60
tgaccaccgc acgcgaaaaa gtgtacgggt aggtcttccg cacgcataag gaatgacttc 120
ggttgtgact ggttgaacga aaaaaaaaac attaatttta gtcgactgtg ttcaacagtc 180
aaataaaaaa tcgatcacac tctgagcgag aaagaatacg caaattgtta gcgtatttag 240
ttgggtcagt cgcactaaaa gaactcctgt ccaagactga catggaacga gaaatacact 300
catacccgtt gggtcagtcg cacactgccg cacgcgtgtt cagtttggtc agtcgcacac 360
acagctgcac aaaaagaaat tctgtcgcac actgccgcac gtttgctcag ttcgttcatt 420
cgcacacagc cgcacaaaaa gaacttctgg cgcacactgc cgcacgcgtg ttcagttggg 480
tcagtcgcac acagccgcac aaaaagaact tctgccgcac actgccgcac gtttgctcaa 540
ttcgttcatt cgcacacagc cgcacaaaaa gaacttctgc cgcacgctgc cgcacgtgag 600
gtcagttggg tcagtcgcac acagccgcac aaaaagaact tctgccgcac actgccgcac 660
gtttgctcaa ttcgttcatt cgcacacagc cgcacaaaaa gaacttctgc cgcacgctgc 720
cgcacgtgag gtcagttggg tcagtcgcac acagccgcac aaaaataact cacactgact 780
acgctagtaa tatgctcgtt ctctctgcgc tgtcggatca gtcgcacaca gtcatacaaa 840
gaactgctac cgcacactgt cctgatgaaa cacagggttt gatgtctttt tggttgtttc 900
ttcatttttt ggatttatct cacattttat tgcatgcttc ccaaattatt ttggactcat 960
tccacaattt attatatgtt tctcatataa ttttgtattc gttttgtgat ttattcttac 1020
catcccagtt gttttgaaac aaataattga acaaatttta tgaaacgtta aataatcgtg 1080
atccataaac cctgtaatag gagacaaaat tggtatcaat agcatcttct tccttctcat 1140
tttctgctga ttgtttttta cgtagcacca gacattctta gcgtggggaa ctgtgtggta 1200
ttgatatgta tcgaatgtaa gagcaaggag ggaaaaacgt acactaggta ttcgctagtt 1260
gaatgatttg aaatgtggat cattttttta agttgcatgg tcgatgtgag atttataaat 1320
cgatgatttt taatcttgaa atattcacca catgcaaaat caaaaaatct ccaaatcttt 1380
atattctttt gctttttatc atttaaaaaa atatgccaat tcaaaatgca atacatgtca 1440
cacattacaa tttcaattag cgagctcaaa ctgtaccatc ccacgatgtt ttattcgaac 1500
accattacta gtgaggcatg cttttcgcac actaagttga tgagtgcaat atgtatataa 1560
aagaacgtca agtattcgga aagtggctta cccattatga atgagtccct cgtttgttgg 1620
tgttgtatga ataatattgc agtaggtaac aaagtgaaat agtattgaag tgcgtttccg 1680
gtatcagagt tttagctttg cattgtcgtt gcgattccta ttttggttgt gtatcgaatc 1740
agtcgcatta aaggaaagta cccagtttga aaattcataa cgcgtaaata ctttttctgt 1800
ggaagaatcg gcagggataa cctgataact aattaaaggt aagttgcttt attattttta 1860
acttttaaca agatgagaaa aaatgacaaa tcgtcattta ttcttttttt tatttcataa 1920
aaaaaatcct agttcagtgg tcgagaaagt acggcaatcc gtttacgatt tttgccagca 1980
ttttcactcc ttaacagccc cttgctattg taggagtatt caaaatctcc cacagtttca 2040
cgccttcatc tgaaaatccg gtttggaaat ttactgacat ttgtatagaa tttagctgtc 2100
tatggcgtca agttaaccga cgtttttttt ctagttcagt ggtcagcaaa ctttgtggtg 2160
aaaagagcca aattctatga aaatgttggt agatttcgat atgaagagcc aaatttgaaa 2220
accaagcata caattgagtt aaccactgtc ctcatttgga ccttccttcc acaaatgaca 2280
ttcaaagcca aaactattca atgttttggt cacaccagtg acaactatga tcgactgact 2340
tttcatgatg actgagtaac ttttaatcga agtaatagat ttaatcatta tagtaaaatt 2400
tacatcatca attaaaaata atgatctaca atttatcaat aattaaagtt tcctcaaaat 2460
accaaagcac agtgatagta ttacgtttat tttatttgaa taatattgct ataattataa 2520
tttacaacaa ttgctgacgg gactggaact ataccaaaac gttctttaat taaaaaaaaa 2580
ctgttcgttt tagcagtcat actgttaaag ccatttaggc tgttagataa ttgaacaaat 2640
atttaaaatt ttatttttga ttaatgttgt aatatgtttt agttaag 2687
<210> 116
<211> 1472
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 116
tagagttgtg cctcaagaac cagaactgta cgattcattc aattcatcct aaagaacgaa 60
cgacctacgt tcatctaatc aacgttcatc gattctttat aaattataat gtattgagtt 120
gttcatgaaa ataacccggg taggaacccg tcgaaatgaa gaacgtccta gtacgccagg 180
tcgttcattc cccccataca aatatgaacg tgaatcgtat gaccaggacg ttcacgaaaa 240
gaacgtccta cccgtcgaaa taaagaacgt cctagcaagc caggtcgttc attcccccca 300
ttcaaaatga acgtgaatcg tatgaccagg acgttcacga aaagaacgtc ctacccgtcg 360
aaataaagaa cgtcctagca agtcaggtcg ttcatttttt cccatacaaa tatgaacgtg 420
aatcgtatga ccaggtcgtt cattctcctg atacaaaaat gcgctgtccc acatgataga 480
catgtgtcga tgaaacaaaa tcagcatact ttctcactca gcccaacaaa acatccgatc 540
tggcattctg cactggcttt ctgcggagag cacagtacaa gataagagag cggatagaat 600
gtttcgttga tctacatcgt tcactctctt tctgatcctc ggagacgatg ccgcttctgc 660
aatatgcgct ctctttttct tcccgctgca atactttcag ctgatagtta ccgagagaac 720
gatcacagag atagagagtc aaaaaaatga cgaggacggg gggtggtatg tgggatgagt 780
ttttttacct acttgtgagc gaggtacagt caaagttcaa taattgaacg aaattttggt 840
ttgtatattt ttcgatggat atttgatagt aggttgatag atcaactaaa aagcatgcct 900
ttatattagt gaatctaatt tcatagaaaa tcgcaaaact gtcgcctata atgaaaaaaa 960
aacttcattt attttgtgca ggaaagaacg tgaaaattta tcaccaaacg tgacactaac 1020
caaacagtga gctgccaatc gaagttcaat tagtgagttt gaactgtact agtcgttttg 1080
tttgagagag aaatgacctt ctcgcgcttt gaggaagaga ggaaaattac actaatacgt 1140
ttatggtcac taaatccata tgataaatac atagatcacg tgtgttcggt tcgttgttgt 1200
ataggtgatt ttgaccgtta tttttgaata cgttcgattt cttcaatgtg ttgtaggctt 1260
atggtaataa acattgctga aaccgtgatt gtattgataa attgatcttt gatatgccat 1320
ttgttgtgat cttttgactt gtaaaccaca aattgatcta cgctccatcg aaataagtga 1380
aaatttaata attgcacggc gatcaaaggt aacattagtc ttggtagtta aaaacaaaaa 1440
cataaagtgt tgtatgaaac atttccacag at 1472
<210> 117
<211> 364
<212> DNA
<213> 斑马鱼(Danio rerio)
<400> 117
cagcggggaa aataagtatt tgacacatca gcatttttat cagtaagggg atttctaagt 60
gggctactga cacaaaattc ctaccagatg tagccatcaa gccaaatatt gaattcatac 120
aaagaaatca gaacatttaa gtatacaagt tgagtcataa taaataaagt gaaatgacac 180
agggaataag tattgaacac atgaagataa caaggtgcaa aatggcatag aaagtcagga 240
gatctgtcag tattgagaga aaaaccctgc tccctatcag tactaattga tatcagctgc 300
tttagtccta attgatggcc tataaaggct tctcattact caggaggcac acaggaaaga 360
cttc 364
<210> 118
<211> 287
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 118
cacaggggtc gggaacctat ggctcgcgag ccagatgtgg ctcttttgat gattgcatat 60
ggctcgcaga taaaacaaaa tattctcact tgttttaatc catccatcga tttttcactg 120
cgcatgtcct gttcagggct gcaggagcaa ttgtccatta ttttaattgg atgatactgg 180
cctacgtttg ccgttgctgg gtaaaacagg taaacgcccc cttttgaatc agtctgagac 240
tgcgtctgct cggtcattag ctcaaagcta acccttcgac gaagaag 287
<210> 119
<211> 877
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 119
caggggtctc aaactcacgg cccgcgggcc atttgcggcc ctccatccaa tattttgcgg 60
cccgcaccaa ggggagctgg cgcagaagtc gggctccgtc agcagaagcg ctggcagcgg 120
cggcagaagc accccagtta ccaggggcgg cataaaaagc cgcacctggt aactttaaga 180
gccgaatttc cggtttttaa accggaaatt cggctcttct agtgcagaga gcgcaattgc 240
gctctctgca tctagcgatc tcaccgccgg cagtgtcagt cagaatgtcg ggctccatca 300
gcagaagcgc cggcagaagc gccggcggca gaagccccca gttaccaggg gcggcataaa 360
aagccgcacc tggtaacttt aagagccgaa tttccggttt ttaaaccgga aattcggctc 420
ttctagtgca gagagcgcaa ttgcgctctc tgcactagcg atctcaccgc cggcatccag 480
gagtgtcagt aaagcgcttc cgggccagcg ttgcgtccct cctaagccac gcctgctgca 540
agttttttct gttgtgggag tacagtccct gcctagcgcc aaatttggat ctgctgaatc 600
tgtccctgct gatctgtctg aagcctgtcg ttgcgttcgc ctctggtatg attcaaggga 660
ccatttctgt caaatttgag gtacgtgcct gtttcctctg tgggtgaata tcgggaatgc 720
tgggagttgt agttcggttg cagtagctcc tgcttagcag ctaattgtgc acacagaacg 780
ttgtgccttg cattatatcc cttgaaagcc aattagaatt agaacagaca caagggagag 840
aagtttagta cagaattagg ttttgtcata cttcatc 877
<210> 120
<211> 365
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 120
cagtggagga aataattatt tgacccctca ctgattttgt aagtttgtcc aatgacaaag 60
aaatgaaaag tctcagaaca gtatcatttc aatggtaggt ttattttaac agtggcagat 120
agcacatcaa aaggaaaatc gaaaaaataa ctttaaataa aagatagcaa ctgatttgca 180
tttcattgag tgaaataagt ttttgaaccc ctaccaacca ttaagagttc tggctcccac 240
agagtggtta gacacttcta ctcaattagt caacctcatt aaggacacct gtcttaacta 300
gtcacctgta taaaagacac ctgtccacag aatcaatcaa tcaagcagac tccaaactct 360
ccaac 365
<210> 121
<211> 472
<212> DNA
<213> 斑马鱼(Danio rerio)
<400> 121
caggggtggc gaacccgcgg ctcgcgagcc gcttgcggct cttttactgc tcttgtgcgg 60
ctcaacctct cgcgcgattt aacatacatt aaccaattga ctaacgcccc attcacacgg 120
tgcttctgcg tctctttctg cttttgtgcg gctcaacctc ttgcgcgatt taacatataa 180
taaccaattg actaatgccc cattcacacg gggcttcagc gttgctcgct gcagaagctg 240
ggagtagctc aacttttcaa gcgcttacgg acgcgttagc caatcagatc gctgtatgca 300
aatacacctg ctagacagtg gcctattgct gactgaattt tattttctga cgcttccatg 360
acgatcgttt cagctctaac ttcagacacg ccttcagtca agggttgaca ctgaagcccc 420
gtttgattgg ggcgcaacac gagtgacgtg cagttcgtta atatcaatcg tc 472
<210> 122
<211> 356
<212> DNA
<213> 红鳍东方鲀(Takifugu rubripes)
<400> 122
cagtgagagt aaaaagtatt tgatcccttg ctgattttgt tggtttgtcc actaataaag 60
acatgatcat tctatacttt taatggtaga tgtattctaa catggagaga cagaatatca 120
aaaagaaaat caagaaaata actttaaaga atttatttta atttatttgt ttttcattga 180
gggaaataag tatttgatcc cctagtatgc attaggagtt ctggctttca cagaccagtt 240
agacgctccc aaacaacttg ttacctgaat tgaagacacc aggtctaact aatcacctgt 300
atgtaagaca actgttcaca gaatcagaca atcagacaga ttccaaactc tccacc 356
<210> 123
<211> 297
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 123
caaaccggat tccaaaaaag ttgggacact aaacaaattg tgaataaaaa ctgaacgcaa 60
tgatgtggag gtgccaactt ctaatatttt attcagaata gaacataaat cacggaacaa 120
aagtttaaac tgagaaaatg taccatttta agggaaaaat atgttgattc agaatttcat 180
ggtgtcaaca aatcccaaaa aagttgggac aagtagcaat aagaggctgg aaaaagtaaa 240
tttgagcata acgaagagct ggaagaccaa ataacactaa ttaggtcaat tggcaac 297
<210> 124
<211> 369
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 124
cagtggcttg caaaagtatt cggccccctt gaacttttcc acattttgtc acattacagc 60
cacaaacatg aatcaatttt attggaattc cacgtgaaag accaatacaa agtggtgtac 120
acgtgagaag tggaacgaaa atcatacatg attccaaaca ttttttacaa ataaataact 180
gcaaagtggg gtgtgcgtaa ttattcagcc ccctttggtc tgagtgcagt cagttgccca 240
tagacattgc ctgatgagtg ctaatgacta aatagagtgc acctgtgtgt aatctaatgt 300
cagtacaaat acagctgctc tgtgacggcc tcagaggttg tctaagagaa tattgggagc 360
aacaacacc 369
<210> 125
<211> 623
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 125
tacagtgtcg gacaaatcaa taggaccact tatcaattta ttattcactt atcatatttc 60
atgacttaaa gtgaatcaat ctttaccaaa ctttcatgaa agcactatta gaatgtttac 120
tttaagaatg tttttaaagt ttggtgaaaa gttaagaaac aaaaaagtta tgataagaaa 180
tgtaaaaata acccaaaaat catgcgccaa aataatagga ccagttcaga aaattttaaa 240
ataattatca tttattattg ttaaaacaca gtttttgatg ttattgagtt gtcggataac 300
ttaacttaaa ttagtgaact aatgcgtatt catttttttt gtagaaacgc ttagcgcagt 360
ggcaattcgc tgtgtcttta attaacatgc tctaatttac taatgcaaga atattacggc 420
actcgcttaa gggttttgag ctccctttgc actgagagac gaaatagtgg tgagtacctt 480
cgtctatggg tataaaagcg cgtcacagcg ctggatcgct tacactgtgt tctaagccgt 540
tgcctagaac acttcacacg atccattagc tcgtgtattt ttgggtgcac tacttcaagc 600
gcttgattga aggaattcca acg 623
<210> 126
<211> 393
<212> DNA
<213> 非洲爪蟾(Xenopus laevis)
<400> 126
cagtggtgtg aaaaactatt tgcccccttc ctgatttctt attcttttgc atgtttgtca 60
cacttaaatg tttctgctca tcaaaaaccg ttaactatta gtcaaagata acataattga 120
acacaaaatg cagtttttaa atgaaggttt acgttattaa gggagaaaaa aaactccaaa 180
tctacatggc cctgtgtgaa aaagtgattg ccccccttgt taaaaaataa cttaactgtg 240
gtttatcaca tttcaatttt caatttcaat atcaatttct gtagtcaccc ccaggcctga 300
ttactgccac acctgtttca atcaagaaat cacttaaata ggagctacct gacacagaga 360
agtagaccaa aagcacctca aaagctagac atc 393
<210> 127
<211> 271
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 127
cactggtgga cataaaaata ggaaaaaaaa attttgtgtg ttttttttgc atacactagg 60
tgtgtcatcg ccaacagttc gaggcgtact gaatttgcaa tagccgaatt ttgcctttta 120
tactctcatt tttggtgcgc tacttatctg agttttgagt gccggcagcg ttttgcggca 180
gtataaaagg agagccaaac cgtgttgtgc ttcattcttc catcagtggt caaggtgaaa 240
ggttgctatt taaaaattcc acaaaatcat c 271
<210> 128
<211> 153
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 128
atatacactc accaaaagga ttattaggaa cacctgttca atttctcatt aatgcaatta 60
tctaatcaac caatcacatg gcagttgctt caatgcattt aggggtgtgg tcctggtcaa 120
gacaatctcc tgaactccaa actgaatgtc aga 153
<210> 129
<211> 872
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 129
caggggtcac caaactacgg cccgcgggcc gatccggccc gcgacgtcag tccatcaggc 60
ccgccgacgg tacttgaatt tggttgataa aacgtatgga acacgagacg ttgtgataca 120
atttaaattt aaatattatg tttagaatac taggagatct tcacgcgtgc ggagacctcc 180
tgactgctat gtgccttaaa tttactattt taattttaaa ttattgtatc tagattttct 240
tgtttattgt aatgtttgct tatttcgcgc catcccaagt ccttccccgg ctcgtggtag 300
ctccgcctac gctctgacgt taccatggtt tccatggcaa cgtcatggca acacgttacc 360
atggtttcca tggcaacaca cacaaacacg catctttccc gcccccagat tttccggctg 420
tcaacacagg tccgacgctc cagaaatatt tacttctttt tgcctgtcat ccattttata 480
ggtatgtaac aaggatttct ttgtttgaca gtgataggta agtgaactac aagtgtgatt 540
agaggtcata aagtaacaaa catagaataa caatgccata gaagcctcgt gttattacga 600
aaatattatc cccagctcag aaaaattccc cggtcaaggt gttaatcgag ctggtctcta 660
ggctgtttat ttaggcccgc cctatttata tattttgtaa accttattat gtgatatatt 720
ctattaccaa aggtacctat aaactttata tgtacctttg gtgagccgta gcttcaccag 780
tgacccctga atcctctgct tttcttgtgt ttcaatagga aacaattcaa tgtctttttc 840
attttcagat cccgttttct tcacccttca tt 872
<210> 130
<211> 368
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 130
cagtgaggga aaaaagtatt tgatcccctg ctgattttgt acgtttgccc actgacaaag 60
aaatgatcag tctataattt taatggtagg tttatttgaa cagtgagaga cagaataaca 120
acaacaaaaa tccagaaaaa cgcatgtcaa aaatgttata aattgatttg cattttaatg 180
agggaaataa gtatttgacc ccctctcaat cagaaagatt tctggctccc aggtgtcttt 240
tatacaggta acgagctgag attaggagca cactcttaaa gggagtgctc ctaatctcag 300
cttgttacct gtataaaaga cacctgtcca cagaagcaat caatcaatca gattccaaac 360
tctccacc 368
<210> 131
<211> 87
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 131
caggcgctcc tcacttaacg acctacctgt ttaacgaccg cgcggactta cgaccgcgcg 60
gtcgtggaaa cggaagtact gtacaag 87
<210> 132
<211> 699
<212> DNA
<213> 小棕蝠(Myotis lucifugus)
<400> 132
cagtgatggc gaacctatga cacgcgtgtc agaggtgaca cgcgaactca ttttgggtga 60
cacgcatcga cagagacaaa aaattgcata attcaaatat ttgtctctcg caacggccag 120
agttgggcat cactcgagta atattattac tcacgttact catgatcaat aatgcaattc 180
taaaaccgga tgtaaacatg tacatcggtg ttgcgtagca aagatacata gtgaaaacat 240
ccaagataca ttgttccaat attgacatta atataaaaag gttaagaatt gcactataaa 300
gagattaatc tttactcatg acattttatt tttactcgag tgacaaaatg cccaattctg 360
gaaacggcct cgttattgtc aacatgtgcc tcgggtaagc ttcccgtgcg ttcgggtgca 420
ttcggcaaac ggacgcactt gatcgccatg ttcgttagga gacaggagtg ggagggttag 480
aagaaaaaga tatacagtgc aacagtgctc gacgagacat tctgcgtgtc ggataattga 540
ttacagcacc atatatttgt tggttataca tactatcttt gaattgtttt gcaccaggag 600
tcagtgcaac aacactgcaa aaagttaata ggtaagaaac ctatcaacct tttataaaaa 660
acgccgtgat ttatatttat ttatttttgc agccttgtg 699
<210> 133
<211> 301
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 133
cagacatggg caaagtacgg cccccgggcc gtatacggcc cgttgggctt tttaatccgg 60
cccgccgaac ttgtccaaat attattatta aattaaattt tacctttctc ctgtaatgcc 120
cccatttccc cattagatgg cgcactttga ccgggagtgt ggtgtatagg gctcgaaagg 180
gcacatgatc tcgcaatgca ttgtgggccg tcagcgccat tttcagggtt tgtttacatt 240
gctgagttag atacggtgct cccttcactt tttcgctttg ccctgtgagc ccttctgtaa 300
a 301
<210> 134
<211> 394
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 134
cagtggatat aaaaagtcta cacacccctg gtaaaatgtc aggttcctgt gctgtacaaa 60
aatgagacaa agataaatca tttcagaact ttttccacct ttaatgtgac ctataaactg 120
taccactcaa ttgaaaaaca aactgaaatc ttttaggtgg agggaagaaa accaaaaaaa 180
ctaaaataat gtggttgcat aagtgtgcac accctcttct aactggggat gtagctgtgt 240
tcagaattaa gcaatcacat tcaaaatcat gttaaatagg agtcagcata cacctgccat 300
catttaaagt gcctctgatt aaccccaaat aaagttcagc tgctctagtt ggtctttcct 360
gacatttttt tagtcgcatc ccacagcaaa agcc 394
<210> 135
<211> 382
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 135
cagtcatggc caaaattgtt ggcaccccag aaatttttcc agaaaatcaa gtatttctca 60
cagaaaagta ttgcagtaac acatgttttg ctatacacat gtttattccc tttgtgtgta 120
ttggaacaga acaaaaaagg gaggaaaaaa agcaaattgg acataatgtc acacaaaact 180
ccaaaaatgg gctggacaaa attattggca ccctttcaaa attgtggata aataagattg 240
tttcaaacat gtgatgctcc tttaaactca cctggggcaa gtaacaggtg tgggcaatat 300
aaaaatcaca cctgaaagca gataaaaagg agagaagttc acttagtctt tgcattgtgt 360
gtctgtgtgt gccacactaa gc 382
<210> 136
<211> 357
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 136
cagtgaggaa cataagtatt tgaacaccct gcgattttgc aagttctccc acttagaaat 60
catggagggg tctgaaattc acattgtagg tgcattccca ctgtgagaga cagcatttaa 120
aaaaaaaatt caggaaatca cattgtatga tttttaaaga atgtatttgt attgcactgc 180
tgcacataag tatttgaaca cctggcaatc agcaagaatt ctggctctca aagacctgtt 240
actctgcctt taaaaagtcc acctctactc cactcattaa tctaaattag tagcacctgt 300
ctgagctctt taaagacacc tgtccacccc acagtcagtc agactccaac tactacc 357
<210> 137
<211> 297
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 137
cactgctcaa aaaaataaag ggaacactta aacaacacaa tgtaactcca agtcaatcac 60
acttctgtga aatcaaactg tccacttagg tagcaacact gattgacaat caatttcaca 120
tgctgttgtg caaatggaat agacaacagg tggaaattat aggcaattag caagacatcc 180
ccaataaagg agtggttctg caggtggtga ccacagacca cttctcagtt cctatgcttt 240
ctggctgatg ttttggtcac ttttgaatgc tggcggtgct ttcactctag tggtagc 297
<210> 138
<211> 318
<212> DNA
<213> 红鳍东方鲀(Takifugu rubripes)
<400> 138
cactgctcaa aaaaattaga ggaacacttt ttaatcagag tatagcaacc tatcagtcaa 60
acttctggga tattgatctg gtcagttaag tagcagaggg ggttgttaat cagtttctgc 120
tgctttgttg ttaatgaaat caacaacagg agcatcagag gggcaacaat gagacggccc 180
ccaaaacagg aatggctttc caggttgagg ccactgatac ttttttccct cctcatctct 240
tttggctgat tttttactga ctgactttct actgctgtag ttattcattt ggcttggatc 300
aacatctctg ttgatagc 318
<210> 139
<211> 1052
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 139
tagggatgta gcgaactgtt cgccggcgaa ctaattcgcg cgaacatcgg gtgttcgcga 60
acccgcaagt tcgcgaactt ttggcgtatg ttcgccattt gggttcgcct tagctggcgc 120
caaattttga cctctcaccc cagaccagca gatacatggc agccaatcag gcagctctcc 180
ctcctgggcc accccccccc ccttggacca ctcccttcca tatataaacc gaagcccagc 240
agccatttta cattctgcct gtgtgtgctt gaagagatag tgtagggaga gagctgtgca 300
ttgatttgag ggagagttta agtaggtttt ctggctagta atctactttc tactgctctg 360
tatttgtgtg gggagaggaa gctgtgcatt gatttgaggg agagtttaag taggttttct 420
ggctagtaat ctactttcta ctgctctgta tttgtgtggg gagaggaagc tgtgcattga 480
tttgagggag agtttaagta ggttttctgg ctagtaatct acttctactg ctctgtattt 540
gtgtggggag aggagctgtg tattgatttg aggcagagtt taagtaggtt ttctggctag 600
taatctactt tctactgctc tgtatatttt gtctaaataa caatttgtct aaataacaat 660
aataattccg tgtccagaaa catcacctga gtgacggttt tccaccagca ataatatatt 720
ccgtatccac tactgtatac gttgcccttg caggccttgt tgcccggtgt ctgcaaccaa 780
gtgccaccta gctgtgtgag ctttttcaca atctgtctaa ataataataa ttccgtgtcc 840
agaaacatca cctgagtgac ggttttccac cagcaataat atattccgta tccactactg 900
tatacgttgc ccttgcaggc cttgttgccc ggtgtctgca accaagtgcc acctagctgt 960
gtgagctttt tcacaatctg tctaaataac aataataatt ccgtgtccag aaacatcacc 1020
caagttgttg ttgttttgta aaaataaaaa aa 1052
<210> 140
<211> 303
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 140
ccgtattttc cgcactataa ggcgcaccca agagccttaa attttctcaa aaatcgaccg 60
tgcgcctaat aatacagtgc gccttatgtg tgcactgagt tgttgtgcga ctttggtaag 120
cgctccgctt gattgactgt cggaccattt cccgctgaca cagggacgta atacgtacac 180
tacatatgtt ggcagcgata aaccaatcag agaacattac gtaatacgtg cagtacgtac 240
gcttacctct gtcacgcctc cggtaggtat actaccagta tactgcaaaa caaccccccg 300
aaa 303
<210> 141
<211> 328
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 141
aaaattattt agtttttgga ttgaatttag gtaagcctaa gaatgaaata aattgttagt 60
gtgtatgata tattttttat aacttttctc ttaaactaaa aatttataaa ttagaattgt 120
aacaccatgg actaaacatc tcaacaaata cataaaagta aagttttgtt cgagcatccg 180
cattatttat ttaaaataaa agacagttca aaatttaatt ctttgtgtga ccgacagtgc 240
gactgaccta ccgcacgcgt tcagttcctc atactgaacg aactacaccg cacgcgttca 300
ctgaaaagaa tcaaattgcc caagccta 328
<210> 142
<211> 418
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 142
tcaaaacgtc gttgcaaaat ttgtaacatg gagtatatga aataattgtt ttgtaatgca 60
ctttttgtaa ttaagtaaga cttgaattat ctagatgtaa gtgttatttt tgtaatataa 120
aaaatgaatt caaaatggtg ttaaaatgtg ttggttgcct taatcataat agatgcatca 180
cttaataaca taattaggaa tacacgagtt ttttagttca gtgactaaga actgttatgc 240
ttattatatg aaactgttaa caaacaccca taatatgaaa ctatcgcgaa ataagatcga 300
tttaccatac tgtggttagt tgacgtgaac gattgaatcg cgattcacgc tcagttcatg 360
ttaatgaaag aaccggtaaa ttcacgttca tggtaatgaa tcgaattgcc caacccta 418
<210> 143
<211> 207
<212> DNA
<213> 斑马鱼(Danio rerio)
<400> 143
gtaaagtgtg ttcaatactt attccctgtg tcatttcact ttatttatta tgactcaact 60
tgtatactta aatgttctga tttctttgta tgaattcaat atttggcttg atggctacat 120
ctggtaggaa ttttgtgtca gtagcccact tagaaatccc cttactgata aaaatgctga 180
tgtgtcaaat acttattttc cccgctg 207
<210> 144
<211> 166
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 144
tggtgagtgt tataacaaca ttatttaaaa gaataaattc agaggcttat tatactgaca 60
tttagttgaa ttcactttta aaatatatta tatggctctc actgaaataa atttccaaat 120
tttttgcttt catggctctc ttagtcaaaa aggttcccga cccctg 166
<210> 145
<211> 206
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 145
gcaaaagatg ccatgttcag aagaactgtt catgatcttc actcaatgtt ctattcatgt 60
tcaggacact tcatgttcag aagaaataat taaaactgtt aataatgaca tttgagtact 120
tttttttgta aaatccctta tgcggcccag cctcatcctg actttgcctc ctgcggcccc 180
caggtaaatt gagtttgagc cccctg 206
<210> 146
<211> 226
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 146
gtcttttttt gttagagggt tcaaaaactt atttcactca atgaaatgca aatcagttgc 60
tatcttttat ttaaagttat tttttcgatt ttccttttga tgtgctatct gccactgtta 120
aaataaacct accattgaaa tgatactgtt ctgagacttt tcatttcttt gtcattggac 180
aaacttacaa aatcagtgag gggtcaaata attatttcct ccactg 226
<210> 147
<211> 173
<212> DNA
<213> 斑马鱼(Danio rerio)
<400> 147
gtcaagtaaa atgaggtagg ctaatttaaa tccatgaaaa ctattgcgtt atataattag 60
gtgtataagt tattgtgaca gatatactgt tgtttgcgca tctgttgtgt ggctctttgc 120
agtgataaag tttttttttt ggctcatcat gccaaacagg ttcgccaccc ctg 173
<210> 148
<211> 216
<212> DNA
<213> 红鳍东方鲀(Takifugu rubripes)
<400> 148
gtgcttttgg atagagggat caaatactta ttaccctcaa tgaaaaacaa ataaattaaa 60
ataaattctt taaagttatt ttctggattt tctttttgat attctgtctc tccatgttag 120
aatacatcta ccattaaaag tatagaatga tcatgtcttt attagtggac aaaccaacaa 180
aatcagcaag ggatcaaata ctttttactc tcactg 216
<210> 149
<211> 220
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 149
aaatggcctt gtcccaactt ttttgggatt tgttgacacc atgaaattct gaatcaacat 60
atttttccct taaaatggta cattttctca gtttaaactt ttgttccgtg atttatgttc 120
tattctgaat aaaatattag aagttggcac ctccacatca ttgcgttcag tttttattca 180
caatttgttt agtgtcccaa cttttttgga atccgggttg 220
<210> 150
<211> 217
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 150
ctcagggggc tgaataatta cgcacacccc actttgcagt tatttatttg taaaaaatgt 60
ttggaatcat gtatgatttt cgttccactt ctcacgtgta caccactttg tattggtctt 120
tcacgtggaa ttccaataaa attgattcat gtttgtggct gtaatgtgac aaaatgtgga 180
aaagttcaag ggggccgaat acttttgcaa gccactg 217
<210> 151
<211> 375
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 151
atgctaccaa gttagcccag gataaggctg ttttgttatt ttctttagtt tttcaaatgt 60
acgggctggc cacattgcga attaaaagcc ggagctgtaa ttatttatag gcaataatga 120
taaatggtta aaataataaa attttctata ctggtcctat tattttgtcg catgattttt 180
ggggtttttt caacatttct tataataact tttttgtttg ttaacttatc aacaaacttt 240
caaagcagac tttaagccaa catccgaaaa gtgctttcat gaaaatttgg taaatattga 300
ttcactttag gtaatgaaat gtgataagtg aataaaacat tattaagtgg tcctattgat 360
ttgtccgaca ctgta 375
<210> 152
<211> 218
<212> DNA
<213> 非洲爪蟾(Xenopus laevis)
<400> 152
gttcaggggg caattacttt ttcacacagg gccatgtagg tttggatttt ttttctccct 60
aaataataaa aaccctcatt taaaaactgc attttgtgtt tacttgtgtt atctttgact 120
aatagttaaa tgtgtttgat gatcagaaac attttgtgtg acaaacatgc aaaagaataa 180
gaaatcagga agggggcaaa tagtttttca caccactg 218
<210> 153
<211> 143
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 153
aatgtgtttt cgctcagtgg aacaccgcaa cacctcctcc caacaaccac ttaaacagtc 60
cttttcaggg ctaccaaata tttctgacaa gaactatgtc tttcggtcac agaaaaaagt 120
tcctattttt atgtccacca gtg 143
<210> 154
<211> 37
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 154
tatggtgttc ctaataatcc ttttggtgtg tgtatat 37
<210> 155
<211> 303
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 155
ccttttttgc tgcttagttt gtgagattcg gatatgtgca cactaggtct gatgtaacta 60
tctttttgct aacgtcgcct tctttgataa ctttttagta aataaatatg ttggttgtct 120
ttgttttttg tgcattgcac gccactcacc catgattaac atggaatgct aaacttagtt 180
tttcgtcttt tttccccgag ctttcgttct ggcttgcaag tattgaacag aatgattatg 240
cggcccgcgc tcgtcattct ttcagttatc cggcccactg tgaaaaaagt ttggtgaccc 300
ctg 303
<210> 156
<211> 216
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 156
gtcatgtttt gcagaggggt caaatactta tttccctcat taaaatgcaa atcaatttat 60
aacatttttg acatgcgttt ttctggattt tgttgttgtt attctgtctc tcactgttca 120
aataaaccta ccattaaaat tatagactga tcatttcttt gtcagtgggc aaacgtacaa 180
aatcagcagg ggatcaaata cttttttccc tcactg 216
<210> 157
<211> 381
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 157
cgggattctt ctcgaaagct acacccagga atccacactt tgaaggattc gatgactaaa 60
atgttaatct gaatgtcttt ttttataact ttaatttttt tggtacatca tttttataat 120
tttcgctgat tgtattttta tgttctgtaa tatgtaagag ttatgcaaat taaaacaaag 180
ttatcgagtt ggagtttcct ttagaccttt tctttattca gaataaataa aaacgattac 240
ctgtatttac agtatgcaaa cctaagtaat gtatattaga gctgatttcc tctattcagg 300
ggcggctcct cgcttatcga ccaattcgct taacgaccta gtcgtgggaa cggaactcgg 360
tcgttaagtg aggagtgcct g 381
<210> 158
<211> 290
<212> DNA
<213> 小棕蝠(Myotis lucifugus)
<400> 158
tttctagttt tcgtaccatt tgattatcat tgtttttatt attatttttt cctaaatgta 60
cattgttttt ctgtttttgt tcattttata catatttttt ggttgatttt tctttgttaa 120
atggcattta aatatataaa ataaatatca aaaatataaa tctttttttt actatggttg 180
caaatatcaa aaaaaaatta tgaatatttc tatatgtgac acggcaccag agttaagtta 240
gggtttttca aaattttgac acgccgagct caaaaggttc gccatcactg 290
<210> 159
<211> 389
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 159
aactgaaagt gatgatgtgt tgctgcagcg aggttggagc caaatctccg acacacagcc 60
tgcgtggctg ctctaacctg ttaatgtaga taataaagaa gttcaagtga ggtcattggt 120
ttgggcgcag gcctcagatg ttttcatgat gtttgatcag tcacgttacg acatgttttt 180
gtattgttca tgttcgtgca atttgttaaa ttgccttgca aataaatgct ttgctacctg 240
ttaaaggcca aatcctttca tgtaatgatt tttacatgtc atttatatta gttcacacaa 300
acactccatc catctgttcc tggcccggcc cctctgtcaa attttagaac ccattgtggc 360
ccgcgagtca aaaaatttgc ccacccctg 389
<210> 160
<211> 219
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 160
tttaagggtg tgcacactta tgcaaccaca ttattttagt ttttttggtt ttcttccctc 60
cgcctaaaag atttcagttt gtttttcaat tgagtggtac agtttatagg tcacattaaa 120
ggtggaaaaa gttctgaaat gatttatctt tgtctcattt ttgtacagca caggaacctg 180
acattttacc aggggtgtgt agacttttta tatccactg 219
<210> 161
<211> 218
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 161
gttaagggtg ccaataattt tgtccagccc atttttggag ttttgtgtga cattatgtcc 60
aatttgcttt ttttcctccc ttttttgttc tgttccaata cacacaaagg gaataaacat 120
gtgtatagca aaacatgtgt tactgcaata cttttctgtg agaaatactt gattttctgg 180
aaaaatttct ggggtgccaa caattttggc catgactg 218
<210> 162
<211> 216
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 162
cactgatttt ctcaggtgtt caaatactta tgtgcagcag tgcaatacaa atacattctt 60
taaaaatcat acaatgtgat ttcctgaatt ttttttttaa atgctgtctc tcacagtggg 120
aatgcaccta caatgtgaat ttcagacccc tccatgattt ctaagtggga gaacttgcaa 180
aatcgcaggg tgttcaaata cttatgttcc tcactg 216
<210> 163
<211> 258
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 163
gcctcatttt gacttgtttt aaggacatta catcaaagtt ggatcagcct gtagtgtttt 60
tttccacttt aattttgagt gtgactccaa atccagacct ccatgggttg ataaatttga 120
tttccattga taatttttgt gtgattttgt tgtcagcaca ttcaactatg taaagaacga 180
agtatttaat aagaatattt cattcattca gatctaggat gtcttatttt tgtgttccct 240
ttattttttt gagcagtg 258
<210> 164
<211> 258
<212> DNA
<213> 红鳍东方鲀(Takifugu rubripes)
<400> 164
gaatcatttt gagttgctac aatgacattt tggcaaaatg gaccagtctg ctgcatcatt 60
ttttcacttt catttttggg gtgtctttga tttcccccct ctatagggtg atcattttca 120
tttctatcaa attatgtggc atcattttgt tactaataca tcacctactt tttatcagga 180
aagatattca agatcatttt cccccccgtt tagatctgat gtgttttcga agtgttcctc 240
taattttttt gagcagtg 258
<210> 165
<211> 1442
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 165
ctgcccatgc agctgtcctt ctctgcacgc cgcttgacac cacacacagc tgtcctttag 60
cgtcctcctc caccaccgta caaactaggg tgcaaatcct actggcttaa ttttaagcca 120
aactttttgg acaggtaaat cctgaatttt tctgtcttct gtgcttggca cgctatctta 180
gtttttttaa agggtttgcc tggggcatgg ttatgatacc atctatctaa gatgtttttt 240
ctgtcttctg tgcttggcac cctatcttag ttctttgaaa gggtttgcct ggggcatggt 300
tatgatacca tctagctttg atgttttttc tgtcttctgt gcttgtcacc ctatcttagt 360
tctttgaaag ggtttgcctg gggcatggtt atgataccat ctagctttga tgttttttct 420
gtcttctgtg cttggcaccc tatcttagtt ctttgaaagg gtttgcctgg ggcatggtta 480
tgataccatc tatctttgat gttttttctg tcttctgtgc ttggcacgct atcttagttt 540
tttgaaaggg ttctgcctgg ggaatggtta tgataccatc tatctaacat attttttctg 600
tcctctgtgc ttcagtggct gcgacaacaa aaatacaaac tttttcaaca tttatctaac 660
atattttttc tgtcctctgt gcttcagtgg ctgcaacaaa aaaaacataa tttttcagga 720
atgtacacat tcctgatttt tcagggttct gcaacagcgg caaaatcgta tcttttatgg 780
tcaccacagg tgatcaaaaa ggtaggacaa aactgggccc acactgcaga atcagtgttt 840
tttggttcac gtcactgtac attgaattac ctctgcctga ccgtgcacgt gcgcacaagc 900
acggtgactg ctaaacacac cactacagaa atattcccac cgacaggacg aacgtcctgg 960
aggtgacaag caactagtaa aaactattat tcgctcactt gacagtatca ttaaagcttt 1020
ttgcgttttt tttcgttgca gtaaacgcgg cgttttgtct ttgcgtgtga accggccgta 1080
acctttacac gacttgattg gcatgtagac gccggacttt ttaaagcagt ttattacata 1140
agtttaggaa tgtagtgtga tttctgccct ttacagcaca aaacgcaacg ctgtgtcaac 1200
aacgtatttt tcagagaaat ttttgccctt gatccccctc ctgcatgcca ctgtccaggt 1260
cgtggcaccc tttaaacaac tttaaaatca gttttctggc cagaaatggc ttttctaggt 1320
tttaaagttc gccttcccat tgaagtctat ggggttcgca aagttcgcaa aagttcgcac 1380
tttttggcgg aagttcgcga acgggttcgc gaactttttt tgtgaggttc gctacatctc 1440
ta 1442
<210> 166
<211> 247
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 166
ttaacaaata atgtgagtgt attgttaata caaatacaaa gttcaactaa actcttgctt 60
tagttaccgt taccggtact ttttttttgt tgaataaagt tcaactaaac tcactgtttt 120
gcttccgtta ctttagcatg cgccttataa tccggtgcgc cttatatatg taataagtac 180
agaaatagac cccgtaattg agactgcgcc ttataatccg gtgcgcctta tagtgcggaa 240
aatacgg 247
<210> 167
<211> 655
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 167
ccgtattttc tcacatatag cccgcacact gatataacct gcaccaatgt ataacccacg 60
gaaaattgta ttttcggaaa atagtctgtg tatagaccgc acccatgtat tccctgcacc 120
tgatagtgtc ggtaccgggg gcgattttaa gcctattaag cctgagaggt gctctgccta 180
ctacaggcct ttatacagta acgtttagtc gttaattatt accagaatgt tcgccatttg 240
agcgctaatt attactgtca atttgtaaca tctgctcaag tgtgtttaga aactccagtc 300
agtaaagacg accgactgcc tacgaattta ccccgacctc cctatctcac taatttcatg 360
tatagtttta gctacacgta gaatgtatta tagataacag catttctaac ttaattttag 420
tatagttaat ggtagaatac agtaataaaa taagcgaaat cggttgttgt ccacatgcct 480
taattagtaa gcaacatatg aagctgaaac gaatgacctt gtggtaggtt gttgtgagta 540
ttcagacttg caaaagacat gtgaagtctc ttttaaatct ggacttacgc gattcctggg 600
gtaattacac gactaccgca gggttcgatc ctacccttgc atacttcatt tgaaa 655
<210> 168
<211> 1894
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 168
ccctttgcct gccaacaccg tacggcgtac gtgttggcaa ggcaatgcac tgagtgccag 60
cgacgtacct tgtacgtctt cctgcttgtg gcgatgtgga tactgatcgg cggcttcttc 120
ctctttcaaa agccgccgat cgctgcagga tcccctaggc aacgagcgct gggggctgga 180
agtgacgctg ttgcgtcaga tgaccccaag aaggacccca gagcagcggc tacgtcatag 240
acatgtgcct gctgctgggg tatttaaact cagcccccca gcgccgccct ctgcctctct 300
gctggtcctg gatgttgctg gagccctcct gctgtgtgct gctgttctcc tgcggtcctt 360
ggctgtgaga tttgctgtgc ctgccctcgg gtagtccctt tgcttttaca ttacacactc 420
actactcact tactacacac ttactacaca cttactacac atttttacat tttagtactt 480
tacattactt tttttttgca gatttacact aactacactt actaacttac atttgcactc 540
actacactta cacacataca cttacacaca tacacttaca cttacacaca tctataaaaa 600
aagctttttg tgtctttgtg tcattgtttt tgtccaaaaa aacctgttta tttggtgttg 660
tgccctttta ttcactgttt gttatttcat ttatttgttc actgttattt gttcattgcc 720
ttttattgtg attttattga ttattctttt ctgcgttgct cttttgttat atacttttgc 780
ttgttaccat catttctgat tattagtgat tttattgttt gagttttgct ttgctcttat 840
tacttgtttt tggttgtact ttgcattttc agttttatat tactgttcat tgctggttgt 900
tttgattttc agttatttta ttgaatcttg aggtttgcat tgttttttat aactggttct 960
aacttgtttt tgcttgtgct ttgaatttat agttttttat tcctaatcat tactggttct 1020
cttgttattg atttgtgata ttttgaccac tagttactac taattgcatt ttatttgatt 1080
gtaagttctt tggctagtct gatagggttt ttgttccaga aagttccaga gagttcaggg 1140
agttgaagag ttcagggggt tgagcttata gcattttttt tttcttggtc tgatttgttt 1200
atattatcag ttgggttttt ttctccagtc tctgccttgc ctgttgcagt agttttacaa 1260
gtatcccatt ttattgcttt attgctttta ttactttatt atatattttt gcttgttacc 1320
accatctcat tgttgtttga gttttgcttt gacttctgac tagttttact tctgactagt 1380
tcttgcttgt acttctagtt ttatattgct tttcattact agttcaattg attttcagtg 1440
attttatttt gaattttgag ttttgcttgg ttctaattac tgttcattgc ttgattttgc 1500
tctaattact agttgtaact tgttcttctt tgtactttgg attttcagtt ttatattgct 1560
gttcattgct cttgattttc agtgatttta ttttatcttt attttgcatt gttgttataa 1620
ctgcctctaa cttgacctct agttctttgg ctagtctgat agggtttttt gttccagaaa 1680
gttccaggga gttgggaggg agttcaaggg ggttgagctt attagcagtt ttttttttct 1740
tggtctggtt tgtttatatt atcagttggg ttttttttct ccagtctctg ccttgcctgt 1800
tgcagtagtt ttacaagcaa tctttttttc tggcttgatt gttagttctt tgtcactgag 1860
ttttagatta gcctgtacat attttgtttg caac 1894
<210> 169
<211> 992
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 169
ccttcatacg ttcccatggg gtaatttcct accccagacg catattttgt gcagtatctt 60
aaagttaatt aattctaaaa aatattcttt ttaggacatt gtcactggca ccgcagtgca 120
caatatcccc aaagaacagc cagcttacat gaatggtttg ctctctgtgg atgaaaaact 180
gcccagggta acatgttacc ccaggcgtga atgtgttttt ccatatgggg taacaactta 240
ccccaagccc atgttaacgc attggggtaa cttgttaccc caatgcaatt tctgtataaa 300
tgacaggcct agacctgttt ggccactttg ggtggatgca tctgaaaggt cagcattcat 360
tcacacctca ttcatgtcca cttcaggtat ccatggtaac taatggatgg ccatcctcca 420
ctctgctttt gcagaagatg tggtaatccc ttttgctaac cactttgttt gcaggctgca 480
aggtcatcaa aacaccctgc cctttgccaa aaaaacccaa aaccctttgt cacacccaaa 540
tccacctctg ctctcttttc tcatggcaaa actccgcctc acctgcccct ttcataacat 600
acaagctagt ttgccctgcc tttgttggaa gtgaggacaa ggagcaaagg gacagcagag 660
aagaaataga acaacatcat actgcaatac agcgtacact atggagtccc cttcaacggt 720
aagggcttga caccccccat gcccctttta cctgctctca ataagcccct gcatgtgtgg 780
tttccaaaca gcatccaccc acatttggct tgcctgcaaa gggtggatgc tggtctctgg 840
cttctgtgcc caggaggaga gggtgctacc tgcgctgcca tagggcaggg cggaattgct 900
tctgtgacag cataggtgga caggcttgtc tttgattgtt atttatatgc attcagcagt 960
aatcattttt tttttttttt ctgcagtcca gg 992
<210> 170
<211> 121
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 170
cagtagaacc ccgttttacg cgtattcgac ttacccgagt ctcgcgttta cgcgaattaa 60
tattagcacc caagcagaaa aatacacccc gagacgcgcg tcattcgcgt atatacgcga 120
g 121
<210> 171
<211> 281
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 171
cagtggttct taacctgggt tcgatcgaac cccaggggtt cggtgagtcg atctcagggg 60
ttcggcagag cccccgccac ggaggtccgg acacacttga attattgtgt aaatttgtga 120
tgacacacac ggcccgcttg gccatcactg gctgcagatg atcatgctac actgcttggc 180
caatcagcgc tgcggggaat ttagtgcgta ctcagtagtc aacgtgtgac tgttgttgtc 240
gtacgtcgtg tgatttcttt aatattttat ccatactaac t 281
<210> 172
<211> 1159
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 172
tagggctgtg cgaaatttcg ccggctgttt cgtttcgacg ctgtttcgac tcgtttcgag 60
ctcgaaacag cgaaatcgaa acgaaacgaa gggcttcgaa acagcctcga aacgaaacga 120
gggcagtcga aacgtttcga aagtttcgaa acgtttcgag tttcgaagct gaagctgggc 180
ttgcttgcag ggaaacagaa agtaaggaga gggaggggga agagggggga aggactgctc 240
tgatattgac tgtgtagctg gccagtgact gtgatccttc cctgaggtcc cttccaatcc 300
cagtgctctg ggggagggat ggaaaaacag cataaaaagc agcattgttt gaactgagct 360
gctttctgcc ttggggtcag ttactgagct gtgtcttcca gcagctcagc agcgtcagac 420
aacaaaggct accattcatt tcctacttgc tagcctagca agtgggattc atcaatacct 480
tttgctttct ttctataccc ttttatttta ttattatatt cattcattat tcctttcaat 540
ttattcctcc cccaaaatcc tctttttgtt tttgttagtc tatttcgatt cttttccccc 600
agaaaagaaa tctgtgcttt ctctcacagt gtgcattcca ttcactgtgc agggaagcac 660
agcataatta tattgcatat tataatatag aatttataca ggaacacata catacattta 720
tatattttat tatttattac ataaatacat acatacatac atacatacat tacataaata 780
cacatacata tattatctac atatattaca taaatcagat tacattacag aagaacacac 840
agattttcca gcacaccaag gcaaagacaa gacactatga aacacaccat gaagcgcgct 900
ggaaaggcag ctggcaagcc ttcagggagg ggcggaagag ggggtagagg gagagctgta 960
agttcccccc ccccccccaa actgagacgc agcctctttc ctacaacaag caggcatgag 1020
gcttccacta gtacaggcag caaggagagg ggagcagtgc cagtgccact gcctgtgcct 1080
gagtctgcat cccctccaag agcaccagcc ataacccccc cccaccacca ccacgacaac 1140
aagcagcacc agcaccagc 1159
<210> 173
<211> 408
<212> DNA
<213> 倭狐猴(Microcebus murinus)
<400> 173
caggttgagc atccctaatc cgaaaatccg aaatccgaaa tgctccaaaa tccgaaactt 60
tttgagcgcc gacatgacgc cacaagtgga aaattccaca cctgacctca tgtgacgggt 120
cgcagtcaaa acgcaggcgc acaacacaca gtttattcag cgtccccaag ggaaaaaaga 180
ccctcccagc ccccttcagc tgcgatatat cttttccgcg cacgcccaga ttcccccacg 240
caagcacgcc cacaaagggt aataaaatgg cacgtgtgca ggccggacgc gccaacggca 300
ggttccccac gatgccccac atggggccaa gacctacgtg cattactcac tgtgtttttt 360
ttgttttttg cttattctct gctctgtggt gtaaagatat tgttgaaa 408
<210> 174
<211> 319
<212> DNA
<213> 西印度海牛(Trichechus manatus)
<400> 174
cagtagtccc cccttatccg cggtttcgct ttccgcggtt tcagttaccc gcggtcaacc 60
gcggtccgaa aatattaaat ggaaaattcc agaaataaac aattcataag ttttaaattg 120
cgcgccgttc tgagtagcgt gatgaaatct cgcgccgtcc cgctccgtcc cgcccgggac 180
gtgaatcatc cctttgtcca gcgtatccac gctgtatacg ctacccgccc gttagtcact 240
tagtagccgt ctcggttatc agatcgactg tcgcggtatc gcagtgcttg tgttcaagta 300
acccttattt tacttaata 319
<210> 175
<211> 352
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 175
tagggaccta ccgaaatcgc gatttcgcga ttttcgcgga aaccgcgatt tcgggcggtc 60
tccgcgaaaa agcgcgggct ccgcgaaaaa gcgcgggctc gctgcggggg ggaaagcaaa 120
agaaagctgc aagaacagaa aagggcggga agccctggcg tcctgaagca cggggggagg 180
gaggaggggg gagagggagc aaatcggagg ctgagcccct gacgtaggct cagtccagga 240
gccagtcagg ggccagccag ggaagcggga gggttttggc gccggctttt aaagcgcccg 300
caggcatgct gctgcagcat gcatgctcgc ttccgcctga ggaagagcag gg 352
<210> 176
<211> 992
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 176
tagggctgtg cgaagcttcg gttgccgttc gattcggaga agattcggcc cgattcggag 60
gccgaatcac cgaatccgaa tcgaatcggg aggccaaaaa accctccgaa tcgattcgga 120
gcctccgaaa cgattcggaa aagattcgga gattcggaag gcggtctttc aggggaacag 180
aaactgagaa gagggagggg gagcaggggg ggggaaagac tgacatctgt agctggccag 240
tgaccgtgat ctttccctga gtccccttcc aatcacagtg ctctggggga gggacgtaga 300
aacagcatat aagcctctgt ctgcagcctt tctgtccctt ttgcgagctg tttctgcctg 360
agcaacagcg tctgaaaggt actggactgg cttggcttcc tagtcagtct cctgctagtt 420
tctgttcttg gaaaggattg gatacagctt actaattacc cttgcctaga atccctatcc 480
aatccatttc tttcaactta ttcttccccc aaaaacctct tatttgttct tgttttttcc 540
cccacacttt aaaagaaagc tgtgttttcc ctggcagtgt gatccatcac tgtgcaggaa 600
agcacataca ttacacacac tcacacatac agtaaacaga gaagaagaag agatattaat 660
tattaaacac acacacacac agagaagaca caacagagaa gaaagaacac acacacacac 720
acacacacac acagacacat tttccagcac aggaaagatt aatatgaagc gtgctggaaa 780
ggcaggtgcc aggtcttctg gcaggggagg gagaggggct agagggggta gggggagagc 840
tgcaagttcc cccccccccc aaacatagac gcatcctctt tcctggcagc catgagtctt 900
ctgctgccgg tgggagcaag gaggtgggag cagtacctgt ccctgcacct gcaccacctc 960
ccctaacacc agaaatagcc accagcacca gc 992
<210> 177
<211> 729
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 177
tagggatgag cgaaaaaatt cgccagcgtc ggtttcgcgg cgaacttttg cgtttcgccg 60
ccggcgaaat gtttcgcgaa acggcggcaa aaattcgccg tgcggctcgt ttcgccgcgc 120
ggcagaattt tgacgcacgt ccaaaatttt ttgtcgcgcg gttatttttg gcgcgcgcgg 180
ccaaatttgg tcgtgcgcga gcaatttttg ccgcgagcgg ccaattttag tcgcgcgcgg 240
gcaatttttg acgtgtgcgc cgatttttcc gccgtgcgac aaaaaaaaaa acgcgcgaca 300
aacggaaacg tcattttagc cttgcccatt tcttccacat cagccaatta gattggagcc 360
ctcccactgt ccatataagg aggtgcagag gcggccatta ctcagtgcgt ttttggtagt 420
ggatagagta ggagctgagg tgtgtgaggt gttgtctgtt tagctagagg taggatttgt 480
tagagctttc tgtgagtcag tgcaagtgga agttgtggat ttcagttcac tgctttccct 540
cttctgcttg cctgctcccc tgtgagaccc aagagccctt gttagggcta cgtttgtctg 600
tctttgtttg tgtgtgtgta tcccttgtgg gtgcacactt ctggggttta gtcttttatt 660
tatttatccc taccttcccc caaatatcca acccccccct attttttttt cttttttagt 720
tggtccagg 729
<210> 178
<211> 394
<212> DNA
<213> yakuba果蝇(Drosophila yakuba)
<400> 178
tacagtggcg agcaaaactg agtgcatgtt cacaactctc actttggcca tcaataaaaa 60
cacaaccgct tatgcaaatt caataatttt ttttatatta ttaatcttaa ttaatttata 120
acttatttta tgagaaaaaa caaatttagc atatatattc aaagacttag aataaaaaaa 180
ctaaataaac tcacataaac tcaattttgc acgttttaag tcttgtaact gtttttgatt 240
ttaacatctc ttatcagtat aaatcggcca gatttaccgt tatatttctt ttaatgctat 300
tttcggtggt cattgattag ttaaaagcgt gtttttgcag agcaaagttc tttagggtga 360
ataaatataa ataattagtg ataaaatcct taaa 394
<210> 179
<211> 528
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 179
atgttattta gacatttata tgttttaatt ttcattaaag actgttttaa catttgcaat 60
aaaaaatgtg attttgtagc ataagttttt tactattaat gttgtgatag cgcaccttta 120
gccagtagtt aagcaacact tccctgcttt tcctatctgg catcttactt actttttgag 180
ctacattaac agtttaaaaa ataccagtac atttaacaat ccatatcttt tatttataaa 240
ttgaaacaaa ctatatacat ttgtatttat aattcagtca atttaatgaa tttgacttct 300
ttccatcggc gttgggtgga ccagctatag cactcatatc gtcatcgtcc agtatgtcgt 360
ataacctgga aatactattc aaacaattat taatgcactt attaacttct gctacacttg 420
tttttgcata aatggctctg catagcccgc acccttgtat agcccgcacc catccgtcat 480
gtttgtaaaa acttatataa cccgcggact atatgcgaga aaatacgg 528
<210> 180
<211> 4787
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 180
aaggtttata aattgtgtat tgatttggat tggatttata gtaagcattg gtatcccact 60
ttgtgcaaaa tttatatagt atactttgat ttatgtattc agggcagttg tggttatttt 120
ggaattttca gtaccctaat atattgctta ttatggatgg cactgggggt atagccaatt 180
gaggtgtaag gtaacgcaca gggcgcctac acatttgtgg tgtgtgatga ttatgatgat 240
tcatcttgcc tgctgatgtt ttcatctccc ctgctgatgc cacaaagttt tttttctact 300
gacacctcat aagctgccct tgctatctgt ttttttggac aatatttcat attttactag 360
tttattgggt ctccctgaaa tcttgttttt tgttatgggc tccagctttt ttgtaaagtg 420
atttttgcat gtttagggtt tttgttttgc agttgtgaaa gtagttttgc tgatggtttg 480
ctgatagatg gggacagttt gcatttcaat actaatcaac tattatctac taatcaacta 540
attcaatgct aattgtagtc tttctcttta ttatggatat tagtactgag ctgaaggcat 600
aacagtgaaa ggaacaggga acttgattga caacttactg aggatatctt taattttggg 660
aagcatatat tttcttctta gtcacctagc accacaattt agcaaaaagc taaatgctta 720
catcaggggt cgtcaaactt tttaagtgct gggtccttcc gctctccgct gggtctttcc 780
gctctccgct gcgtccatct gctctccgcc tcgcatcata ttggggaaca ggtaaattat 840
cttggggggc cgtatcaagc ccaagggccg tagtttgagg atgtctggct tacatgaacc 900
gcaagcgtga tcagacttga catcacctct ttagctaatg caagctttat tgttagcatc 960
tcaaatgctc acaattcagt gaagtacaca tgaaacgaaa gggccgaaag atgctcaact 1020
aaatagataa acgtaagtag aatttatttg gggctaaatt gggcagggtg ttttagtcat 1080
tattgcaatt tcaaggagaa atctaacttt ggatcttttt ttatccttta ttttaggcta 1140
aactgcaaag ttcatcggag aactgtgtcc acaattctat atgtagggaa gcaaggatgg 1200
ttttcctgaa tagctgcagg tgagcactat caaggaacat atagtttgtg ggggtatttt 1260
ccaggtaagg ggggtgttaa gcagtaccac cgctccctat acgcagagta cacactctgc 1320
gtagggcacc aactcccagg ggggcaccca gacagtaccg ccgctcccta cgcagagtgc 1380
gcactctgcg caacaacata ccaagtcttc gccagcgcca gtcagcgcca gcggctcctt 1440
ctctcttatg ctgcggcaac aggccctttt ataaggttgc gcccgtgcgt atgacgtcac 1500
acatcagcga cgaggcgcaa ccttatagaa gtgcctgttg ccgcggcata agagagaagg 1560
aggcgccgac gatcactggt ctgttggggg tactttctgt gggggcactg tgcgggctgg 1620
ctaatgtcta tggggggtac tgtgtatgag gcaattgggg gtactgtttt tgggggcact 1680
gtttatgggg gcaattgggg gtactttgta tgggggcact ttgtgtgggg gctactgtct 1740
atggagggta ctgtttatgg gggcaattgg gggtactttc tatgggggca ctgtgtgtgg 1800
ggtctactgt ctatgggggg tactgtgtat gaggcaattg ggggcacttt gtgtgggtgc 1860
tactgtctat ggggggtact gtttatgggg gcaattggtt ctattttggc ccctatagta 1920
ggtgtttttt tttttttttt tttttctcgg taatatttgg gggagggggc accaaagtaa 1980
atttcaccca tttggccagc agcggccctg gtgttaagac tcaaaatcta gcagatatgc 2040
atttatagca tagccaccag atttagctat tgccctagtt ttagggtgtt tggtgggtgt 2100
gtcttttgat actcacatat gtggggtatc gtttgattca gaagaagctg aagattgata 2160
ttgagaaggt tttttgtagt tgtcacggca attttaggga gaattttgac tttggatctt 2220
tttttttctt catttcaggc caaaccgcaa atttctacga agaactgcgt ccacagtttt 2280
tcatgtaggg gaacaaggat ggtaccgctg aatagctgca ggtgtgcact ttcaagaaat 2340
atatggtttg tgggggctat tttacaggta gggggtgttt tgactaaaaa actgcaagga 2400
gtgcacttag agagtagccc caaactttcc agctgaaatt gctcgtatgt attgcccctg 2460
ttttggggtg tttggtggcc ccgtctttag gtgcacactt gcatgtgggg tatcgttttg 2520
ttcgggagaa tttgcagatt gatattgagc aggttttttg tagttgtcat ggcaattttg 2580
gggagaaatt taactttgga tctttttttt tcttcatttc aggccaaact gcaaacttct 2640
acgaagaact gcgtccacag tttttcatgt aggggaacaa gcatggcacc gttgaatagc 2700
tgcaggtgtg cactttcaag aaatatatgg tttgtggggg ctatttcaca ggtagggggt 2760
gttttgacta aaaaactgca aggagtgcac ttagagagta gccccaaact ttccagctga 2820
aattgctcgt atgtattgcc cctgttttgg ggtgtttggt ggccccgtct ttaggtgcac 2880
acttgcatgt ggggtatcgt tttgttcggg agaatttgca gattgatatt gagcaggttt 2940
tttgtagttg tcatggcaat tttggggaga aatttaactt tggatctttt tttttcttca 3000
tttcaggcca aactgcaaac ttctacgaag aactgcgtcc acaatttttc atgtagggga 3060
acaaggatgg caccgctgaa tagctgcagg tgtgcacttt caagaaatat atggtttgtg 3120
ggggctattt tacaggtagg gggtgttttg actaaaaaac tgcaaggagt gcacttagag 3180
agtagcccca aactttccag ctgaaattgc tcgtatgtat tgcccctgtt ttggggtgtt 3240
tggtggcccc gtctttaggt gcacacttgc atgtggggta tcgttttgtt cgggagaagt 3300
tgcagattga tattgagcag gttttttgta gttgtcatgg caattttggg gagaaattta 3360
actttggatc tttttttttc ttcatttcag gccaaactgc aaacttctac gaagaactgc 3420
gtccacaatt ttccatgtag gggaacaagg atggcaccgc tgaatagctg caggtgtgca 3480
ctttcaagaa atatatggtt tgtgggggct attttacagg tagggggtgt tttgactaaa 3540
aaactgcaag gagtgcactt agagagtagc cccaaacttt ccagctgaaa ttgctcgtat 3600
gtattgcccc tgttttgggg tgtttggtgg ccccgtcttt aggtgcacac ttgcatgtgg 3660
ggtatcgttt tgttcgggag aagttgcaga ttgatattga gcaggttttt tgtagttgtc 3720
atggcaattt tggggagaaa tttaactttg gatctttttt tttcttcatt tcaggccaaa 3780
ctgcaaactt ctatgaagaa ctgcgtccac agttttccat gtaggggaac aaggatggca 3840
ccgctgaata gctgcaggtg tgcactttca agaaatatat ggtttgtggg ggctatttca 3900
caggtagggg gtgttttgac taaaaaactg caaggagtgc acttagagag tagccccaaa 3960
ctttccagct gaaattgctc gtatgtattg cccctgtttt ggggtgtttg gtggccccgt 4020
ctttaggtgc acacttgcat gtggggtatc gttttacttg tgagaacttg ttctttcata 4080
ttttacttca tttgaaaatt tttattggat atttttttct caaattcact tttgtctctg 4140
tgactttgat ggcatttcat aaaataaaaa aaatcccaaa aagtattgtt gaatttcgta 4200
gtgatctgta tgacgccaac tgcatttaga gcaaaaaact accccagacc caaaaaccta 4260
gaggtgtgta gtttctaaaa atacctaact tatggaggtc tttcacttct atcattagat 4320
ataccatgtt aacatagaga tgcgcttatc ggttttgttt caatgtaaaa ttgtagaaaa 4380
tgttgtttta ttattggggt gtcttctggg caagaaaagt gggataccaa tacatatttg 4440
gtattggtgg attcagcaga atcggggctt ttatgaataa taaaattttt gtcagtaaat 4500
gtaatttttc ttgaaaaaaa aacacaaaat aaaaacatat ttttatttat tttatttttt 4560
ttttacatat ttcactcaaa atttttgtta catctcctga aaaagtacat ttttttttta 4620
cagtgttcaa gtccaattcg ctccggaaaa aacgatatat aatttgcctt atttcatgta 4680
ggctttcttg tcaaaaaacc taagcaaatg taatgagtgc aaaatgtctc aaaattgctt 4740
ggcagtagat gttcgctttt agggcaaatt ggctggcagt gaaaggg 4787
<210> 181
<211> 351
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 181
ttaaaacagt taggaaatgt ttttggaagt aattgttagt ttgaaaacag tgtgaactgc 60
agacttagca aattgttcat tcacgttttg aaactctaaa aaaagtttaa attttgttca 120
tagttctagt taaataatat tttgggttca aatcatcata aatactcttt caaacaatct 180
gtatgtttaa taaatagttt ttggtacatt tatactgttg tcactggttc cattttgttc 240
atgcgggtgg ggtaacaagt taccccatga gaccaacaat gtcgaattgc ggggtaacaa 300
gttaccccat gagaacaaca acggttacgg tttcatgaga acggatgagg g 351
<210> 182
<211> 287
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 182
tggatggatt gaagattgtt gcatgtccat tttgtatttt tttattattt tacttataat 60
gtaaatgaat aaatatgttt acaatacgtt tttgtaacat aataaataaa gtattggttg 120
aaaaaggttg tatttggtgc ctttggtgtc ataaatgtga ggtccaagga acgcaacccc 180
tcacttttct attatttcct atgggaaaat tcacctcgag ttgcgcgaat tcgacatacg 240
cgaggtttct caggaacgca atatacgcgt aagtcggggt tctactg 287
<210> 183
<211> 221
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 183
tttccaggta tgtaatttgt tgtgagttta tgcattgtgt tggttttatt ctttgaacaa 60
ggtaatgttc atgcacggct cattttgtgt accagtaaaa aacatatcta tgtcttgaat 120
ttgaaaaaaa tcacatttta tttttcacta aagaggggtt cggtgaatgc gcatatgaaa 180
ctggtggggt tcggtacctc caacaaggtt aagaaccact g 221
<210> 184
<211> 2237
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 184
gtgccaccct cctcactccg tccgcaccta tttccttttt tcatttttta aaaaccattt 60
aatgccccgc tctcagagct ggagggggca ctcactgcat caccagccag caggggaaga 120
acatgtccct gctgagctcc cgtgccagga cgaacttgga ggtatgggct ggggctatgg 180
ggaaggagga ggccccaggt cctgggcatg accactaaaa ctgcactctg ccagggtcgg 240
gaggcctggt gggactgccg gcggcgcggc agccccagga aatgccagga ccgaggatcc 300
ccctggtgaa aggcgggtag gaggcgccat aacctccagc caccacacgc acgcacacag 360
tcctggctgg ggaaagccca gacccgtcac gtctttgaca ggcctgaggc ttgctggttg 420
cagtggagtt gtgaggctcc aggtgagctc agcttagctg cctgggatgc cagctttcgg 480
gttgaaaaac ccttcgtcag gctgaggaag cacctgcagt tggtgtgtgt gctgttcctg 540
gatggaagga atagtaaaga agccagaggc tggcatgcaa tgcaggcaag aaagccagtc 600
agtgaaaatg gaaatggagg cgtcaggggg tgagggacag gctggggtgg gggggggaag 660
ggggatgtag cagcgcaggt aaaagtggag aggtacctgg ggagtcagat gtccggcagg 720
ttgtagtgtg tcagaattcc aatgtctata ttgagtccat gagtttctgt acctaggagg 780
ttgatgaagt gcagttcata ggctcgtctg tgaaaagtgg tttgtaaatt ccctttgagg 840
atcaggcctg agagattgga gacaggtggt gttctgttct tgtctttgat agattttcgg 900
tgtgcgctca ttctggtgcg cagttgttgc ttggtgtctc ctacgtattt tccatcaggg 960
cacttggtgc cctgatggag atatgtattg tattgtgaag atatctccat actggagata 1020
ttgttggcag gttttgcgtg tcttgtcatg gcatggcctg gatccattcg gtgtgttttg 1080
ggctgtagga agttggcttc tggtgatgag gttagcgagg ttcagtgctt gtttgaattt 1140
acaaaccact tttcacagac gagcctatga actgcacttc atcaacctcc taggtacaga 1200
aactcatgga ctcaatatag acattggaat tctgacacac tacaacctgc cggacatctg 1260
actccccagg tacctctcca cttttacctg cgctgctaca tcccccttcc cccccacccc 1320
agcctgtccc tcaccccctg acgcctccat ttccattttc actgactggc tttcttgcct 1380
gcattgcatg ccagcctctg gcttctttac tattccttcc atccaggaac agcacacaca 1440
ccaactgcag gtgcttcctc agcctgacga agggtttttc aacccgaaac cttgctaaga 1500
tatatttctc taactattca gttggtctac taaaagatac cagattagat tgacccaaag 1560
aaccttgtct gccagtgcca cgtccttaga ccaacacccc tagcacctgt ccccggtcag 1620
gcgacaggcg ggcacatcta agccccaggg ctggggctgg cagggagagt tctctggcag 1680
ctgctggaga agaagctcct gcaggaaagg aaagaaaggc tctgtgacag tttggctgcc 1740
tgagatgctg ctggtgctac tgtgctgctt actattttac ctgttgttat ttaaagtggt 1800
ggaccgggct gaggctgtag gggaggagga gacctcattg gggcacacta ccgtgtcgtg 1860
tagaggcccc agcgccagtg agggcgcgcc ttaacacaca cacaaagtca cacatgtcac 1920
gagttttgct tgtcagcagc ttgaggtgca gtttcccaga aacccctgca cctatctcct 1980
tgaaacttgg caggcttcgt ggcctcagca ggggctacca tccctgctgt tttcatccga 2040
atcaggcaag aaatgacaaa gttataggca gtttcgtgat tccccattat agcctatggg 2100
cgaaacgtcg aaacagcgtc gaaacagcga aacagtttcg acgaaacgaa acggaacgaa 2160
actcgaaacg aaacactgtc ccgtcgaaac ggcgaaacgg aagtcgaaac gaaacggtgc 2220
tgtttcgcac agcccta 2237
<210> 185
<211> 658
<212> DNA
<213> 倭狐猴(Microcebus murinus)
<400> 185
aaagccatcc agcagaatgc ctcctcatcc ctagaggacc cacttcctgg tccctcaact 60
gcttctgatg tttcttctca cctaaaaaat aaaatacagt gtacagtaac cttttaatca 120
aaacacagca tcgtaggtgg agactgaaag cctgccgttg tttgttgttg ctgttgttta 180
acagctgata caggtattct ggtgatgcta ctgtgctgct tagttaccct gaacacatta 240
ttttttcact gtattaatgg tatgtcatat tttttactgt taagtactta tgtgtgaata 300
agtgtaagaa aatgattgct tatcggtagc atataaattc agagtcagga atgatggtga 360
tgccaaacaa ccacagattg tccacatggg tggctgagat agtgacacct ttgctttctg 420
atggttcaat gtacacaaac tttgtttcat gcacaaaatt atttaaaata ttgtataaaa 480
ttaccttcag gctatgtgta taaggtgtat atgaaacata aatgaatttc gtgtttagac 540
ttgggtccca tccccaagat atctcattat gtatatgcaa atattccaaa atccgaaaaa 600
atccgaaatc cgaaacactt ctggtcccaa gcatttcgga taagggatac tcaacctg 658
<210> 186
<211> 244
<212> DNA
<213> 西印度海牛(Trichechus manatus)
<400> 186
gatattttga gagagagacc acattcacat aacttttatt acagtatatt gttataattg 60
ttctatttta ttattagtta ttgttgttaa tctcttactg tgcctaattt ataaattaaa 120
ctttatcata ggtatgtatg tataggaaaa aacatagtat atatagggtt cggtactatc 180
cgcggtttca ggcatccact gggggtcttg gaacgtatcc cccgcggata aggggggact 240
actg 244
<210> 187
<211> 743
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 187
catgaactgc ctgtctcaag gttagcattc agtttcagta aactcctttt tataatgtcc 60
tttaataaag tgtatatagt tggtattagt tacaattcat gttgtgcata gtacagcttt 120
attttcataa gatatttcag tttagagttt aattaagtgc ttagatggta ttagttaata 180
aagtgtatat agttggtatt aataaagtgt atgtagttgg tattagttaa taaagtgtat 240
atagttggta ttagttgcaa ttcatggtgt gcatagcttt attttaataa gatatttcat 300
tttagagctt aattaagtgc ttagactgct taataacgcg tcaattaatg gcttccgcgg 360
gcttaatccc ctgattaagc ccgcggaagc cattaattga cgttattatt aagcagtcta 420
ggacgcggtt aatggcttcc gcgggcttga tcaagcccgc ggaagccatt aaccgcgtct 480
tagactgctt aataacgcgt caattaatgg cttccgcggg cttaatcagg ggattaagcc 540
cgcggaagcc attaattgac gcgttagcaa gccgcggttt ggggccatct ggcaatctgc 600
ggggaggggc gggactaccg gggcccctcg gccaatcaga ggcgtggggg ggcccgccgc 660
gctcggcccg cgaaaatggc gcccggcccc gcgatctgcc cgcgaaatcg gccggcagcc 720
gcctcgagtt cggtaggccc cta 743
<210> 188
<211> 2786
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 188
gtgccaccct cctcactccg tccgcaccta tttctttttt ttaaccattt aatgccccgc 60
tctcagagct ggaggcggca ctcactgcat caccagccag caggggaaga acatgtccct 120
gctgagctcc cgtgccagga cgaacttgga ggtatgggct ggggctatgg ggaaggagga 180
ggccccaggt cctgggcatg accactaaaa ctgcaccctg ccagggtcgg gaggcctggt 240
gggactgccg gcggcgcggc agccccagga aatgccagga ccgaggatct ccctggtgaa 300
aggcgggtag gaggcgcctt ataacctcca gccaccacac gcacgcacag tcctggctgg 360
ggaaagccca gacccgtaag atctttgaga ggcctgaggc ttgctggttg cagtggagtt 420
gtgaggctcc aggtgagctt agctgcctgg gatgccatct gcgaggcatg ggctttcggg 480
tttaaaaccc ttcgtcaggc tgaggaagca tctagttggt gtgtgtgtgc tcttcctgga 540
tggaaggaat agtaaagaag ccagaggctg gcatgcaatg caggcaagaa agccagtcag 600
tgaaaatgga aatggaggcg tcagggggtg agagacaggc tggggtaggg gggaaggggg 660
atgtagcagg taaaagtgga gaggtacctg ctctggggag tcagatgtca ggcaggttgt 720
agtgtgtcat aaatccaatg tctatattga gtccatgagt ttctgtatct aggaggttga 780
tgaagtgaag ttcataggcc cgtctgtgaa aagtggtttg taaattccct ttgaggatca 840
ggactgagag actggagaca gagtggtttt cttgtgagaa atgtgccccc acaggtagtt 900
gggtattctt gtctgtgata gattctggtg cgcagtttgt gggggtactg gagatacgtt 960
ggcaggtttt gcatttcttg tcatggcatg gtctggatcc attcggtgtg ttttgggctg 1020
taggaagttg gcttctggtg atgaggttag cgaggttcgg tgcttgtttg aatttacaaa 1080
ccacttttca cagacgggcc tatgaacttc acttcatcaa cctcctagat acagaaactc 1140
atggactcaa tatagacatt ggatttatga cacactacaa cctgcctgac atctgactcc 1200
ccaggtagca ggtacctctc cacttttacc tgctacatcc cccttccccc ccccacccca 1260
gcctgtctct caccccctga cgcctccatt tccattttca ctgactggct ttcttgcctg 1320
cattgcatgc cagcctctgg cttctttact attccttcca tccaggaaga gcacacacca 1380
actagatgct tcctcagcct gacgaagggt ttttaaaccc gaaagcttgc aaagaagaat 1440
ttctccaact attcagttgg tctaataaaa gatatcagat tgaccctaag aaccttgtct 1500
gggctatgtc cttagaccaa cacggctaca acctacaccc cttaacacac acaagtgaca 1560
cgagttttgc tttcagcagt ttgaggtgca gtttcacaga aacccctgca ccactctgcc 1620
tgaaacctgg caggcctccc tcatgcccgc acgaggggct atgtatgtgg caggacaggt 1680
gctaatgagg gcggccattt aatgccccgc tctcagagct ggaggcggca gtttagtttc 1740
tcaccagcca gcaggggaag aacatctccc tgctgagctc ccgtgccagg aagaacttgg 1800
aggtataagg gctggggcta tatggggagg aggaggcccc acatcatcct gggcatgacc 1860
taaaactgca ccctgccagg gtagggaggc ctgggtggga ctgccggtgg cgcggcagcc 1920
ccaggaaatg ccaggaccgc gaacctccct ggtgaaaggc gggtaggagc aggaggcacc 1980
tgataacctc cagccaccgc acagtcctgg ctggggaaag cccagacctg taagatcttt 2040
gagaggcctg aggcttactg gttgcagtgg agttgtgagg gtgagaacag gggctaccat 2100
ccctgcagtt ttcaccccgc tgcgccttaa cacacacaca aagtcacacg tcacgagttt 2160
tgcttgtcag cagcttgagg tgcagtttcc cagaaacccc tgcacctatc tccttgaaac 2220
ctggcaggct tcgtggcctc agaaggggct accatccctg cagttttcac cccgctgcgc 2280
cttaacacac acacagtcac acgtcacgag ttttgcttgt cagcagtttg aggtgcagtt 2340
tcccagaaac ccctgcacct atctccttga aacctggcag gcttcgtggc ctcagaaggg 2400
gctaccatcc ctgcagtttt caccctaatg cgccttaaca cacacacgtg acacgagttt 2460
tgcttgtcag cagcttgagg tgcagtttcc cagaaacccc tgcacctatc tccttgaaac 2520
ttggcaggct tcatgccctc agaaggggct accatctctg ccgttttcat ccgaatcagc 2580
cacaaaatga caaagttata ggtatttcag tgattcccca ttatagtcta tggccgaatc 2640
tccgaatctc tccgaatcgg cgccgaatct tccgaagccg attcggccga atcgattcgg 2700
gacagtgatc cgaatctccg aattgaatca ctgtcctccg aatcggccga atccgaatca 2760
aatacttccc tattcgcaca ggccta 2786
<210> 189
<211> 6944
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 189
cctcctctcc ttcctcctct cctcccagat gtaccctcct ctctcaattg ctgccttata 60
ctcccctaat aatctagctg ctgctgctgc tgccactata tcatctcata tcatattcta 120
atttgtggcc tatcaagggt ccttacaatg ttgctactct ttcttaaatt ctaatttctt 180
ctaatttggg gtctgaaatg gctcctaatt atattgtggc tactcctgca aaatatcatc 240
tactttgggg ctggaaatgg ctcctaatta tattgtggct actcctacaa aatatcatct 300
actatggggc tggaaatggc tcctaattat atcgttgcta cttctgctaa aatatggacc 360
aatgtcttct aatttgtggt ctgttgtttt ctaataacct gctgctgctg ctgctgccac 420
agtatcatct aatttcttct aattatggcc tatcaaggct acttgcaatg ttgctacttc 480
ggcaaaatat catctactat ggggctggaa atggctccta attataccgt tgcgacttct 540
gctaaaatat ggaccaatgt cttctaattt gtggtctgtt gttttctaat aacctgctgc 600
tgctgctgcc acagtatcgt ctaatttctt ctaattatgg cctatactgg ctacttgcaa 660
tgttgctact tcggcaaaat atcatctact atggggctgg aaatggctcc taattatacc 720
gttgctactt ctgctaaaat atggaccaat gtcttctaat ttgtggtctg ttgttttcta 780
ataacctgct gctgctgctg ccacagtatc gtctaatttc ttctaattat ggcctatact 840
ggctacttgc aatgttgcta cttcggcaaa atatcatcta ctatggggcc ggaaatggct 900
cctaattata ccgttgctac ttctgctaaa atatggacca atgtcttcta atttgtggtc 960
tgttgttttc taataacctg ctgctgctgc tgccacagta tcgtctaatt tcttctaatt 1020
atggcctatc aaggctactt gcaatgttgc tatgcctgca agtatcatct actatggggc 1080
tggaaatggc tcctaattat accgttgcga cttctgctaa aatatggacc aatgtcttct 1140
aatttgtggt ctgttgtttt ctaataacct gctgctgctg cttggttggt ttgaaccaag 1200
atcagctgct ggcgataatt gccatttgaa ttctaaactt gtgctgaggt aaacatcgtt 1260
ggtctgtagg cacaagaatt ttccgtgctg caatttgcgc cgtctgatcc caaaagcctg 1320
tgctgaggta aaacagtgat ggtatatagg cacaaggttt gaaccaagat cagctgctgg 1380
cgataattgc catttgaatt ctaaacttgt gctgaggtaa acatcgttgg tctgtaggca 1440
caagaatttt ccgtgctgca atttgcgccg tctgatccca aaagcctgtg ctgaggtaaa 1500
acagtgatgg tatataggca caaggtttga accaagatca gctgctggcg ataattgcca 1560
tttgatttga aaagtgagag atctatgctg ttgtaatggg aagatctttt attagagaag 1620
cgccgtggaa ttgaaaaact tatgccgagg taaaaatcag tggtatgtag gcaaaaagct 1680
tcaattccta atatttaatt ttatgtaagc tctaattggt aatttagttt ggtcattgga 1740
tgcttttgat ttttacggag gaggtggggg agtttgatgc attggtaaac tcccttcccc 1800
ctcctcccct tttcgaatgt agaagcattg tattgccaac tgcctgtgct gaggtaaaaa 1860
cgttggtatg aaagcacaag gcataaagtg atgatattgt ctctgccttc taggtgttta 1920
gtgataactg ctgtcgatca ttttataggt gctcagtaac aggctgagat tgaccattgc 1980
ggcaggagta actgtacatt aaaagttatt tagtccctat gtagtggaca attatatgtg 2040
gaacattttg aagctaagta attgcaatat tgattgatga tggcaaataa ataaataaac 2100
aattaaaaaa agaaatcaaa taaataaata atgaaaataa tttacttcac acaagtttat 2160
tataaataaa gatatatttg gtgacatcta tagaaataca tttataatac aataataata 2220
caataattta caatccttat gttttcattc agggtgaccc cattacttct agtttggggg 2280
gtgtaagatt ggcagcagtt tcagtttccc cataaaagtc aatgggtgaa atttggctgt 2340
tgttgacttt aagtcattca acaaatgttg ctgtgtaatt cggggtgacc ccatgattat 2400
gttattcaag tttggggggt gtagcttcaa agctgtaaga gtggcagcag tttgaaaatc 2460
ttccctgtca aagtcaatgg gaaaattggg gggttcagag gggcgccaca aaaagacggg 2520
ggcgggatcg cttagaaaag cacaagcaac ctggtccgct atagggtgag gaagtgtgtg 2580
gagtttgggt gttgtatccc taaaactgta ggaggagtag cgtttagaaa atggggggcg 2640
ctaagaataa gaagaaaaag cgaaagaatc agctgatgtc gaagaacaac ccaacataat 2700
aataaagttc ctgctgctgc tgccgcaata tcatcaaatt tcgtctggtt tggggtctgt 2760
taaggctcct aataatgtac ttgtattgaa ggcttgcatt tcattataat taattgaatt 2820
atttaatgga ggtgcaagcc aaaaaagcat aatggttctg aggctcattc aatacaatag 2880
cagaatagtc aaaattgtca cttacgtgtc aaactagagg cctgtgcgta aaaattcaca 2940
cgtgcacgtc aaaatatatg cttgcgcgac caaatgtaca ttttcgcgac aaaatataac 3000
cttgcgcgac caaatgtaca atttcgcgac caaatatacg cttgcgcgac caaatgtaca 3060
cctacacgac taaatatacg cttgcgcgaa caaatgtacg tttcgcgacg aaatattcgt 3120
gcgcgcgaca agcccggagc gcgacgaatt cgtcgctcgc acggtaattt gcgcgcatgc 3180
gcgttaccgg cgcgcgcata cgtacgcggc gcgcgcgtca atagggtgtg tccctagtat 3240
aaatacctgg tgccctgccc tgtgaccagt aggactggaa aactttgcaa ggcgtggaca 3300
tggctggacc tgggaacatg aatgaggcgc agctgcggta ctttatatcc ttcctgcacc 3360
gggagggata tgacaatatc ccagcaggga ctcccgggat ccaatccctc cgcaggggga 3420
ttatcaggag actgcggcgg cgcctcagac gggatcacca ggtcaatctt agtgtccgcg 3480
tcttgcagcg tttgtggagt gacgtcaaaa gacgtcacac agagcttgtg gaagagctga 3540
ggggagaagt ggaaggtaga ttttattaaa aattaatata aagatttttc ttctaaatta 3600
ccactcactt gtttcctatt taatttgcta tttttgagca aaaatgtgtt tgtgaaaata 3660
ctttaacatt aggattggaa caatagccat aattgcagat tatttaaata gagattatct 3720
cttaatggtg tttcccatcc cataactgcc atacttatag aggccctgcc ccatacctgc 3780
catgcttata gataccctgc cccatacctt ctgtaaggtt tggacccaca catacacaga 3840
ggcttttgct ataggcttta ttttacaaac tgttaggctg ccagctctgc tcacatggct 3900
atgacaccat aatggctcac atgactgtca taccatagtg actatgatac tatctggttt 3960
gctggaaagg gcgccctcta atgtcagcag tgttgcatag cactaaacat taacaaaaca 4020
taacaaacat cttataacag ggttgctgtt gaacactaca cctgccatgc ttatagatgc 4080
cctgccccat acctgccatg cttatagatg ccctgcccca tacctgccat gcttatagat 4140
gccctgcccc atacctgcca tgcttataga tgccctgccc catacctgcc atgcttatag 4200
atgccctgcc ccatacctgc catgcttata gatgccctgc cccatacctg ccatgcttat 4260
agatgccctg ccccatacct gccatgctta tagatgccct gccccatacc tgccatgctt 4320
atagatgccc tgccccatac ctgccatgct tatagatgtc cccgccccat acctgccatg 4380
cttatagata atggttttcc tgtagttaca tgacacatct cagcctgtat catttgttcg 4440
gtacaaaagc aagtgctgta tttctcaaac tgaaattctt tcattgccag acgaatggct 4500
acaggtggat cagggtgcaa atggggcaga ggcagaggca gaggcaccac cggctcctgc 4560
acaggatccc cagcttgccg atgatgaggc agaggcagca cccccagcag caccaccagc 4620
agcgccagaa gcacccccag gagcacgtga tgctgcctcc caaacagggg ggacaaattt 4680
atttttggac ctcctacaag aggtccgcca ggaggtggcc cttatgaggg aggacatggg 4740
ccttatgagg caagacatgg cccttatggg gcaggatgtg gcccttatgc ggcaggactt 4800
aagggacatt caggaggcta tcctgtctgg ttctcctcct cctcctcctc ctcctcctcc 4860
tcctcctcct cctcctgctt ttgtgtaagt gtttatgtgc agtgcaccgt tgtgcacttt 4920
tgttccatta aaatattcat ggttttcaat cttcaacatt tgaattttat ttcatttaac 4980
tactgatcag atgatacttg aagttgtgta acattacata gtattttagt agattcatta 5040
catttacaca aaaatataca gtatattcat gttaatgtgg gatacaaagc acccagatgg 5100
tatctgttca tatttattat tagttgtggc tgtgtttgta agctagtagt aacatataaa 5160
atatagattg tacttttagg tactttttta gtgcagtagt agataccatt aactgtcaac 5220
cagaagtaat gtaaaaaatc acagacatgt ttttaagaaa ctggcaaaat gggagccttt 5280
tttcacttgg gagaaaacac ttgtagcata gcggatagga ggttctctaa caatgtaggg 5340
catgtgtgta gcaggcagta tactcagcca aactgcatgg gaattggtct tcccattgac 5400
tgcaatgcaa ttcagcgaat tttgcaacct gtttgggaat tttgccacaa agcaaaacat 5460
ggcagattaa cttaaagggt ggttcacatt taagttaatt attagcatgt agtagaatgg 5520
ccaattataa gcatagtaac atagtaagat aggttgaaaa aagacatacg tccatcacgt 5580
tcaaccttaa tacctatata taacctgcct aactggttaa ttaagagtaa ggcaaaaaac 5640
cccatctgaa gcctctctaa tttgccgcag aggggaaaca attccttcct gactccaaga 5700
tggcaatcgg accagtccct ggatcaactt gtactgagag ctatctccca taaccctgta 5760
ttccctcact tgtactgaga gctatctccc ctacccctgt attccctcac ttgtactgag 5820
agctatctcc catacccctg tattccctca cttgtactga gagctatctc ccctacccct 5880
gtattccctc acttgtactg agagctatct cccataaccc tgtagtgata ctaagcaact 5940
ttacaattgg tcttcattat ttatttgttc acagtttttg aattgtttgc catcttcttt 6000
taactgccat tccaactcta tgttagcaag cccatggttg ctaaggtaat ttggaaacta 6060
gcaaccagat aacaggaacc gcatgcgtta atttgcacat agaaataata ctaacgcatg 6120
attcacactt agacgcgcta aatatcgcat taggctatgc gaaaattaac ccctacttgg 6180
ggcaggcggt aattatagaa aagtgcagta aatgagcttt tggcaacaca atatggactt 6240
tgcagtggga tttattcaag tctgtgttgg ccccagagtg atgcagccgc cagtttgcag 6300
ggaaatgggc attttcagaa cagtagtttt ccgaaagtaa tgccgtgtat ggctaatatg 6360
gcgtgcgttt ttttgcacac ggcgactatt tgtgcgcgat gcgttgatgt gatgcgtcca 6420
atatagcacg aaaatattct tcgcgactta aataacacac acagcatcgc gataaaattt 6480
ttaacgcatg ctagaaatag cgctcgtttt aacgcactta agtgaatcgg ccctcataaa 6540
taaaaaaaat gaagaccaat tgcaaattgt ctcagaatat ctctctctac atcagctcgg 6600
gggcaacatg ctgctcacca accccttgga tgttgctctc agtgaaaaag gtgcaaccca 6660
caaacaaaac cacctgtaga atttgtgcgc tcgctgcgcg gcgaagtagc tatgtcacac 6720
ggtgaaattt tcgccgcgcg tacagttatt ttcgcgcgat ggaaaattcc gccgcgcgac 6780
gataatggtg gcgccaaatt tatttcgccg cgcgcgacaa aaattacgcc gcacaaaaat 6840
tacgctgcgc gacacattag tttcgctaat ttttcgccgt ttcgctaatt ttttcgccgt 6900
ttcgcgaata attcggcgaa acgggacaaa ttcgctcatc actg 6944
<210> 190
<211> 244
<212> DNA
<213> yakuba果蝇(Drosophila yakuba)
<400> 190
caataatgta gttattaagt tttgattgaa acgtgcaaaa ttgagtttat gtgagtttat 60
ttagtttttt tattctaagt ctttgaatat atatgctaaa tttgtttttt ctcataaaat 120
aagttataaa ttaattaaga ttaataatat aaaaaaaatt attgaatttg cataagcggt 180
tgtgttttta ttgatggcca aagtgagagt tgtgaacatg cactcagttt tgctcgccac 240
tgta 244
<210> 191
<211> 8
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 191
gtatggac 8
<210> 192
<211> 8
<212> DNA
<213> 冈比亚按蚊(Anopheles gambiae)
<400> 192
atgtgaac 8
<210> 193
<211> 2
<212> DNA
<213> 斑马鱼(Danio rerio)
<400> 193
ta 2
<210> 194
<211> 8
<212> DNA
<213> 斑马鱼(Danio rerio)
<400> 194
gtctatac 8
<210> 195
<211> 6
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 195
ttagag 6
<210> 196
<211> 8
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 196
ctgtatag 8
<210> 197
<211> 8
<212> DNA
<213> 小棕蝠(Myotis lucifugus)
<400> 197
gtctagag 8
<210> 198
<211> 2
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 198
at 2
<210> 199
<211> 8
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 199
ctctagac 8
<210> 200
<211> 8
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 200
gtctagac 8
<210> 201
<211> 8
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 201
atcatcat 8
<210> 202
<211> 4
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 202
ttaa 4
<210> 203
<211> 8
<212> DNA
<213> 海七鳃鳗(Petromyzon marinus)
<400> 203
ctctagag 8
<210> 204
<211> 8
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 204
tttataat 8
<210> 205
<211> 8
<212> DNA
<213> 密河鳄(Alligator mississippiensis)
<400> 205
ctatatag 8
<210> 206
<211> 8
<212> DNA
<213> 热带爪蟾(Xenopus tropicalis)
<400> 206
attaatag 8
Claims (39)
1.一种工程化转座元件,其从5'到3'包含:
5'末端重复序列(5'TR)、异源核酸和3'末端重复序列(3'TR),
其中所述5'TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,
其中所述3'TR包含选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段,并且
其中所述转座元件表现出允许异源核酸插入细胞的DNA中的转座活性。
2.根据权利要求1所述的转座元件,其中所述5'TR包含与选自SEQ ID NO:1-26和79-90的核酸序列具有至少约90%序列同一性的核酸序列,和/或其中所述3'TR包含与选自SEQID NO:27-52和91-102的核酸序列具有至少约90%序列同一性的核酸序列。
3.根据权利要求2所述的转座元件,其中所述5'TR包含选自SEQ ID NO:1-26和79-90的核酸序列,和/或其中所述3'TR包含选自SEQ ID NO:27-52和91-102的核酸序列。
4.根据权利要求1-3中任一项所述的转座元件,其还包含侧接所述5'TR的5'的5'靶位点重复序列(TSD)或侧接所述3'TR的3'的3'TSD,其中所述5'TSD包含选自SEQ ID NO:191-206的核酸序列、其变体或其片段,并且其中所述3'TSD包含选自SEQ ID NO:191-206的核酸序列、其变体或其片段。
5.根据权利要求1-4中任一项所述的转座元件,其中所述5'TR包含与选自SEQ ID NO:3、8、11、12、13、16、22、23、79和82的核酸序列具有至少约90%序列同一性的核酸序列,并且所述3'TR包含与选自SEQ ID NO:29、34、37、38、39、42、48、49、91和94的核酸序列具有至少约90%序列同一性的核酸序列。
6.根据权利要求5所述的转座元件,其中:
(a)所述5'TR包含SEQ ID NO:3的核酸序列,而所述3'TR包含SEQ ID NO:29的核酸序列;
(b)所述5'TR包含SEQ ID NO:8的核酸序列,而所述3'TR包含SEQ ID NO:34的核酸序列;
(c)所述5'TR包含SEQ ID NO:11的核酸序列,而所述3'TR包含SEQ ID NO:37的核酸序列;
(d)所述5'TR包含SEQ ID NO:12的核酸序列,而所述3'TR包含SEQ ID NO:38的核酸序列;或者
(e)所述5'TR包含SEQ ID NO:16的核酸序列,而所述3'TR包含SEQ ID NO:42的核酸序列。
7.根据权利要求1-6中任一项所述的转座元件,其中所述异源核酸包含编码序列。
8.根据权利要求7所述的转座元件,其中所述异源核酸进一步包含与所述编码序列可操作地连接的启动子。
9.根据权利要求1-8中任一项所述的转座元件,其中所述转座元件的转座活性高于piggyBac(PB)转座子、SleepingBeauty(SB)转座子和/或TcBuster(TB)转座子的转座活性。
10.根据权利要求1-9中任一项所述的转座元件,其中所述细胞为动物细胞、植物细胞、藻类细胞、真菌细胞、酵母细胞或细菌细胞。
11.根据权利要求1-10中任一项所述的转座元件,其中所述细胞是哺乳动物细胞。
12.根据权利要求11所述的转座元件,其中所述哺乳动物细胞选自免疫细胞、肝细胞、肿瘤细胞、干细胞、受精卵、肌肉细胞和皮肤细胞。
13.根据权利要求11或12所述的转座元件,其中所述细胞是人类细胞。
14.根据权利要求1-13中任一项所述的转座元件,其中所述转座元件在人胚肾293T(293T)细胞中的转座活性高于在HeLa细胞中的转座活性。
15.根据权利要求1-14中任一项所述的转座元件,其中所述转座元件存在于载体中。
16.根据权利要求15所述的转座元件,其中所述载体是质粒或病毒载体。
17.一种基因转移系统,其包含:1)根据权利要求1-16中任一项所述的工程化转座元件;和2)转座酶,或编码转座酶的核酸。
18.根据权利要求17所述的基因转移系统,其中所述转座酶包含选自SEQ ID NO:53-78和103-114的氨基酸序列或其变体。
19.一种基因转移系统,其包含:1)工程化转座元件;和2)转座酶,或编码转座酶的核酸,其中所述转座元件从5'到3'包含:
5'末端重复序列(5'TR)、异源核酸和3'末端重复序列(3'TR),
其中所述转座元件表现出允许异源核酸插入细胞的DNA中的转座活性,并且
其中所述转座酶包含选自SEQ ID NO:53-78和103-114的氨基酸序列或其变体。
20.根据权利要求19所述的基因转移系统,其中所述5'TR包含选自SEQ ID NO:1-26和79-90的核酸序列、其变体或其片段,并且其中所述3'TR包含选自SEQ ID NO:27-52和91-102的核酸序列、其变体或其片段。
21.根据权利要求20所述的基因转移系统,其中:
(a)所述5'TR包含SEQ ID NO:3的核酸序列,所述3'TR包含SEQ ID NO:29的核酸序列,而所述转座酶包含SEQ ID NO:55的氨基酸序列;
(b)所述5'TR包含SEQ ID NO:8的核酸序列,所述3'TR包含SEQ ID NO:34的核酸序列,而所述转座酶包含SEQ ID NO:60的氨基酸序列;
(c)所述5'TR包含SEQ ID NO:11的核酸序列,所述3'TR包含SEQ ID NO:37的核酸序列,而所述转座酶包含SEQ ID NO:63的氨基酸序列;
(d)所述5'TR包含SEQ ID NO:12的核酸序列,所述3'TR包含SEQ ID NO:38的核酸序列,而所述转座酶包含SEQ ID NO:64的氨基酸序列;或者
(e)所述5'TR包含SEQ ID NO:16的核酸序列,所述3'TR包含SEQ ID NO:42的核酸序列,所述转座酶包含SEQ ID NO:68的氨基酸序列。
22.根据权利要求17-21中任一项所述的基因转移系统,其中所述基因转移系统包含编码所述转座酶的核酸。
23.根据权利要求22所述的基因转移系统,其中所述转座元件和编码所述转座酶的核酸在不同的载体中。
24.根据权利要求22所述的基因转移系统,其中所述转座元件和编码所述转座酶的核酸在同一载体中。
25.一种将异源核酸插入靶核酸的方法,其包括:
使所述靶核酸与权利要求1-16中任一项所述的转座元件或权利要求17-24中任一项所述的基因转移系统接触,从而将所述异源核酸插入所述靶核酸。
26.根据权利要求25所述的方法,其中所述方法在体外进行。
27.根据权利要求25所述的方法,其中所述靶核酸在细胞中。
28.根据权利要求27所述的方法,其中所述靶核酸是基因组DNA。
29.根据权利要求27或28所述的方法,其中所述细胞是动物细胞、植物细胞、藻类细胞、真菌细胞、酵母细胞或细菌细胞。
30.根据权利要求29所述的方法,其中所述细胞是哺乳动物细胞。
31.根据权利要求30所述的方法,其中所述哺乳动物细胞选自免疫细胞、肝细胞、肿瘤细胞、干细胞、受精卵、肌肉细胞和皮肤细胞。
32.根据权利要求28-31中任一项所述的方法,其中所述异源核酸的插入使所述细胞的基因失活。
33.根据权利要求25-32中任一项所述的方法,其中所述异源核酸编码蛋白质。
34.根据权利要求33所述的方法,其中所述蛋白质选自下组:报告蛋白、工程化受体、细胞因子、抗生素抗性蛋白、抗原和治疗性蛋白。
35.根据权利要求25-32中任一项所述的方法,其中所述异源核酸编码RNA。
36.根据权利要求35所述的方法,其中所述RNA选自下组:治疗性RNA、小干扰RNA(siRNA)、微小RNA、短发夹RNA(shRNA)、长非编码RNA(lincRNA)和指导RNA(gRNA)。
37.根据权利要求25-36中任一项所述的方法,其中所述异源核酸的长度为约2kb至约300kb。
38.根据权利要求25-37中任一项所述的方法,其中所述插入是随机的。
39.一种试剂盒,其包含用于将异源核酸插入靶核酸的根据权利要求1-16中任一项所述的工程化转座元件,或根据权利要求17-24中任一项所述的基因转移系统以及说明书。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2020082087 | 2020-03-30 | ||
CNPCT/CN2020/082087 | 2020-03-30 | ||
PCT/CN2021/084084 WO2021197342A1 (en) | 2020-03-30 | 2021-03-30 | Active dna transposon systems and methods for use thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115698301A true CN115698301A (zh) | 2023-02-03 |
Family
ID=77929308
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180025387.4A Pending CN115698301A (zh) | 2020-03-30 | 2021-03-30 | 活性dna转座子系统及其使用方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230144097A1 (zh) |
EP (1) | EP4127184A4 (zh) |
JP (2) | JP2023520083A (zh) |
CN (1) | CN115698301A (zh) |
WO (1) | WO2021197342A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116602990A (zh) * | 2023-06-16 | 2023-08-18 | 广东南芯医疗科技有限公司 | γδ T细胞培养上清液在制备预防或治疗炎症性疾病药物中的应用 |
CN117965579B (zh) * | 2024-04-02 | 2024-06-07 | 中国科学院遗传与发育生物学研究所 | 麦属特异转座子h2a.1及其应用 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK0805867T3 (da) * | 1995-01-23 | 2004-04-13 | Novozymes As | DNA integration ved transposition |
CA2309000A1 (en) * | 1997-11-13 | 1999-05-27 | Regents Of The University Of Minnesota | Tc1-based transposon vectors |
CN105018523B (zh) * | 2015-04-09 | 2019-05-07 | 扬州大学 | 一种zb转座子系统及其介导的基因转移方法 |
-
2021
- 2021-03-30 CN CN202180025387.4A patent/CN115698301A/zh active Pending
- 2021-03-30 JP JP2022560171A patent/JP2023520083A/ja active Pending
- 2021-03-30 WO PCT/CN2021/084084 patent/WO2021197342A1/en unknown
- 2021-03-30 EP EP21778984.1A patent/EP4127184A4/en active Pending
- 2021-03-30 US US17/915,964 patent/US20230144097A1/en active Pending
-
2024
- 2024-07-05 JP JP2024109264A patent/JP2024133642A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2021197342A1 (en) | 2021-10-07 |
EP4127184A4 (en) | 2024-04-24 |
US20230144097A1 (en) | 2023-05-11 |
JP2023520083A (ja) | 2023-05-15 |
EP4127184A1 (en) | 2023-02-08 |
JP2024133642A (ja) | 2024-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106661570B (zh) | 通过与氨甲蝶呤选择偶联的睡美人转座子制备工程化t细胞 | |
CN111448318A (zh) | 修饰在真核细胞中用于沉默基因表达的非编码rna分子的特异性的方法 | |
WO2017215619A1 (zh) | 在细胞内产生点突变的融合蛋白、其制备及用途 | |
JP2018509151A5 (zh) | ||
KR20170096999A (ko) | 신규한 cho 통합 부위 및 이의 용도 | |
JP2024133642A (ja) | 活性dnaトランスポゾンシステム及びその使用方法 | |
CN108064305B (zh) | 可编程的溶瘤病毒疫苗系统及其应用 | |
CA3125047A1 (en) | Integration of nucleic acid constructs into eukaryotic cells with a transposase from oryzias | |
KR101476010B1 (ko) | 고생산성 세포의 수립을 위한 발현 벡터 및 고생산성 세포 | |
JP2012070744A (ja) | 哺乳類βアクチンプロモーターを利用した発現系 | |
KR102409077B1 (ko) | 프로그램 가능한 항암 바이러스 백신 시스템 및 이의 적용 | |
CN107893073B (zh) | 一种筛选谷氨酰胺合成酶缺陷型hek293细胞株的方法 | |
CN110997925A (zh) | Cho细胞中的整合位点 | |
CN114667344A (zh) | 具有增强的dna产生的经修饰的细菌逆转录元件 | |
US20230416747A1 (en) | Safe harbor loci | |
JP2022023037A (ja) | ゲノム編集方法 | |
JP2022519070A (ja) | 免疫療法の改善のための遺伝子調節組成物及び遺伝子調節方法 | |
TWI812596B (zh) | Hspa5基因的啓動子 | |
CN107955817B (zh) | 人源化基因改造动物模型的制备方法及应用 | |
CN112899238A (zh) | 基于RNA-m6A修饰水平的化合物筛选细胞模型及其构建与应用 | |
WO2005054463A1 (ja) | レトロトランスポゾンを用いた哺乳動物のゲノム改変技術の開発 | |
CN113881678A (zh) | 一种c/ebpz基因启动子及其应用 | |
Sowińska et al. | Potential limitations of the" Sleeping Beauty" transposon use in gene expression studies | |
CN118638859A (zh) | 活性dna转座子系统及其使用方法 | |
CN115786355B (zh) | Tango6基因在促进细胞增殖中的应用以及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40088155 Country of ref document: HK |