CN113727993A

CN113727993A - 通过遗传密码子扩展以靶蛋白选择性方式制备工程化靶蛋白的手段和方法

Info

Publication number: CN113727993A
Application number: CN202080028507.1A
Authority: CN
Inventors: E·A·莱姆克; C·D·赖因克迈尔; G·埃斯特拉达吉罗纳
Original assignee: Europaisches Laboratorium fuer Molekularbiologie EMBL
Current assignee: Europaisches Laboratorium fuer Molekularbiologie EMBL
Priority date: 2019-02-14
Filing date: 2020-02-14
Publication date: 2021-11-30
Also published as: JP2022521049A; WO2020165408A1; US20230098002A1; IL285405A; MA54934A; EP3696189A1; CA3129336A1; EP3924365A1

Abstract

本发明涉及正交翻译系统，其允许以POI‑mRNA选择性方式位点特异性地将非典型氨基酸残基引入靶蛋白(POI)中。具体地，本发明涉及组装器融合蛋白，其使靶向RNA的多肽(RNA‑TP)区段和正交氨酰tRNA合成酶(O‑RS)区段在空间上互相接近，通过RNA‑TP/O‑RS融合蛋白中的直接连接，或通过“组装器”的作用，所述组装器与组装器融合蛋白(AFP)中的这些区段中的每一个融合。本发明还涉及AFP组合和核酸分子，所述核酸分子包含POI编码序列以及能够与RNA‑TP相互作用的靶向核苷酸序列。本发明进一步涉及核酸分子、表达盒和表达载体，其编码所述RNA‑TP/O‑RS融合蛋白或AFP，包含其的细胞，以及用于翻译制备POI的方法和试剂盒。

Description

通过遗传密码子扩展以靶蛋白选择性方式制备工程化靶蛋白的手段和方法

技术领域

本发明涉及正交翻译系统，其允许以POI-mRNA选择性方式将非典型氨基酸(ncAA)残基位点特异性地引入感兴趣的多肽(POI)中。具体地，本发明涉及融合蛋白，其使靶向RNA的多肽(RNA-TP)区段和正交氨酰tRNA合成酶(O-RS)区段在空间上互相接近。这通过在一个相同的融合蛋白(RNA-TP/O-RS融合蛋白)中组合RNA-TP区段和O-RS区段来实现，或通过一个或多个多肽区段的作用来实现，所述多肽区段充当“组装器”(AP)并促进包含一个或多个AP以及RNA-TP区段或O-RS区段的组装器融合蛋白(AFP)的局部富集，从而使所述RNA-TP和O-RS区段相互接近。本发明还涉及AFP组合和核酸分子，所述核酸分子包含POI编码序列和靶向核苷酸序列(TN)，其能够与RNA-TP相互作用。本发明进一步涉及编码所述RNA-TP/O-RS融合蛋白或AFP的核酸分子、表达盒和表达载体，包含其的细胞，以及用于翻译制备POI的方法和试剂盒。

背景技术

将正交(即非交叉反应)翻译系统位点特异性地设计入活细胞中的能力使得能在蛋白中引入新功能。然而，这是一项艰巨的任务，因为翻译是一个复杂的多步骤过程，其中至少有20种不同的氨酰tRNA、其同源氨酰tRNA合成酶(RS)、核糖体以及各种其他因素通过协同作用从RNA转录物合成多肽链。理想的正交系统不会与宿主系统的因素发生交叉反应，从而最大限度地减少其对细胞常规翻译活性和正常生理的影响。

遗传密码子扩展(GCE)是一种实现这一目标的方法，其能够重新编程特定密码子。利用GCE，正交(抑制子)RS(O-RS)可以用非典型氨基酸(ncAA)氨酰化其同源抑制子tRNA。这些ncAA通常是定制设计的，并具有化学功能，例如，可以对蛋白功能进行光控制，编码翻译后修饰或允许使用点击化学引入荧光标记进行显微镜学研究。为了将ncAA位点特异性地引入感兴趣的多肽(POI)中，选择tRNA的反密码子环进行解码，从而抑制终止密码子中的一个(参见，例如Liu et al.,Annu Rev Biochem 2010,79:413-444；Lemke,ChemBioChem 2014,15:1691-1694；Chin,Nature 2017,550；53-60)。为了最大限度的减少对宿主细胞系统的影响，通常利用琥珀终止密码子(对应tRNA_CUA)来终止内源性蛋白(<10％)，因为琥珀终止密码子在大肠杆菌(E.coli)中的丰度特别低。然而，原则上基因组中的任何琥珀密码子都可以被抑制，这可能导致对非靶宿主蛋白的意外背景抑制。如果ncAA修饰的蛋白是为了体外应用而重组生产的，这种背景掺入可能是可以接受的，只要纯化的全长蛋白的产量令人满意。然而，如果宿主不仅仅是可以为其蛋白牺牲的生物反应器容器，那么挑战就不同了。为了原位研究宿主细胞POI的功能，宿主细胞的生理条件是一个重要因素。在这种情况下，特别需要最大限度地减少ncAA的背景掺入，以确保良好控制的实验。

已开发至少三种巧妙的方法来实现大肠杆菌中的正交翻译，即，仅解码POI的RNA的特定密码子而不是整个基因组。i)已开发识别独特Shine-Dalgarno序列的正交核糖体来解码四联体密码子，然后使用其代替终止密码子以位点特异性地将ncAA编码入POI。(参见，例如Heumann et al.,Nature 2010,464:441:444；Orelle et al.,Nature 2015,524:119-124；Fried et al.,Angew Chem 2015,54:12791-12794.)ii)最近，基因组工程已经发展到如下阶段，大肠杆菌菌株中选定的天然密码子可以被去除，为仅在POI中的特定密码子进行选择性解码提供干净的(例如，无琥珀密码子)宿主遗传背景。(参见，例如Isaacs et al.,Science 2011,333:348-353；Lajoie et al.,Science 2013,342:357-360；Ostrov etal.,Science 2016,353:819-822；Wang et al.,Nature 2016,539:59-64.)iii)使用人工碱基对设计独特的非典型密码子，其仅在POI编码序列中进行编码。这降低在基因组的其他部分中非特异性解码的风险(参见Zhang et al.,Nature 2017,551:644-647)。然而，由于基因组的复杂性，将这些正交翻译方法移用到真核生物中并不是简单易行的(参见，例如Thompson et al.,ACS Chem Biol 2018,13:313-325)，此外，真核生物中琥珀密码子是高度丰富的(在哺乳动物细胞中为20％)。

因此，亟需通用的POI选择性正交翻译策略，它不仅仅适用于相对容易处理和操作的良好表征的原核生物(如大肠杆菌)，而且也适用于真核细胞。因此，本发明目的是解决这种挑战。

发明内容

本发明人发现能够选择性翻译POI的mRNA的正交翻译系统(OT系统)可以通过使POI的mRNA和O-RS在空间上接近来产生，其允许将ncAA残基翻译引入不断增长的POI的多肽链中。本发明人证明包括膜蛋白在内的多种POI，它们的OT系统允许位点特异性地将ncAA残基引入哺乳动物细胞中的POI中，与细胞质中含有相同终止密码子(用作编码POI的ncAA残基的选择密码子)的其他mRNA相比，对POI的mRNA具有选择性。

在本发明的正交翻译系统中，空间接近是通过在POI的mRNA中包含靶向序列(TN)来实现的，其可以选择性地与靶向RNA的多肽(RNA-TP)相互作用，并将O-RS与这样的RNA-TP进行连接。所述连接可以在包含O-RS和RNA-TP的融合蛋白中(RNA-TP/O-RS融合蛋白)。

在另一种方法中，这可以通过一个或多个多肽区段的作用来实现，所述多肽区段充当“组装器(assembler)”(AP)以促进至少两种组装器融合蛋白(AFP)的局部富集，其中至少一种包含一个或多个AP和RNA-TP区段，并且至少另一种AFP包含一个或多个AP和O-RS区段，从而使所述RNA-TP和O-RS区段(RNA-TP和O-RS也称为“效应物”或“EP”)相互靠近。AFP的局部富集允许形成组装器集合体(assemblies)(OT组装器集合体，在本文中也称“OT细胞器”)，其可充当人工正交翻译细胞器。

本发明人证明可使用不同类型的AP。第一种类型包括在(先前已有的)细胞内结构(例如，微管或膜如细胞膜或核膜、ER、线粒体或高尔基体细胞器的细胞质侧)处驱动局部富集的AP，称为细胞内靶向多肽(IC-TP)区段。第二种类型的AP通过细胞质中的自缔合(特别是通过相分离)形成局部高浓度的AFP，本文中称为相分离多肽(PSP)区段。所述AP类型也可与具有形成多聚体结构能力的其他多肽元件组合，特别是，由合成SYNZIP多肽对所形成的卷曲螺旋异二聚体。类似地，所述EP类型也可以与具有形成多聚体结构能力的其他多肽元件组合，特别是，由合成SYNZIP多肽对所形成的卷曲螺旋异二聚体。这种多聚体的形成进一步提高AFP的局部富集。

本发明人进一步发现组合不同AP类型的AFP特别有用。

在另一种方法中，提供包含单个多肽的AFP，即融合在一起的两种类型EP区段，即RNA-TP和O-RS区段，一种或两种类型的AP区段，即IC-TP和/或PSP区段，任选地补充有具有形成多聚体结构能力的所述多肽元件(SYNZIP多肽)。这提供的优点是产生本发明OT系统所需的所有元件都包含在单个AFP中。

因此，在第一方面，本发明涉及一种组装器融合蛋白(AFP)，其包含：

(a)充当组装器(AP)的至少一个第一多肽区段，其选自：

(a1)源自细胞内靶向多肽的多肽区段(IC-TP区段)，其中所述细胞内靶向多肽靶向细胞内结构元件，并因此在所述细胞内结构元件处局部富集，所述细胞内结构元件在细胞质内或与细胞质直接相邻；和

(a2)源自相分离多肽的多肽区段(PSP区段)，其中所述相分离多肽具有在细胞的细胞质中进行自缔合的能力以在细胞质中产生高局部浓度的位点，以及

(b)充当效应物(EP)的至少一个第二多肽区段，其选自：

b1)靶向RNA的多肽(RNA-TP)区段，和

b2)正交氨酰tRNA合成酶(O-RS)区段；

其中所述多肽区段在所述AFP中功能性连接。

在第二方面，本发明涉及一种组装器融合蛋白(AFP)组合，其包含至少两种本发明的AFP。优选地，AFP组合包含至少一种包含RNA-TP区段的AFP和至少一种包含O-RS区段的AFP。在所述组合的至少一种AFP中包括第一SYNZIP元件，并在所述组合的至少另一种AFP中包括第二SYNZIP元件，其中所述第一和所述第二SYNZIP通过形成异二聚体结构共同作用，代表了所述第二方面的另一种优点。

在第三方面，本发明涉及一种融合蛋白(RNA-TP/O-RS融合蛋白)，其包含：

(i)至少一个靶向RNA的多肽(RNA-TP)区段；和

(ii)至少一个正交氨酰tRNA合成酶(O-RS)区段，

其中所述多肽区段在所述RNA-TP/O-RS融合蛋白中功能性连接。

在进一步的方面，本发明提供一种核酸分子，或者两种或更多种核酸分子的组合，其包含：

(i)核苷酸序列，其编码至少一种本发明的RNA-TP/O-RS融合蛋白，或

(ii)与(i)互补的核酸序列，或

(iii)(i)和(ii)。

(i)核苷酸序列，其编码至少一种本发明的AFP，或

(ii)与(i)互补的核酸序列，或

(iii)(i)和(ii)。

(i)核苷酸序列，其编码至少一种本发明的AFP组合，或

(ii)与(i)互补的核酸序列，或

(iii)(i)和(ii)。

在进一步的方面，本发明提供一种表达盒，其包含本发明的核酸分子或者核酸分子的组合的核苷酸序列。

在具体实施方案中，本发明提供一种表达盒，其包含：

(ii)与(i)互补的核酸序列，或

(iii)(i)和(ii)。

在进一步的具体实施方案中，本发明提供一种表达盒，其包含：

(i)核苷酸序列，其编码至少一种本发明的AFP，或

(ii)与(i)互补的核酸序列，或

(iii)(i)和(ii)。

(i)核苷酸序列，其编码至少一种本发明的AFP组合，或

(ii)与(i)互补的核酸序列，或

(iii)(i)和(ii)。

在进一步的方面，本发明提供一种表达载体，其包含至少一种本发明的表达盒。

在进一步的方面，本发明提供一种细胞，其包含至少一种本发明的核酸分子或核酸分子的组合。在具体实施方案中，所述细胞包含至少一种本发明的表达盒或至少一种本发明的表达载体。

在进一步的方面，本发明涉及一种制备感兴趣的多肽(POI)的方法，所述POI在其氨基酸序列中包含一种或多种非典型氨基酸(ncAA)残基。所述方法包括在所述一种或多种ncAA的存在下，在本发明的细胞中表达所述POI，其中所述细胞包含：

(i)本文所述的至少一种包含RNA-TP区段的AFP和至少一种包含O-RS区段的AFP；

(ii)编码POI的核苷酸序列(CS^POI)，其中所述POI的一种或多种ncAA残基由选择密码子编码，

(iii)靶向核苷酸序列(TN)，其功能性连接至所述CS^POI，并且能够与所述细胞中AFP中的至少一种的RNA-TP区段相互作用；

(iv)一种或多种正交tRNA^ncAA(O-tRNA^ncAA)分子，其携带与所述CS^POI的选择密码子互补的反密码子，并且其中所述O-tRNA^ncAA分子与所述细胞中AFP的一个或多个O-RS区段一起形成一个或多个正交O-RS/O-tRNA^ncAA对，其允许将所述一种或多种ncAA残基引入POI的氨基酸序列中；

并且其中所述方法任选地进一步包括回收表达的POI。

(i)中列举的所述至少一种包含RNA-TP区段的AFP和所述至少一种包含O-RS区段的AFP可以是一种且相同类型的AFP，即包含RNA-TP区段和O-RS区段的AFP。或者，(i)中列举的所述至少一种包含RNA-TP区段的AFP和所述至少一种包含O-RS区段的AFP可以是不同的AFP。

(i)本发明的RNA-TP/O-RS融合蛋白；

(iii)靶向核苷酸序列(TN)，其功能性连接至所述CS^POI，并且能够与所述细胞中RNA-TP/O-RS融合蛋白中的至少一种的RNA-TP区段相互作用；

(iv)一种或多种正交tRNA^ncAA(O-tRNA^ncAA)分子，其携带与所述CS^POI的选择密码子互补的反密码子，并且其中所述O-tRNA^ncAA分子与所述细胞中RNA-TP/O-RS融合蛋白的一个或多个O-RS区段一起形成一个或多个正交O-RS/O-tRNA^ncAA对，其允许将所述一种或多种ncAA残基引入POI的氨基酸序列中；

并且其中所述方法任选地进一步包括回收表达的POI。

在进一步的方面，本发明涉及一种制备感兴趣的多肽(POI)的方法，所述POI在其氨基酸序列中包含一种或多种非典型氨基酸(ncAA)残基。所述方法包括以下步骤：

(a)在细胞中表达本文所述的一种或多种包含至少一个RNA-TP区段的AFP和一种或多种包含至少一个O-RS区段的AFP；

(b)在所述细胞中表达一种或多种正交tRNA^ncAA(O-tRNA^ncAA)分子，其中

-所述正交tRNA^ncAA分子与细胞中的AFP的一个或多个O-RS区段形成一个或多个正交氨酰tRNA合成酶/tRNA^ncAA(O-RS/O-tRNA^ncAA)对，

-所述O-RS/O-tRNA^ncAA对允许将所述一种或多种ncAA残基引入所述POI的氨基酸序列中，

其中步骤(a)和(b)可以同时或以任何顺序依次进行；

(c)随后，在所述一种或多种ncAA的存在下，在所述细胞中表达所述POI，其中

-编码POI的核苷酸序列(CS^POI)包含编码所述一种或多种ncAA残基的一种或多种选择密码子，

-所述选择密码子与所述一种或多种O-tRNA^ncAA分子的反密码子匹配；

-所述CS^POI与靶向核苷酸序列(TN)功能性连接，从而形成CS^POI/TN融合序列，

-所述CS^POI/TN融合序列能够通过其TN与所述细胞中AFP中的至少一种的RNA-TP区段相互作用；

以及

(d)任选地回收表达的POI。

(a)在细胞中表达本发明的RNA-TP/O-RS融合蛋白；

-所述正交tRNA^ncAA分子与细胞中的RNA-TP/O-RS融合蛋白的一个或多个O-RS区段形成一个或多个正交氨酰tRNA合成酶/tRNA^ncAA(O-RS/O-tRNA^ncAA)对，

其中步骤(a)和(b)可以同时或以任何顺序依次进行；

(c)随后，在所述一种或多种ncAA的存在下，在所述细胞中表达所述POI，

其中

-所述CS^POI/TN融合序列能够通过其TN与所述细胞中RNA-TP/O-RS融合蛋白中的至少一种的RNA-TP区段相互作用；

以及

(d)任选地回收表达的POI。

在进一步的方面，本发明涉及一种核酸分子，其包含：

(i)编码感兴趣的多肽(POI)的核苷酸序列(CS^POI)，所述POI包含一个或多个、相同或不同的非典型氨基酸(ncAA)残基，所述ncAA残基在CS^POI中由选择密码子编码，和

(ii)靶向核苷酸序列(TN)，其中包含所述TN的RNA分子能够通过所述TN与靶向RNA的多肽(RNA-TP)相互作用。

在进一步的方面，本发明涉及一种试剂盒，其用于制备具有至少一个非典型氨基酸(ncAA)残基的感兴趣的多肽(POI)，所述试剂盒包含：

-至少一种ncAA或其盐，其对应于所述POI的至少一个ncAA残基；以及

-至少一种本发明的表达载体。

所述表达载体包含至少一个表达盒，所述表达盒包含：

(i)核苷酸序列，其编码至少一种本发明的RNA-TP/O-RS融合蛋白、至少一种本发明的AFP或至少一种本发明的AFP组合，或

(ii)与(i)互补的核酸序列，或

(iii)(i)和(ii)。

附图说明

图1显示组件空间分离的示意图，其允许正交翻译以解码独特标记的mRNA中的特定终止密码子。(A)合成酶PylRS的常规表达导致其同源终止密码子抑制子tRNA^Pyl由定制设计的ncAA氨酰化。这使得每当各自的终止密码子出现在POI的mRNA中时，就会导致位点特异性的ncAA掺入。鉴于许多内源性mRNA以相同的终止密码子终止，在细胞质中使用这种方法可能会导致ncAA错误掺入不需要的蛋白中(左框)。(B)为了避免这种情况发生，本发明允许通过使用靶向RNA的多肽区段(例如，MCP)和组装器(AP)，使编码POI的mRNA和正交氨酰-tRNA合成酶(例如，PylRS)相互紧密靠近。这允许所有组件在空间上富集以产生OT组装器集合体(“OT细胞器”)，包括编码POI的mRNA、正交氨酰-tRNA合成酶、tRNA和核糖体(右框)。这里，特别是氨酰tRNA^Pyl可与OT细胞器直接接近，因此可以特别地发生(POI mRNA的)终止密码子抑制。这导致选择性抑制POI mRNA的终止密码子(并因此表达POI mRNA)，而不是非靶向至OT组装器集合体的mRNA中的相应终止密码子。虽然在(A)中，GCE发生终止密码子特异性，但在(B)中它应该发生终止密码子特异性和mRNA特异性。

图2A显示不同组装器类型的示意图。B＝双分子MCP::PylRS融合，P1＝融合到FUS和EWSR1，P2＝SPD5，K1＝驱动蛋白KIF13A的截短(KIF13A_{1-411，ΔP390})，K2＝驱动蛋白KIF16B的截短(KIF16B_1-400)及其组合(K1::P1、K1::P2、K2::P1、K2::P2)。

图2B显示双色报告基因的示意图。在容许位点含有终止密码子的编码荧光蛋白GFP和mCherry的mRNA由一个质粒表达，每个都有自己的CMV启动子，确保每次实验中mRNA的比例恒定。mCherry报告基因的mRNA用两个MS2 RNA茎环(“ms2”，本文也称为MS2标签)标记，mRNA(mCherry)::ms2。在ncAA和tRNA^Pyl的存在下，在细胞质PylRS的情况下，GFP^39STOP和mCherry^185STOP都会生成，导致荧光流式细胞术(FFC)分析(左框)的对角线产生。然而，在相同条件下，OT细胞器中的正交翻译使得能够选择性地抑制mRNA(mCherry)::ms2的终止密码子，从而产生mCherry阳性和GFP阴性群体(在右框中示意性地绘制为垂直群体)。在这两种方案中，未转染的HEK293T细胞用底部的灰色圆圈表示。

图2C显示各种示例性OT系统的选择性和相对效率。在所有实验中，标示的构建体与tRNA^Pyl(对应于标示的密码子的反密码子)和双报告基因(GFP^39STOP、mCherry^185STOP::ms2)共表达。GCE在标示的ncAA的存在下进行，并通过FFC分析细胞。深灰色条(标准化为细胞质PylRS)代表所有测试系统的mCherry与GFP(源自FFC，参见图2D、E)的平均荧光强度比率r的倍数变化。浅灰色条表示相对效率，其定义为在每种条件下，mCherry的平均荧光强度除以细胞质PylRS对照(源自FFC，参见图2D、E)。显示的是至少三个独立实验的平均值；误差线代表SEM。方框突出显示表现得最佳的OT细胞器(OT^K2::P1)。

图2D显示双色报告基因的FFC分析结果图，所述双色报告基因是在ncAA SCO(具有环辛炔侧链的赖氨酸衍生物)的存在下，在转染的HEK293T细胞和tRNA^Pyl中用四个标示的系统表达。在OT组装器集合体中观察到高选择性和高效的正交翻译(黑色箭头表示明亮的、高mCherry阳性的群体)。点图显示的是至少三个独立实验的总和。坐标轴表示荧光强度，单位为任意单位。

图2E显示OT组装器集合体的FFC图，仅分别选择性地翻译招募的mRNA(mCherry^185TGA)::ms2和mRNA(mCherry^185TAA)::ms2的乳白和赭石密码子。

图3显示构成以下系统的构建体示意图：PylRS、MCP::PylRS、FUS::MCP::PylRS和LcK::FUS::PylRS·LcK::EWS::MCP。

图4为采用图3中所述的4种不同系统进行双报告基因表达的流式细胞术分析。HEK293T细胞用构建体转染，所述构建体编码双报告基因、tRNA、LcK::FUS::PylRS和LcK::EWS::MCP或PylRS、MCP::PylRS、FUS::MCP::PylRS和pcDNA3.1。显示的是至少三个独立实验的总和。坐标轴表示荧光强度，单位为任意单位。

图5显示所有测试系统的mCherry与GFP荧光的平均荧光强度比率的条形图。条形图表示至少3次生物学重复的平均值，误差线表示平均值的标准误差。

图6提供用本发明的不同方法产生靶向不同细胞内结构表面的OT细胞器的概况。显示不同构建体的表达和各自荧光流式细胞术(FFC)分析的结果。在图的顶部描绘的是双色报告基因构建体GFP^39TAG·mCherry^185TAG::ms2(另请参见图2B)用于A到G中每个实验的示意图，并显示靶向的不同细胞区室的示意图。也显示A至G中每个的对照实验，对照实验在没有效应多肽MCP(-MCP)的情况下进行：

A：靶向微管的OT细胞器，其通过表达系统KIF16B_1-400::FUS::PylRS·KIF16B_1-400::EWSR1::MCP或构建体KIF16B_1-400::FUS::PylRS(对照)获得；

B：靶向微管正末端的OT细胞器，其通过表达构建体EB1::FUS::MCP::PylRS或EB1::FUS::PylRS(对照)获得。

C：靶向质膜的OT细胞器，其通过表达系统LcK::FUS::PylRS·LcK::EWSR1::MCP或构建体LcK::FUS::PylRS(对照)获得。

D：靶向线粒体膜的OT细胞器，其通过表达系统TOM20_1-70::FUS::PylRS·TOM20_1-70::EWSR1::MCP或构建体TOM20_1-70::FUS::PylRS(对照)获得。

E：靶向核膜的OT细胞器，其通过表达系统CG1::FUS::PylRS·CG1::EWSR1::MCP或构建体CG1::FUS::PylRS(对照)获得。

F(左侧)：靶向高尔基体膜的OT细胞器，其通过表达系统EBAG9_1-29::FUS::PylRS·EBAG9_1-29::EWSR1::MCP或构建体EBAG9_1-29::FUS::PylRS(对照)获得。

F(右侧)：靶向高尔基体膜的OT细胞器，其通过表达系统CMP Sia Tr::FUS::PylRS·CMP Sia Tr::MCP或构建体CMP Sia Tr::FUS::PylRS(对照)获得。

G：靶向ER膜的OT细胞器，其通过表达系统P450 2C1_1-27::FUS::PylRS·P4502C1_1-27::EWSR1::MCP或构建体P450 2C1_1-27::FUS::PylRS(对照)获得。

图7提供本发明招募RNA的不同方法的概述，所述方法利用不同RNA环与各自的靶向RNA的蛋白的相互作用。显示各自荧光流式细胞术(FFC)分析结果，并与仅用非靶向PylRS的相应分析结果进行比较：

A：系统ms-2-MCP将ms2环掺入mRNA分子的UTR中，并用MCP蛋白将所述mRNA招募到人工细胞器中。

B：系统boxB-λ_N22将boxB环掺入mRNA分子的UTR中，并用λ_N22蛋白将所述mRNA招募到人工细胞器中

C：系统pp7-PCP将pp7环掺入mRNA分子的UTR中，并用PCP蛋白将所述mRNA招募到人工细胞器中。

图8显示本发明产生OT细胞器的另一种方法，所述OT细胞器在不同细胞结构表面进行作用。本图示例靶向质膜。该具体方法的特征是将所谓的合成异二聚体卷曲螺旋肽SYNZIP1和SYNZIP2成对融合掺入到系统LcK::FUS::SYNZIP1::PylRS·EWSR1::SYNZIP2::MCP中；SYNZIP1和2对表达后，将MCP招募到基于质膜的OT细胞器上，其又使得能对随后招募的包含ms2靶向核苷酸环的mRNA进行选择性正交翻译。选择性翻译用各自的FFC分析结果(A)进行图示说明。在使用系统LcK::FUS::PylRS·EWSR1::SYNZIP2::MCP的比较方法中，其中缺少SYNZIP1，没有观察到翻译的选择性(B)。

具体实施方式

除非本文另有定义，否则本发明上下文中使用的科学和技术术语应具有本领域普通技术人员通常理解的含义。术语的含义和范围应明确。但是，在任何隐含歧义的情况下，本文提供的定义优先于任何字典或外部定义。此外，除非上下文另有要求，单数术语应包括复数，以及复数术语应包括单数。

如果没有另外说明，本文所述的核苷酸序列以5'到3'的方向描述。如果没有另外说明，本文所述的氨基酸序列以从N-端到C-端的方向描述。

如果没有另外说明，本发明的OT系统翻译表达的感兴趣的多肽(POI)包含一种或多种ncAA残基，其通过选择密码子在编码POI的核苷酸序列(CS^POI)中编码。

1.融合蛋白

1.1.总则

本发明的融合蛋白可以用不同方式解释说明。

第一种类型包括融合蛋白，其中至少两种类型的效应多肽(EP)包含于一个且相同的融合蛋白(也称为RNA-TP/O-RS融合蛋白)中，所述至少两种类型的效应多肽(EP)包含至少一个RNA-TP和至少一个O-RS。

第二种类型包括融合蛋白，其包含至少一种组装器多肽(AP)和至少一种类型的EP(也称为AFP)，所述EP选自RNA-TP区段和O-RS区段。具体地，除了至少一种类型的AP之外，AFP可以包含RNA-TP和O-RS区段，如任何序列顺序的一个或多个RNA-TP区段以及一个或多个O-RS区段。因此，AFP具体地选自以下融合蛋白类型(多肽链内以任何顺序功能性连接的区段；多肽链内以任何顺序功能性连接的一个或多个相同类型的区段)：

(RNA-TP/AP)

(O-RS/AP)

(RNA-TP/O-RS/AP)

AP选自IC-TP和PSP，并且可以包含任何序列顺序的一个或多个IC-TP和/或一个或多个PSP。因此，更为具体地，AFP选自以下融合蛋白类型(多肽链内以任何顺序功能性连接的区段；多肽链内以任何顺序功能性连接的一个或多个相同类型的区段)：

(RNA-TP/IC-TP)

(O-RS/IC-TP)

(RNA-TP/O-RS/IC-TP)

(RNA-TP/PSP)

(O-RS/PSP)

(RNA-TP/O-RS/PSP)

(RNA-TP/PSP/IC-TP)

(O-RS/PSP/IC-TP)

(RNA-TP/O-RS/PSP/IC-TP)

AP和/或EP也可以包含(作为融合蛋白的一部分)形成异源寡聚体、特别是形成异二聚体的多肽区段，例如特别是合成卷曲螺旋SYNZIP肽。AFP组合包含这类相互作用的SYNZIP对，其分布在所述AFP组合的成员之间，使得每个AFP仅包含这类相互作用的SYNZIP对的一个成员，如具体实施方案所示。

本文所使用的术语“区段”在融合蛋白的上下文中表示所指定的元件(如，RNA-TP、O-RS、IC-TP、PSP、SYNZIP)是融合蛋白的一部分，即连接到融合蛋白的剩余部分。本发明的融合蛋白区段是功能性连接的，即连接使得它们仍然分别作为RNA-TP、O-RS、IC-TP和PSP或SYNZIP发挥作用。所述连接优选是共价的，特别是肽连接。

例如，本发明的融合蛋白包含的RNA-TP区段是融合蛋白的区段，其源自RNA-TP并在融合蛋白的上下文中作为RNA-TP发挥作用，因此允许融合蛋白与靶向的RNA相互作用(结合)，其中所述相互作用有利地是特异性相互作用。因此，RNA-TP区段可以包含本文所述的靶向RNA的多肽的(整个)氨基酸序列或功能片段。

类似地，本发明的融合蛋白所包含的O-RS区段是融合蛋白的区段，其源自O-RS并在融合蛋白的上下文中作为O-RS发挥作用，因此赋予融合蛋白O-RS酶活性，所述酶活性是指用ncAA催化O-tRNA氨酰化的能力。因此，O-RS区段可以包含本文所述的O-RS的(整个)氨基酸序列或功能片段。

本文所述的组装器融合蛋白(AFP)包含至少一个作为组装器(AP)的多肽区段。本文所使用的术语AP是指允许在活细胞内的空间不同位点富集包含所述区段的AFP的任何多肽区段。有利地，所述空间不同位点位于细胞的细胞质内或直接与细胞质相邻，并且易于被细胞的翻译系统(包括典型的氨酰tRNA、翻译因子、核糖体亚基等)以及允许将ncAA残基引入POI的O-tRNA进入使用。

有不同类型的多肽区段可用作本发明中的AP。一种类型的AP是多肽区段，其源自细胞内靶向多肽(IC-TP)并在融合蛋白的上下文中作为细胞内靶向多肽(IC-TP)发挥作用。这些IC-TP区段可以包含IC-TP的(整个)氨基酸序列或功能片段。IC-TP靶向细胞内结构元件，并因此在所述细胞内结构元件处局部富集，所述细胞内结构元件在细胞质内或与细胞质直接相邻。这类结构元件的实例包括微管、膜的细胞质侧，如细胞膜、核膜、线粒体膜、高尔基体膜、内质网膜等。

因此，在具体实施方案中，本发明的融合蛋白包含至少一个IC-TP区段，其靶向并促进融合蛋白在微管，特别是微管的正端或负端的局部富集。例如，动力蛋白和驱动蛋白(动力蛋白或驱动蛋白家族的蛋白)及其功能片段和突变体可用作实现这种功能的IC-TP。

在进一步的具体实施方案中，本发明的融合蛋白包含至少一个IC-TP区段，其源自膜锚(membrane anchor)并作为膜锚发挥作用。例如，本发明的融合蛋白包含至少一个IC-TP区段，其靶向并促进融合蛋白在细胞(内)膜(特别是细胞膜的细胞质侧)处的局部富集。在另一个实例中，本发明的融合蛋白包含至少一个IC-TP区段，其靶向并促进融合蛋白在(外)核膜(特别是核膜的细胞质侧)处的局部富集。在进一步的具体实施方案中，本发明的融合蛋白包含至少一个IC-TP区段，其靶向并促进融合蛋白在线粒体外膜(特别是线粒体膜的细胞质侧)处的局部富集。在进一步的具体实施方案中，本发明的融合蛋白包含至少一个IC-TP区段，其靶向并促进融合蛋白在ER外膜(特别是ER膜的细胞质侧)处的局部富集。在进一步的具体实施方案中，本发明的融合蛋白包含至少一个IC-TP区段，其靶向并促进融合蛋白在高尔基体外膜(特别是高尔基体膜的细胞质侧)处的局部富集。例如，膜蛋白的跨膜结构域及其功能片段和突变体可用作实现这种功能的IC-TP。

靶向并因此在细胞内结构元件处局部富集的多肽是本领域已知的，并可用作本发明中IC-TP。

合适的IC-TP具体实例包括但不限于：

-任选截短的驱动蛋白多肽，其组成性地移向并在活细胞中的微管正末端处局部富集，例如任选截短的驱动蛋白家族成员16B(KIF16B)，如任选截短的智人KIF16B(Uniprot:Q96L93)，特别是覆盖KIF16B氨基酸残基1-400(KIF16B1-400)的片段，其包含SEQID NO:20的氨基酸序列；或任选截短的驱动蛋白家族成员13A(KIF13A)，如任选截短的智人KIF13A(Uniprot:Q9H1H9)，特别是覆盖氨基酸残基1-411的KIF13A片段，其中P390缺失(KIF13A_{1-411，Δ390})，其包含SEQ ID NO:22的氨基酸序列；多肽EB1，微管尖端(microtubuletip)结合蛋白，其与生长的微管正末端结合(Nehlig A,Molina A,Rodrigues-Ferreira S,HonoréS,Nahmias C.Regulation of end-binding protein EB1 in the control ofmicrotubule dynamics.Cell Mol Life Sci.2017；74(13):2381–2393.doi:10.1007/s00018-017-2476-2)(Uniprot:Q15691)，因此将细胞器靶向至微管正末端并包含SEQ IDNO：302的氨基酸序列；

-源自跨膜蛋白的靶向线粒体外膜的多肽，例如，任选截短的线粒体外膜易位酶20(TOMM20)，如任选截短的智人TOMM20(Uniprot:Q15388)，特别是覆盖TOMM20的氨基酸残基1-70的片段(TOMM20_1-70)，其包含SEQ ID NO:24的氨基酸序列；

-源自跨膜蛋白的细胞膜靶向多肽，例如，淋巴细胞特异性蛋白酪氨酸激酶(LcK；如：小家鼠(Mus musculus)LcK，Uniprot：P06240)、CD4(如：小家鼠CD4，Uniprot：P06332)、FRB(类似智人mTOR；Uniprot：P42345)、CD28(如：小家鼠CD28，Uniprot：P31041)及其组合，特别是包含SEQ ID NO：26、SEQ ID NO：28或SEQ ID NO：30的氨基酸序列的多肽；

-多肽CG1，与核孔复合物的细胞质侧结合的核孔蛋白(Fernandez-Martinez J,Kim SJ,Shi Y,et al.Structure and Function of the Nuclear Pore ComplexCytoplasmic mRNA Export Platform.Cell.2016；167(5):1215–1228.e25.doi:10.1016/j.cell.2016.10.028)(也称为Nup42)(Uniprot:O15504)，其靶向核膜的细胞质侧，包含SEQID NO:304的氨基酸序列；

-多肽EBAG9，具有一个跨膜螺旋的高尔基体膜蛋白(Engelsberg A,HermosillaR,Karsten U,Schülein R,

B,Rehm A.The Golgi protein RCAS1 controls cellsurface expression of tumor-associated O-linked glycan antigens.J BiolChem.2003；278(25):22998–23007.doi:10.1074/jbc.M301361200)(Uniprot:O00559)，其靶向高尔基体膜的细胞质侧，包含SEQ ID NO:292的氨基酸序列(全长)或包含SEQ ID NO:294的前29个N端氨基酸残基；或多肽CMP Sia Tr，CMP唾液酸转运蛋白，具有10个跨膜螺旋的高尔基体蛋白(Eckhardt M,Gotza B,Gerardy-Schahn R.Membrane topology of themammalian CMP-sialic acid transporter.J Biol Chem.1999；274(13):8779–8787.doi:10.1074/jbc.274.13.8779)(Uniprot:P78382)，其靶向高尔基体膜的细胞质侧，包含SEQID NO:296的氨基酸序列；

-P450 2C1的多肽片段，内质网驻留蛋白(Fazal FM,Han S,Parker KR,etal.Atlas of Subcellular RNA Localization Revealed by APEX-Seq.Cell.2019；178(2):473–490.e26.doi:10.1016/j.cell.2019.05.027)(Uniprot:P78382)，其靶向ER膜的细胞质侧，特别是包含N端前27个(SEQ ID NO:298)或前29个(SEQ ID NO:300)氨基酸残基的片段；

-跨膜蛋白红细胞膜整合蛋白(stomatin)样蛋白3(SLP-3)(包含SEQ ID NO:310的氨基酸序列的膜；aa 1-59(智人，Uniprot:Q8TAV4)，定位于质膜和囊泡膜(Lapatsina L,Jira JA,Smith ES,et al.Regulation of ASIC channels by a stomatin/STOML3complex located in a mobile vesicle pool in sensory neurons.Open Biol.2012；2(6):120096.doi:10.1098/rsob.120096)；

以及这些多肽的功能片段和突变体。所述功能片段和突变体可以与其来源的多肽的氨基酸具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性。

另一种类型的AP是多肽区段，其源自相分离多肽(PSP)并在融合蛋白的上下文中作为相分离多肽发挥作用。PSP是多肽，其具有在细胞的细胞质中自组装的能力，从而在细胞质中产生局部高浓度位点。具体地，PSP能够驱动相分离(特别是液-液相分离)，从而导致在细胞质中形成无膜区室。所述区室可以采取液滴、聚集体、冷凝物或致密相的形式。特别地，PSP包括天然无序蛋白(IDP)，其是一类重要的驱动相分离的蛋白(参见，例如，Albertiet al.,Bioessays 2016,38:959-968和其中引用的参考文献，如Patel et al.,Cell2015,162:1066-1077；Han et al.,Cell 2012,149:768-779；Kato et al.,Cell 2012,149:753-767)。有三种不同类别的ICPs，每种类别的蛋白、或者其功能片段或突变体，可用作本发明中的PSP。IDP的一种重要类别包含所谓的朊病毒样结构域，其不带电荷并包含极性氨基酸残基(Q、N、S、G)和散布的芳香族残基(F、Y)。参见，例如Malinovska et al.,Biochim Biophys Acta 2013,1834:918-931；Alberti et al.,2009,Cell 137:146-158；Malinovska et al.,Prion 2015,9:339-346。另一类IDP也具有低序列复杂性的特征，但通常包含酸性和碱性氨基酸侧链，如包含RGG重复的IDP，如Ddx4。参见Nott et al.,Cell2015,57:936-947。合适的IC-TP的具体实例包括但不限于：

-纺锤体缺陷蛋白5(SPD5)(如，秀丽隐杆线虫(Caenorhabditis elegans)SPD5；Uniprot：P91349)，特别是包含SEQ ID NO：32的氨基酸序列的多肽；

-融合肉瘤(FUS)(如，智人FUS；Uniprot：P35637)，特别是包含SEQ ID NO：34的氨基酸序列的多肽；

-尤文肉瘤断点区域1(Ewing sarcoma breakpoint region 1)(EWSR1)(如，智人EWSR1；Uniprot：Q01844)，特别是包含SEQ ID NO：36的氨基酸序列的多肽；

-ATP依赖性RNA解旋酶laf-1(RGG结构域，1-168，包含SEQ ID NO:308的氨基酸序列的LAF-1膜；)(秀丽隐杆线虫，Uniprot：D0PV95)，(Schuster BS,Reed EH,ParthasarathyR,et al.Controllable protein phase separation and modular recruitment to formresponsive membraneless organelles.Nat Commun.2018；9(1):2985.2018年7月30日发表.doi:10.1038/s41467-018-05403-1)；

以及这些多肽的功能片段和突变体。所述功能片段和突变体可以包含与其来源的多肽的氨基酸至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％相同的氨基酸序列。

本发明的融合蛋白所包含的AP数量没有特别限制，即融合蛋白可以包含1、2、3、4、5、6、7、8、9、10个或多个相同或不同的AP。特别优选包含至少一个选自IC-TP区段的AP和至少一个选自PSP区段的AP的本发明的融合蛋白。同样地，RNA-TP区段的数量没有特别限制并且可以独立地选自1、2、3、4、5或更多个，例如6、7、8、9或10个，不同或相同的RNA-TP区段。同样地，O-RS区段的数量没有特别限制并且可以独立地选自1、2、3、4、5或更多个，例如6、7、8、9或10个，不同或相同的O-RS区段。这适用于AFP以及RNA-TP/O-RS融合蛋白。本发明的融合蛋白中的区段数量显然影响融合蛋白的大小，其没有特别限制，但通常小于3500个氨基酸残基，例如小于3000个氨基酸残基。

本发明的融合蛋白内的区段顺序也没有特别限制。RNA-TP、O-RS和/或AP区段因此可以以任意顺序进行功能性连接。RNA-TP/O-RS融合蛋白结构(包含两种类型的EP区段)的实例包括但不限于，

[RNA-TP]_x-[O-RS]_y

[O-RS]_y-[RNA-TP]_x

其中x和y相互独立，是选自1、2、3、4和5的整数；

“-”表示肽键。

当x≥2，[RNA-TP]_x可以包括相同或不同的RNA-TP区段。当Y≥2，[O-RS]_y可以包括相同或不同的O-RS区段。

RNA-TP/O-RS融合蛋白结构的实例包括但不限于：

[IC-TP]_m-[EP]_o

[EP]_o-[IC-TP]_m

[PSP]_n-[EP]_o

[EP]_o-[PSP]_n

[IC-TP]_m-[EP]_o-[PSP]_n

[PSP]_n-[EP]_o-[IC-TP]_m

[IC-TP]_m-[PSP]_n-[EP]_o

[EP]_o-[PSP]_n-[IC-TP]_m

[PSP]_n-[IC-TP]_m-[EP]_o

[EP]_o-[IC-TP]_m-[PSP]_n

其中m、n和o相互独立，是选自1、2、3、4或5的整数，或选自1、2、3、4、5、6，“-”表示肽键。

在一个优选的实施方案中，“m”是整数1。

在另一个优选的实施方案中，“n”是选自1和2的整数。

在另一个优选的实施方案中，如果EP选自RNA-TP，则“o”是选自1、2、3、4、5或6的整数。

在另一个优选的实施方案中，如果EP选自O-RS，则“o”是选自1或2的整数。

在RNA-TP/O-RS融合蛋白结构的另一个优选的实施方案中，优选其中至少一个ICT-TP在多肽链内占据C-或N-末端位置。

在RNA-TP/O-RS融合蛋白结构的另一个优选的实施方案中，优选其中至少一个EP在多肽链内占据C-或N-末端位置。

在RNA-TP/O-RS融合蛋白结构的另一个优选的实施方案中，优选其中至少一个ICT-TP在多肽链内占据C-或N-末端位置，同时至少一个EP在多肽链内分别占据N-或C-末端位置。任何PSP，如果存在于这种结构中，都位于多肽链内。

当m≥2，[IC-TP]_m可以包括相同或不同的IC-TP区段。优选地应用相同功能的IC-TP(靶向相同类型的细胞结构(例如，相同的膜类型或类型或细胞器)。当n≥2，[PSP]_n可以包括相同或不同的PSP区段。当o≥2，[EP]_o可以包括相同或不同的EP。当[EP]_o包括不同的EP，例如，至少一个EP可以是RNA-TP区段，至少一个可以是O-RS区段。

本发明的融合蛋白提供一种正交翻译(OT)系统，其中将一种或多种ncAA残基引入POI中所需的一个或多个O-RS(区段)与至少一个靶向RNA的多肽(RNA-TP)区段在空间上接近。POI的mRNA包含至少一种靶向核苷酸序列(TN)，其能够与OT系统的融合蛋白中的至少一种的RNA-TP区段相互作用。所述的相互作用有利地是特异性相互作用。本发明的融合蛋白的RNA-TP区段优选是靶向mRNA的多肽区段。有利地选择融合蛋白的RNA-TP区段和POI mRNA的TN以便其特异性地相互作用(结合)。适用于此目的的RNA-TP区段和TN对可以选自RNA病毒的外壳蛋白和所述外壳蛋白结合的核酸基序。这类病毒外壳蛋白和蛋白结合的RNA基序是本领域已知的。

合适的RNA-TP的具体实例包括但不限于：

-MCP(肠杆菌噬菌体MS2的外壳蛋白)，特别是包含SEQ ID NO:14的氨基酸序列的多肽；

-λ_N22(λ噬菌体抗终止子蛋白N的22个氨基酸的RNA结合结构域)，特别是包含SEQID NO:16的氨基酸序列的多肽；

-PCP(细菌噬菌体PP7的外壳蛋白，Wu B,Chao JA,Singer RH.Fluorescencefluctuation spectroscopy enables quantitative imaging of single mRNAs inliving cells.Biophys J.2012；102(12):2936–2944.doi:10.1016/j.bpj.2012.05.017)，特别是包含SEQ ID NO:306的氨基酸序列的多肽；

合适的TN的具体实例包括但不限于：

-肠杆菌噬菌体MS2 RNA茎环，特别是具有对应于SEQ ID NO:17的核苷酸(DNA)序列(由SEQ ID NO:17的核苷酸(DNA)序列编码)的RNA序列的多核苷酸；

-BoxB(λ噬菌体RNA茎环，λ_N22的特异性结合位点)，特别是具有对应于SEQ ID NO:18的核苷酸(DNA)序列(由SEQ ID NO:18的核苷酸(DNA)序列编码)的RNA序列的多核苷酸；

-细菌噬菌体pp7 RNA茎环(Wu B,Chao JA,Singer RH.Fluorescencefluctuation spectroscopy enables quantitative imaging of single mRNAs inliving cells.Biophys J.2012；102(12):2936–2944.doi:10.1016/j.bpj.2012.05.017)，特别是具有对应于SEQ ID NO:289或SEQ ID NO:290的核苷酸(DNA)序列(由SEQ ID NO:289或SEQ ID NO:290的核苷酸(DNA)序列编码)的RNA序列的多核苷酸；

以及它们的功能片段和突变体。所述功能片段和突变体可以包含与其来源的多核苷酸序列至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％相同的核苷酸序列。

这类TN可用作单拷贝区段或者用作包含多于一个，例如两个、三个、四个、五个、六个或多个TN的重复单元的多拷贝区段。

MCP与MS2 RNA茎环特异性地相互作用。因此，当融合蛋白的RNA-TP区段包含(由其组成)源自MCP的区段，并作为MCP发挥作用时，POI的mRNA适宜地包含一个或多个MS2 RNA茎环，如两个、三个、四个、五个或六个MS2 RNA茎环。λ_N22与BoxB特异性地相互作用。因此，当融合蛋白的RNA-TP区段包含(由其组成)源自λ_N22的区段，并作为λ_N22发挥作用时，POI的mRNA适宜地包含一个或多个BoxB基序，如一个、两个、三个、四个、五个或六个或更多个BoxB基序。PCP与pp7 RNA茎环特异性地相互作用。因此，当融合蛋白的RNA-TP区段包含(由其组成)源自PCP的区段，并作为PCP发挥作用时，POI的mRNA适宜地包含一个或多个pp7 RNA茎环，如两个、三个、四个、五个或六个或更多个pp7 RNA茎环。

已有几种RS用于遗传密码子扩展，包括詹氏甲烷球菌(Methanococcusjannaschii)酪氨酰-tRNA合成酶，大肠杆菌酪氨酰-tRNA合成酶，大肠杆菌亮氨酰-tRNA合成酶，来自某些甲烷八叠球菌(如马氏甲烷八叠球菌(M.mazei)、巴氏甲烷八叠球菌(M.barkeri)、乙酸甲烷八叠球菌(M.acetivorans)、嗜热甲烷八叠球菌(M.thermophila)、甲烷球菌(布氏拟甲烷球菌(M.burtonii))或脱硫杆菌(D.hafniense)的吡咯赖氨酰-tRNA合成酶。相应的正交RS/tRNA对已用于对多肽的各种功能进行遗传编码(Chin,Annu RevBiochem 2014,83:379-408；Chin et al.,J Am Chem Soc 2001,124:9026；Chin et al.,Science2003,301:964；Nguyen et al.,J Am Chem Soc 2009,131:8720；Yanagisawa etal.,Chem Biol 2008,15:1187)。取决于翻译POI所用的细胞，这些RS可用作本发明的O-RS。

可用于本发明的方法和融合蛋白的吡咯赖氨酰-tRNA合成酶(PylRS)可以是野生型或基因工程化的PylRS。野生型PylRS的实例包括但不限于来自古细菌和真细菌的PylRS，例如马氏甲烷八叠球菌(Methanosarcina maize)、巴氏甲烷八叠球菌(Methanosarcinabarkeri)、布氏拟甲烷球菌(Methanococcoides burtonii)、乙酸甲烷八叠球菌(Methanosarcina acetivorans)、嗜热甲烷八叠球菌(Methanosarcina thermophila)和Desulfitobacterium hafniense。例如，Neumann等人(Nat Chem Biol2008,4:232)，Yanagisawa等人(Chem Biol 2008,15:1187)和EP2192185A1已经描述基因工程化的PylRS。通过修饰PylRS的氨基酸序列使其不导向细胞核，可以提高使用PylRS进行遗传密码子扩展的效率。为此，核定位信号(NLS)可以从PylRS中删除，也可以通过引入合适的核输出信号(NES)进行掩盖。本发明的融合蛋白和方法中使用的PylRS可以是缺少NLS和/或包含NES的PylRS，如WO 2018/069481中所述。

因此，可用于本发明的融合蛋白的O-RS区段的实例包括但不限于：

-詹氏甲烷球菌酪氨酰-tRNA合成酶；

-大肠杆菌酪氨酰-tRNA合成酶；

-大肠杆菌亮氨酰-tRNA合成酶；

-马氏甲烷八叠球菌(Methanosarcina mazei)吡咯赖氨酰-tRNA合成酶；

-巴氏甲烷八叠球菌吡咯赖氨酰-tRNA合成酶；

-乙酸甲烷八叠球菌吡咯赖氨酰-tRNA合成酶；

-嗜热甲烷八叠球菌吡咯赖氨酰-tRNA合成酶；

-布氏拟甲烷球菌吡咯赖氨酰-tRNA合成酶；

-Desulfitobacterium hafniense吡咯赖氨酰-tRNA合成酶；

以及这些多肽的功能(即酶活性)片段和突变体。所述功能片段和突变体可以包含与其来源的氨酰tRNA合成酶至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％相同的氨基酸序列。

源自马氏甲烷八叠球菌吡咯赖氨酰-tRNA合成酶的用于本发明的O-RS区段的具体实例包括但不限于：

-源自PylRS^AF(马氏甲烷八叠球菌吡咯赖氨酰tRNA合成酶双突变体：Y306A、Y384F；Uniprot：Q8PWY1)的O-RS区段，例如包含SEQ ID NO:8的氨基酸序列的O-RS区段；

-源自PylRS^AA(马氏甲烷八叠球菌吡咯赖氨酰tRNA合成酶双突变体：N346A、C348A；Uniprot：Q8PWY1)的O-RS区段，例如包含SEQ ID NO:10的氨基酸序列的O-RS区段；

-源自PylRS^AAAF(马氏甲烷八叠球菌吡咯赖氨酰tRNA合成酶四重突变体：Y306A、N346A、C348A、Y384F；Uniprot：Q8PWY1)的O-RS区段，例如包含SEQ ID NO:12的氨基酸序列的O-RS区段；

-源自IFRS1(马氏甲烷八叠球菌吡咯赖氨酰tRNA突变体(L305M、Y306L、L309S、N346S、C348M))的O-RS区段，例如包含SEQ ID NO:224的氨基酸序列的O-RS区段

-源自CbzRS(马氏甲烷八叠球菌吡咯赖氨酰tRNA突变体(Y306M、L309G、C348T))的O-RS区段，例如包含SEQ ID NO:226的氨基酸序列的O-RS区段；

-源自CpkRS(马氏甲烷八叠球菌吡咯赖氨酰tRNA突变体(A302S))的O-RS区段，例如包含SEQ ID NO:228的氨基酸序列的O-RS区段；

-源自OMeRS(马氏甲烷八叠球菌吡咯赖氨酰tRNA突变体(A302T、Y384F、N346V、C348W、V401L))的O-RS区段，例如包含SEQ ID NO:236的氨基酸序列的O-RS区段；

以及这些多肽区段的功能(即酶活性)片段和突变体。所述功能片段和突变体可以包含与其来源的氨酰tRNA合成酶至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％相同的氨基酸序列。

根据具体实施方案，本文所述的野生型和突变体马氏甲烷八叠球菌(M.mazei)PylRS用于将tRNA用ncAA氨酰化，如WO2012/104422或WO2015/107064所述。用于这个目的的示例性ncAA包括但不限于2-氨基-6-(环辛-2-炔-1-基氧基羰基氨基)己酸(SCO)、2-氨基-6-(环辛-2-炔-1-基氧基乙氧基羰基氨基)己酸、2-氨基-6[(4E-环辛-4-烯-1-基)氧基羰基氨基]己酸(TCO)、2-氨基-6[(2E-环辛-2-烯-1-基)氧基羰基氨基]己酸(TCO*)、2-氨基-6-(丙-2-炔氧基羰基氨基)己酸(PrK)和2-氨基-6-(9-生物环[6.1.0]非-4-炔基甲氧基羰基氨基)己酸(BCN)。

在本发明的另一实施方案中，上述AP(IC-TP和PSP)区段和/或上述EP(RNA-TP和O-RS)区段相互独立，可以进一步与天然的或者，尤其是，合成的蛋白区段结合，其诱导和控制大分子的相互作用。特别地，这类进一步的蛋白区段可操作地融合到本发明的AFP的多肽链中。一个或多个，如2、3、4、5、6、7、8、9或10个，然而优选一个这样的蛋白区段可操作地融合到本发明的单个AFP中。融合到AFP多肽链中应当使得其他多肽区段(AP和EP)的活性基本不受影响，特别是不被抑制(即AP和EP保持可操作)，同时保留其他多肽区段诱导和控制大分子相互作用的能力。文献中描述的是所谓的SYNZIP肽，其形成多聚体结构。本发明的上下文中特别感兴趣的是具有形成特定异二聚体卷曲螺旋蛋白结构能力的SYNZIP。这类SYNZIP是成对的人工合成肽，能够相互作用，用于诱导和控制大分子相互作用。非限制性示例是成对的SYNZIP 1:2；SYNZIP 3:4和SYNZIP 5:6。根据本发明特别优选的是如Reinke,A.W.,Grant,R.A.,Keating,A.E.(2010)J Am Chem Soc 132 6025-6031所述的异源特异性卷曲螺旋对SYNZIP2:SYNZIP1(SYNZIP 1:SEQ ID NO:312；SYNZIP 2:SEQ ID NO:314；SYNZIP 3:SEQ ID NO:316；SYNZIP 4:SEQ ID NO:318，以及这些SYNZIP多肽的功能片段和突变体。所述功能片段和突变体可以包含与其来源的多肽的氨基酸至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％相同的氨基酸序列)。由于需要成对使用以诱导大分子相互作用，在本文所述的AFP组合中，这些SYNZIP优选成对使用。通过整合在不同AFP融合蛋白中的这类SYNZIP对的相互作用，可进一步支持根据本发明的OT细胞器的形成。

在本发明的另一实施方案中，本发明的融合蛋白可通过引入(融合)至少一个所谓的“表位标签”，即充当抗体结合位点的短寡肽序列来进一步修饰，可用于检测/定量表达的本发明的融合产物。这类标签的非限制性实例如下：

VSV-G：水泡性口炎病毒糖蛋白表位标签(SEQ ID NO:680)

HA：人流感病毒血凝素表位标签(SEQ ID NO:682)

Myc：人c-Myc原癌基因表位标签(SEQ ID NO:684)

1.2本发明的AFP构建体的具体实例

每个单独示例的构建体可以以N->C或C->N方向理解。所绘制的方案是在N->C方向上给出的。

在区段块[IC-TP]_m、[PSP]_n、[O-RS]_y和[RNA-TP]_x的情况下，其中m、n、y或x是>1的整数，这类块中的重复区段可以相同或不同，优选相同。

其中所应用的区段[IC-TP]、[PSP]、[O-RS]、[RNA-TP]_x和[SYNZIP]可以从上文第1.1节中描述的区段的各个实例制备。

1.2.1.靶向细胞内结构的单功能AFP

1.2.1.1靶向细胞内结构的单功能AFP(即包含一种类型的EP)

其中个别优选的实例有：

[IC-TP]_m-[O-RS]_y，其中m＝1或2，优选1；y＝1或2，优选1；

[IC-TP]_m-[RNA-TP]_x，其中m＝1或2，优选1；x＝1、2、3、4、5或6，优选2、3或4；

[IC-TP]_m-[PSP]_n-[O-RS]_y，其中m＝1或2，优选1；n＝1、2或3，优选1或2；y＝1或2，优选1；

[IC-TP]_m-[PSP]_n-[RNA-TP]_x，其中m＝1或2，优选1；n＝1、2或3，优选1或2；x＝1、2、3、4、5或6，优选2、3或4；

[IC-TP]_m-[O-RS₁]_y-[PSP]_n-[O-RS₂]_y，其中m＝1或2，优选1；n＝1、2或3，优选1或2；y相互独立地＝1或2，优选1；并且O-RS₁和O-RS₂相同或不同，优选相同；

[IC-TP]_m-[PSP₁]_n-[O-RS]_y-[PSP₂]_n，其中m＝1或2，优选1；n相互独立地为1、2或3，优选1或2；y相互独立地＝1或2，优选1；并且PSP₁和PSP₂相同或不同；

[IC-TP]_m-[RNA-TP1]_x-[PSP]_n-[RNA-TP2]_x，其中m＝1或2，优选1；n＝1、2或3，优选1或2；x相互独立地＝1、2、3、4、5或6，优选2、3或4；并且RNA-TP₁和RNA-TP₂相同或不同，优选相同；

[IC-TP]_m-[PSP₁]_n-[O-RS₁]_y-[PSP₂]_n-[O-RS₂]_y，其中m＝1或2，优选1；n相互独立地为1、2或3，优选1或2；y相互独立地＝1或2，优选1；O-RS₁和O-RS₂相同或不同，优选相同；并且PSP₁和PSP₂相同或不同；

[IC-TP]_m-[PSP₁]_n-[RNA-TP₁]_x-[PSP₂]_n-[RNA-TP₂]_x，其中m＝1或2，优选1；n相互独立地＝1、2或3，优选1或2；x相互独立地＝1、2、3、4、5或6，优选2、3或4；RNA-TP₁和RNA-TP₂相同或不同；并且PSP₁和PSP₂相同或不同。

1.2.1.2靶向细胞内结构的双功能AFP(包含两种类型的EP)

其中个别优选的实例有：

[IC-TP]_m-[O-RS]_y-[RNA-TP]_x，其中m＝1或2，优选1；x＝1、2、3、4、5或6，优选2、3或4；y＝1或2，优选1；

[IC-TP]_m-[RNA-TP]_x-[O-RS]_y，其中m＝1或2，优选1；x＝1、2、3、4、5或6，优选2、3或4；y＝1或2，优选1；

[IC-TP]_m-[PSP]_n-[O-RS]_y-[RNA-TP]_x，其中m＝1或2，优选1；n＝1、2或3，优选1或2；x＝1、2、3、4、5或6，优选2、3或4；y＝1或2，优选1；

[IC-TP]_m-[PSP]_n-[RNA-TP]_x-[O-RS]_y，其中m＝1或2，优选1；n＝1、2或3，优选1或2；x＝1、2、3、4、5或6，优选2、3或4；y＝1或2，优选1；

[IC-TP]_m-[O-RS]_y-[PSP]_n-[RNA-TP]_x，其中m＝1或2，优选1；n＝1、2或3，优选1或2；x＝1、2、3、4、5或6，优选2、3或4；y＝1或2，优选1；

[IC-TP]_m-[RNA-TP]_x-[PSP]_n-[O-RS]_y，其中m＝1或2，优选1；n＝1、2或3，优选1或2；x＝1、2、3、4、5或6，优选2、3或4；y＝1或2，优选1；

[IC-TP]_m-[PSP₁]_n-[O-RS]_y-[PSP₂]_n-[RNA-TP]_x，其中m＝1或2，优选1；n每个独立，n＝1、2或3，优选1或2；x＝1、2、3、4、5或6，优选2、3或4；y＝1或2，优选1；并且PSP₁和PSP₂相同或不同；

[IC-TP]_m-[PSP₁]_n-[RNA-TP]_x-[O-RS₁]_y-[PSP₂]_n-[O-RS₂]_y，其中m＝1或2，优选1；每个独立的n＝1、2或3，优选1或2；x＝1、2、3、4、5或6，优选2、3或4；y相互独立地＝1或2，优选1；并且PSP₁和PSP₂相同或不同；O-RS₁和O-RS₂相同或不同，优选相同；

[IC-TP]_m-[PSP₁]_n-[O-RS₁]_y-[PSP₂]_n-[O-RS₂]_y-[RNA-TP]_x，其中m＝1或2，优选1；每个独立的n＝1、2或3，优选1或2；x＝1、2、3、4、5或6，优选2、3或4；y相互独立地＝1或2，优选1；并且PSP₁和PSP₂相同或不同；O-RS₁和O-RS₂相同或不同，优选相同。

1.2.2.不靶向细胞内结构的单功能AFP

这些是与上文第1.2.1节中所列相同的AFP，唯一例外的是区段[IC-TP]缺失，而区段[PSP]保留。

1.2.3.SYNZIP变体

这些是与上文第1.2.1和1.2.2节中所列相同的AFP，唯一例外的是区段[IC-TP]、[PSP]、[O-RS₂]或[RNA-TP]中的至少一个在N-或C-末端补充有SYNZIP元件。AFP可以包含1、2、3、4或5个，优选1或2个，相同或不同，优选相同的SYNZIP。这类分子的非限制性实例有：

1.2.3.1单功能SYNZIP AFP

其中个别优选的实例有：

[PSP]_n-[SYNZIP]-[O-RS]_y，y＝1或2，优选1；n＝1、2或3，优选1或2；

[PSP]_n-[SYNZIP]-[RNA-TP]_x，x＝1、2、3、4、5或6，优选2、3或4；n＝1、2或3，优选1或2；

[IC-TP]_m-[SYNZIP]-[O-RS]_y，其中m＝1或2，优选1；y＝1或2，优选1；

[IC-TP]_m-[SYNZIP]-[RNA-TP]_x，其中m＝1或2，优选1；x＝1、2、3、4、5或6，优选2、3或4；

[IC-TP]_m-[PSP]_n-[SYNZIP]-[O-RS]_y，其中m＝1或2，优选1；n＝1、2或3，优选1或2；y＝1或2，优选1；

[IC-TP]_m-[PSP]_n-[SYNZIP]-[RNA-TP]_x，其中m＝1或2，优选1；n＝1、2或3，优选1或2；x＝1、2、3、4、5或6，优选2、3或4。

1.2.3.2双功能SYNZIP AFP

其中个别优选的实例有：

[IC-TP]_m-[O-RS]_y-[SYNZIP]-[RNA-TP]_x，其中m＝1或2，优选1；x＝1、2、3、4、5或6，优选2、3或4；y＝1或2，优选1；

[IC-TP]_m-[RNA-TP]_x-[SYNZIP]-[O-RS]_y，其中m＝1或2，优选1；x＝1、2、3、4、5或6，优选2、3或4；y＝1或2，优选1；

[IC-TP]_m-[PSP]_n-[SYNZIP]-[O-RS]_y-[RNA-TP]_x，其中m＝1或2，优选1；n＝1、2或3，优选1或2；x＝1、2、3、4、5或6，优选2、3或4；y＝1或2，优选1；

[IC-TP]_m-[PSP]_n-[SYNZIP]-[RNA-TP]_x-[O-RS]_y，其中m＝1或2，优选1；n＝1、2或3，优选1或2；x＝1、2、3、4、5或6，优选2、3或4；y＝1或2，优选1；

[IC-TP]_m-[PSP]_n-[SYNZIP_a]-[O-RS]_y-[SYNZIP_b]-[RNA-TP]_x，其中m＝1或2，优选1；n＝1、2或3，优选1或2；x＝1、2、3、4、5或6，优选2、3或4；y＝1或2，优选1；并且SYNZIP_a和SYNZIP_b相同或不同，优选相同；

[IC-TP]_m-[PSP]_n-[SYNZIP_a]-[RNA-TP]_x-[SYNZIP_b]-[O-RS]_y，其中m＝1或2，优选1；n＝1、2或3，优选1或2；x＝1、2、3、4、5或6，优选2、3或4；y＝1或2，优选1；并且SYNZIP_a和SYNZIP_b相同或不同，优选相同；

[IC-TP]_m-[PSP₁]_n-[SYNZIP]-[RNA-TP]_x-[O-RS₁]_y-[PSP₂]_n-[O-RS₂]_y，其中m＝1或2，优选1；n＝1、2或3，优选1或2；x＝1、2、3、4、5或6，优选2、3或4；y＝1或2，优选1；并且PSP₁和PSP₂相同或不同；O-RS₁和O-RS₂相同或不同，优选相同。

1.2.4.单功能融合蛋白

其个别优选的实例有：

[SYNZIP]-[O-RS]_y，其中y＝1或2，优选1；

[SYNZIP]-[RNA-TP]_x，其中x＝1、2、3、4、5或6，优选2、3或4；

由于此处IC-TP和PSP缺失，这些可优选地与包含至少一个C-TP和/或PSP区段的AFP分子组合使用。

1.3单个融合蛋白的实例

本发明的融合蛋白的非常具体的实例及其特定组合列于下表1、2和3中。这个表1、2和3的内容也构成说明书一般公开的一部分，其内容在一般方面不做明确和字面重复。表1和表2中标明为“包含O-RS和RNA-TP区段的融合蛋白”的相应列披露应被视为独立于表1和表2中涉及具体报告和宿主细胞系的其他列内容披露。

2.功能片段和突变体

本文所述的是特定RNA-TP、O-RS、IC-TP、PSP、TN以及SYNZIP的片段和突变体，其具有功能性(即分别具有亲本RNA-TP的RNA结合活性、亲本IC-TP的靶向细胞内结构的活性、亲本PSP的自组装活性、亲本TN对RNA-TP的结合活性、亲本O-RS的酶活性或亲本SYNZIP的异二聚体卷曲螺旋形成能力)。这类片段和突变体可用本文所述的最小程度的序列相同性进行表征。所述氨基酸或核苷酸序列相同性分别指所表征的氨基酸或核苷酸序列在整个长度上的相同性。百分比相同性值可根据本领域已知的BLAST比对、blastp算法(蛋白-蛋白BLAST)，或使用Clustal方法(Higgins et al.,Comput Appl.Biosci.1989,5(2):151-1)进行确定。

本发明可用的特定RNA-TP、O-RS、IC-TP、SYNZIP或PSP的片段和突变体保留亲本多肽的相关功能(分别为结合、自组装或酶活性)，并且可以例如通过本领域已知的保守氨基酸取代获得，即用具有相似生化特性(例如电荷、疏水性和大小)的不同氨基酸残基置换氨基酸残基。典型的实例是用Ile取代Leu或反之，用Glu取代Asp或反之，用Gln替换Asn或反之，等等。

3.正交翻译、tRNA和POI编码序列

术语“翻译系统”通常是指将天然存在的氨基酸加入正在生长的多肽链(蛋白)中所必需的一组组件。翻译系统的组件可以包括，例如，核糖体、tRNA、氨酰tRNA合成酶、mRNA等等。氨酰tRNA合成酶(RS)是能够用氨基酸或氨基酸类似物氨酰化tRNA的酶。本发明的过程中使用的RS能够用相应的ncAA氨酰化tRNA，即氨酰化tRNA^ncAA。如本文所用的术语“正交”是指翻译系统的元件(例如，正交tRNA(O-tRNA)和/或正交氨酰tRNA合成酶(O-RS))，其由感兴趣的翻译系统(例如，细胞)以降低的效率使用。“正交”是指O-tRNA或O-RS不能或者以降低的效率，如，20％以下的效率、10％以下的效率、5％以下的效率，或者例如，1％以下的效率分别与感兴趣的翻译系统的内源性RS或内源性tRNA一起发挥作用。例如，与内源性tRNA通过内源性RS氨酰化相比，感兴趣的翻译系统中的O-tRNA以降低的甚至为零的效率通过翻译系统的任何内源性RA氨酰化。在另一实例中，与内源性RS氨酰化内源性tRNA相比，O-RS以降低的甚至为零的效率氨酰化感兴趣的翻译系统中的任何内源性tRNA。具体地，术语“正交翻译系统”或“OT系统”在本文中用来指使用O-RS/O-tRNA^ncAA对的翻译系统，其允许将ncAA残基引入生长的多肽链中。

本发明中使用的O-RS/O-tRNA^ncAA对优选具有以下特性：O-tRNA^ncAA优先通过O-RS用ncAA进行氨酰化。此外，正交对在感兴趣的翻译系统(例如细胞)中发挥作用，因此O-tRNA^ncAA用于将ncAA残基掺入生长的POI多肽链中。掺入以位点特异性方式进行。具体地，O-tRNA^ncAA识别编码POI的mRNA中的选择密码子(例如，琥珀、赭石或乳白终止密码子)。

术语“优选氨酰化”是指O-RS用非天然氨基酸氨酰化O-tRNA，与感兴趣的翻译系统(例如细胞)的内源性tRNA或氨基酸相比，其效率为，例如约50％有效、约70％有效、约75％有效、约85％有效、约90％有效、约95％有效，或约99％或更高的效率。然后将非天然氨基酸以高保真度掺入生长的多肽链中，例如，对于给定选择密码子其效率大于约75％，对于给定选择密码子其效率大于约80％，对于给定选择密码子其效率大于约90％，对于给定选择密码子其效率大于约95％，或对于给定选择密码子其效率大于约99％或更高。

可用于通过本发明的融合蛋白氨酰化的tRNA包含至少一个源自马氏甲烷八叠球菌吡咯赖氨酰tRNA合成酶的O-RS区段，所述tRNA包括但不限于马氏甲烷八叠球菌的吡咯赖氨酰tRNA及其功能突变体，其中反密码子是选择密码子的反密码子，例如琥珀终止密码子TAG的CUA反密码子、乳白终止密码子TGA的反密码子UCA和赭石终止密码子TAA的反密码子UUA。这类吡咯赖氨酰tRNA的实例包括但不限于由核苷酸序列SEQ ID NO:4(tRNA^Pyl,CUA)、SEQ ID NO:5(tRNA^Pyl,UCA)或SEQ ID NO:6(tRNA^Pyl,UUA)编码的那些。其他合适的tRNA的非限制性实例有以下源自马氏甲烷八叠球菌的吡咯赖氨酰tRNA的tRNA：

tRNA^pyl，CGA吡咯赖氨酰tRNA(用于丝氨酸密码子)，SEQ ID NO:229

tRNA^pyl，CGG吡咯赖氨酰tRNA(用于脯氨酸密码子)，SEQ ID NO:230

tRNA^pyl，UAA吡咯赖氨酰tRNA(用于亮氨酸密码子)，SEQ ID NO:231

tRNA^pyl，UAG吡咯赖氨酰tRNA(用于亮氨酸密码子)，SEQ ID NO:232

tRNA^pyl，CCG吡咯赖氨酰tRNA(用于精氨酸密码子)，SEQ ID NO:233

tRNA^pyl，AUA吡咯赖氨酰tRNA(用于异亮氨酸密码子)，SEQ ID NO:234

如本文所用的术语“选择密码子”是指在翻译过程中被O-tRNA^ncAA识别(即结合)的密码子。该术语还用于不是信使RNA(mRNA)的多核苷酸(例如DNA质粒)的多肽编码序列中的相应密码子。本文描述的新OT系统允许以与细胞的细胞质中存在的其他mRNA相比对所述POI的mRNA具有选择性的方式进行POI的正交翻译。然而，优选选择密码子是所选择用于表达的细胞中的低丰度密码子，例如天然存在的真核细胞中的低丰度密码子。新OT系统使POI的mRNA、O-RS和tRNA^ncAA相互靠近，从而支持在POI的选择密码子编码的氨基酸位置引入ncAA(而不是引入可能与选择密码子结合的不同tRNA的氨基酸)。因此，所述选择密码子可以是有义密码子。然而，在优选的实施例中，选择密码子是不被用于制备POI的细胞的内源性tRNA识别的密码子。

O-tRNA^ncAA的反密码子与mRNA(POI的mRNA)内的选择密码子结合，从而将ncAA位点特异性地掺入由所述mRNA编码的生长多肽链(POI)中。可用于本文所述新OT系统的选择密码子的实例包括但不限于：

-无义密码子，如终止密码子，例如，琥珀(UAG)、赭石(UAA)和乳白(UGA)密码子；

-由三个以上碱基组成的密码子(例如，四碱基密码子)；

-源自天然或非天然碱基对的密码子；和

-有义密码子。

当使用的选择密码子是有义密码子(即，天然的三碱基密码子)时，优选根据本发明的方法用于POI表达的细胞内源翻译系统不(或几乎不)使用所述天然三碱基密码子，例如，其中识别天然三碱基密码子的tRNA缺乏或丰度减少的细胞，或者其中天然三碱基密码子是稀有密码子的细胞。特别优选使用一种或多种终止密码子，例如琥珀、赭石和乳白中的一种或多种作为本发明的选择密码子。

可将多个选择密码子引入编码所需多肽(靶多肽，POI)的多核苷酸，例如，一个或多个、两个或更多个、超过三个等选择密码子。一个POI可携带两个或更多个ncAA残基。所述ncAA残基可以相同并且由相同类型的选择密码子编码，或者可以不同并且由不同的选择密码子编码。

反密码子具有相应密码子的反向互补序列。

抑制子tRNA是一种改变给定翻译系统(例如，细胞)中信使RNA(mRNA)阅读的tRNA(如O-tRNA^ncAA)。抑制子tRNA可以通读，例如，终止密码子、四碱基密码子或稀有密码子。

如本文所述，O-tRNA优先通过O-RS(而不是内源性合成酶)氨酰化并且能够解码选择密码子。O-RS识别O-tRNA，例如，具有扩展的反密码子环，并且优先用ncAA氨酰化O-tRNA。

本发明的方法和/或融合蛋白中使用的O-tRNA和O-RS可以是天然存在的，或者可以从各种生物体通过天然存在的tRNA和/或RS的突变衍生。在各种实施方案中，tRNA和RS源自至少一种生物体。在另一实施方案中，tRNA从第一种生物体由天然存在的tRNA或突变的天然存在的tRNA衍生，而RS从第二种生物体由天然存在的RS或突变的天然存在的RS衍生。

合适的(正交)tRNA/RS对可选自突变tRNA和RS文库，例如，基于文库筛选的结果。或者，合适的tRNA/RS对可以是异源tRNA/合成酶对，其从来源物种导入翻译系统。优选地，用作翻译系统的细胞不同于所述来源物种。用于进化tRNA/RS对的方法在例如WO 02/085923和WO 02/06075中有所描述。

常规的定点诱变可用于将选择密码子引入POI的编码序列中。

4.核酸分子

本发明还涉及核酸分子(单链或双链DNA和RNA序列，例如cDNA、mRNA)，或这类核酸分子的组合，其包含编码至少一种本发明的融合蛋白的核苷酸序列，和/或与其互补的核苷酸序列。

此外，本发明涉及核酸分子(单链或双链DNA和RNA序列，例如cDNA、mRNA)，或这类核酸分子的组合，其包含(i)核苷酸序列(CS^POI)，其编码至少一种POI，所述POI包含一种或多种ncAA残基，所述ncAA残基在CS^POI中由选择密码子编码；和(ii)如本文所述的靶向核苷酸序列(TN)，其中包含所述TN(的RNA形式)的RNA分子能够通过所述TN与靶向RNA的多肽(RNA-TP)相互作用。

本发明的核酸分子还可以包含编码基因区的3'-和/或5'-末端的非翻译序列。TN优选位于编码POI的核酸分子的3'末端。例如，本发明的编码POI的核酸分子可以通过使用本领域已知的常用克隆技术在3'非翻译区(特别是3')处引入至少一个TN来制备。

本发明的核酸分子还可以包含编码基因区的3'-和/或5'-末端的非翻译序列。

本发明进一步涉及，特别是重组体、表达构建体或表达盒，其包含在调控核酸序列的遗传控制下的如本文所述的本发明的核酸分子或核酸分子组合的核酸序列。因此本发明的表达盒包含编码至少一种POI(加TN)或至少一种本发明的融合蛋白的核酸序列，和/或与其互补的核酸序列。本发明还涉及，特别是重组体、载体，其包含这些表达构建体(表达载体)中的至少一种。

表达盒通常包含位于编码待表达POI或融合蛋白的核酸序列5'(上游)并与其功能性连接的启动子序列、所述编码序列的终止子序列3'(下游)和任选存在的其他调控元件。这类其他调控元件的实例包括但不限于靶向序列、增强子、聚腺苷酸化信号、选择标记、扩增信号、复制起点等。合适的调控序列描述于例如Goeddel,Gene Expression Technology:Methods in Enzymology 185,Academic Press,San Diego,CA(1990)。

除了这些调控序列外，这些序列的天然调控仍可在实际结构基因之前存在，并任选地可在遗传上改变，从而天然调控被关闭且基因表达增加。然而，核酸构建体也可以是更为简单的构建体，即在编码序列之前没有插入额外的调控信号，并且天然启动子及其调控没有被去除。相反，天然调控序列发生突变，从而不再发生调控，基因表达增加。

核酸分子的元件的“功能性”连接，如启动子、多肽编码序列、终止子、调节子，表示排列这些元件，使得可以转录编码序列并且任选的调节元件可对所述转录进行调节。这可通过同一个核酸分子中的元件直接连接来实现。然而，这种直接连接不是必须的。基因控制序列，例如增强子序列，甚至可以从更远的位置或甚至其他DNA分子对靶序列发挥作用。待转录的核酸序列位于启动子序列下游(即在其3'-末端)的排列是优选的，从而使两个序列共价连接在一起。启动子序列与待表达的核酸序列之间的距离可以小于200个碱基对，或小于100个碱基对或小于50个碱基对。

为了在细胞中表达，将表达盒有利地插入表达载体中。根据用于表达的细胞来选择表达载体，这使得编码核苷酸序列在细胞中的最佳表达成为可能。载体是本领域技术人员熟知的并且在例如“Cloning vectors”(Pouwels P.H.et al.，Ed.，Elsevier，Amsterdam-New York-Oxford，1985)中给出。表达载体的实例包括但不限于质粒、病毒载体(噬菌体)，例如SV40、CMV、杆状病毒和腺病毒、转座子、IS元件、质粒、粘粒以及线性或环状DNA。参见，例如，“Cloning vectors”一书(Eds.Pouwels P.H.et al.Elsevier，Amsterdam-New York-Oxford，1985，ISBN 0 444 904018)。这些载体可以在(宿主)细胞中自主复制，或者可以在染色体上复制。包含至少一个本发明的表达盒的表达载体代表本发明的另一方面。

为了在根据本发明的细胞中表达POI，例如，可以将编码POI的核酸分子(例如本发明的表达载体)引入细胞中。或者，可以修饰细胞的现有基因，以便在POI意图携带上ncAA残基的那些氨基酸位置包含选择密码子。用于将编码(重组)多肽的核酸分子引入细胞或修饰细胞的现有基因的方法是本领域已知的。

在本发明上下文中，术语“表达”描述细胞中由相应核酸序列编码的多肽的产生。术语“表达”也用于细胞中由核酸序列编码的tRNA分子的产生。

本发明的核酸分子，包括本发明的表达盒和表达载体，可以使用本领域已知的常用克隆技术来制备。使用常用重组和克隆技术，例如T.Maniatis,E.F.Fritsch andJ.Sambrook,Molecular Cloning:A Laboratory Manual,Cold Spring HarborLaboratory,Cold Spring Harbor,NY(1989)和T.J.Sihavy，M.L.Berman andL.W.Enquist，Experiments with Gene Fusions，Cold Spring Harbor Laboratory,ColdSpring Harbor,NY(1989)和Ausubel，F.M.et al.，Current Protocols in MolecularBiology，Greene Publishing Assoc.and Wiley Interscience(1987)所述。

本发明的核酸分子或核酸分子的组合，包括本发明的表达盒和表达载体，可以通过例如本领域已知的方法分离。

“分离的”核酸分子是从核酸的天然来源中存在的其他核酸分子分离的，而且当它通过重组技术产生时，可基本上不含其他细胞材料或培养基，或者当它是化学合成时，可不含化学前体或其他化学品。

根据本发明的核酸分子可通过分子生物学的标准技术和本发明所提供的序列信息来分离。例如，cDNA可从合适的cDNA库中分离，使用具体公开的完整序列之一或其区段作为杂交探针以及标准杂交技术(例如Sambrook,J.,Fritsch,EF and Maniatis，T.Molecular Cloning：A Laboratory Manual.2nd edition,Cold Spring HarborLaboratory,Cold Spring Harbor,NY,1989所述)。此外，包含公开序列之一或其区段的核酸分子，可使用基于这个序列构建的寡核苷酸引物通过聚合酶链式反应分离。可以将由此扩增的核酸克隆到合适的载体中并可通过DNA序列分析来表征。此外，根据本发明的寡核苷酸可通过标准的合成方法来生产，例如用自动DNA合成仪。

5.ncAA和翻译后POI修饰

缩写“ncAA”通常是指任何非典型或非天然氨基酸，或者氨基酸残基，其不属于22种天然存在的蛋白原氨基酸。许多ncAA是本领域公知的(参见，例如，Liu et al.,Annu RevBiochem 2010,79:413-444；Lemke,ChemBioChem 2014,15:1691-1694)。术语“ncAA”也指氨基酸衍生物，例如α-羟基酸(而不是α-氨基酸)。这类衍生物也已被证明是可翻译掺入的。参见，例如，Ohta et al.,2008,ChemBioChem 9:2773-2778。因此，本文使用的术语如“氨酰化(aminoacylate)”或“氨酰化(aminoacylation)”的含义不限于tRNA和α-氨基酸的RS催化连接，还包括tRNA和ncAA衍生物如α-羟基酸的RS催化连接。

用于本发明的特别优选的ncAA是可在翻译后进一步修饰的那些，例如使用点击化学反应。这类点击反应包括应变促进的逆电子需求Diels-Alder环加成(SPIEDAC；参见，例如，Devaraj et al.,Angew Chem Int Ed Engl 2009,48:7013)以及应变环炔基之间的环加成，或者具有一个或多个未被氨基取代的三键结合的环原子的应变环炔基类似物基团，具有叠氮化物、氧化腈、硝酮和重氮羰基试剂(参见，例如，Sanders et al.,J Am Chem Soc2010,133:949；Agard et al.,J Am Chem Soc 2004,126:15046)，例如应变促进的炔-叠氮环加成反应(SPAAC)。这类点击反应允许靶多肽的ncAA标记基团与偶联伙伴分子的合适基团进行超快的双正交共价位点特异性偶联。可通过上述点击反应进行反应的对接和标记基团对是本领域已知的。用于本发明的包含的对接基团的合适ncAA的实例包括但不限于例如WO 2012/104422和WO 2015/107064中描述的ncAA(“非天然氨基酸”，“UAA”)。任选取代的应变炔基包括但不限于任选取代的反式环辛烯基，如上述文献中描述的那些。任选取代的应变烯基包括但不限于任选取代的环辛炔基，如WO 2012/104422和WO 2015/107064中描述的那些。任选取代的四嗪基包括但不限于WO 2012/104422和WO 2015/107064中描述的那些。

本发明的上下文中使用的ncAA可以其盐的形式使用。如本文所述的ncAA的盐是指酸或碱加成盐，特别是生理上可耐受的酸或碱的加成盐。生理上耐受的酸加成盐可以通过用适当的有机或无机酸处理ncAA的碱形式来形成。通过用适当的有机和无机碱处理可以将含有酸质子的ncAA转化为它们的无毒金属或胺加成盐形式。ncAA的羧基盐可以以本领域已知的方式生产，并且包含无机盐，例如钠盐、钙盐、铵盐、铁盐和锌盐，以及与有机碱形成的盐，例如胺，如三乙醇胺、精氨酸、赖氨酸、哌啶等。ncAA也可以以酸加成盐的形式使用，例如与无机酸形成的盐，如盐酸或硫酸，以及与有机酸形成的盐，如乙酸和草酸。可用于本发明的ncAA及其盐还包括其水合物和溶剂加成形式，如水合物、醇化物等。

生理上耐受的酸或碱特别是用于制备具有ncAA残基的POI的翻译系统所耐受的酸或碱，例如对活的真核细胞基本上无毒。

在本发明上下文中可用的ncAA及其盐可以通过类似于本领域公知并且例如本文引用的各种出版物描述的方法来制备。

偶联伙伴分子的性质取决于预期用途。例如，靶多肽可以与适合成像方法的分子偶联或可以通过与生物活性分子偶联而被功能化。例如，除了对接基团之外，偶联伙伴分子可以包含基团，所述基团选自但不限于染料(例如荧光、发光或磷光染料，如丹磺酰基、香豆素、荧光素、吖啶、罗丹明、硅-罗丹明、BODIPY或花青染料)、与试剂接触时能发出荧光的分子、发色团(例如，光敏色素、藻胆素、胆红素等)、放射性标记(例如氢、氟、碳、磷、硫或碘的放射性形式，如氚、¹⁸F、¹¹C、¹⁴C、³²P、³³P、³³S、³⁵S、¹¹In、¹²⁵I、¹²³I、¹³¹I、²¹²B、⁹⁰Y或¹⁸⁶Rh)、MRI敏感自旋标签、亲和标签(例如生物素、His-标签、Flag-标签、strep-标签、糖、脂质、甾醇、PEG-接头分子、苄基鸟嘌呤、苄基胞嘧啶或辅因子)、聚乙二醇基团(例如，支链PEG、线性PEG、不同分子量的PEG等)、光交联剂(如对叠氮基碘乙酰苯胺)、NMR探针、X射线探针、pH探针、IR探针、树脂、固体支持物和生物活性化合物(例如合成药物)。合适的生物活性化合物包括但不限于细胞毒性化合物(例如，癌症化疗化合物)、抗病毒化合物、生物反应调节剂(例如，激素、趋化因子、细胞因子、白介素等)、影响微管的物质、激素调节剂和甾体化合物。可用的偶联伙伴分子的具体实例包括但不限于受体/配体对的成员；抗体/抗原对的成员；凝集素/碳水化合物对的成员；酶/底物对的成员；生物素/亲和素；生物素/链霉亲和素和地高辛/抗地高辛。

某些ncAA残基(的标记基团)与偶联伙伴分子(的对接基团)原位共价偶联的能力，特别是通过本文所述的点击反应，可用于在表达靶多肽的真核细胞或组织中检测具有这类ncAA残基的靶多肽，以及用于研究靶多肽的分布和命运。具体地，本发明通过在(例如真核)细胞中表达制备POI的方法可以与超分辨率显微镜术(SRM)结合以检测细胞内或这类细胞的组织内的POI。数种SRM方法是本领域已知的，并且可以将其修改以利用点击化学来检测由本发明的真核细胞表达的靶多肽。这类SRM方法的具体实例包括DNA-PAINT(用于纳米级成像的DNA点积累；例如Jungmann et al.,Nat Methods 11:313-318,2014描述)、dSTORM(直接随机光学重建显微术)和STED(受激发射损耗)显微术。

6.细胞内POI的翻译制备

本发明提供的OT系统允许在细胞中翻译制备POI。

根据本发明用于制备POI的细胞可以是原核细胞。或者，根据本发明用于制备POI的细胞可以是真核细胞。根据本发明用于制备POI的细胞可以是单个细胞，例如单细胞微生物或源自多细胞生物体细胞的细胞系。或者，根据本发明用于制备POI的细胞可以存在于组织、器官、身体部位(及其部分)或整个多细胞生物体中。因此，本发明用于制备POI的方法可以用单个细胞或细胞培养物，或者用组织或组织培养物、器官、身体部分或者(整个多细胞)生物体进行。

与原核生物(例如大肠杆菌)相比，真核细胞通常更难处理和操作，因此无法或仅很难使用已知的POI选择性正交翻译方法，例如上文“发明背景”一节中描述的方法。因此，当用于真核细胞(包括，例如，单细胞和多细胞真核生物体以及真核细胞系)中的POI表达时，本发明的OT系统和方法是特别有利的。

原则上，根据本发明的方法，所有原核或真核细胞均可用于制备POI。可以使用微生物，例如细菌、真菌或酵母，以及真核细胞，例如哺乳动物细胞、昆虫细胞、酵母细胞和植物细胞。特别优选真核细胞，特别是哺乳动物细胞。

根据本发明用于制备POI的细胞携带编码POI的核苷酸序列(CS^POI)，其中POI的ncAA残基由选择密码子编码。所述CS^POI与一种或多种靶向序列(TN)功能性连接。翻译产生包含CS^POI和TN的mRNA。所述细胞进一步包含一种或多种本发明的融合蛋白，其中所述融合蛋白包含至少一个O-RS区段和至少一个RNA-TP区段。所述O-RS和RNA-TP可以在本发明的分别的融合蛋白(例如AFP)上。或者，所述O-RS和RNA-TP可以在本发明的一种且相同的融合蛋白上(例如在RNA-TP/O-RS融合蛋白或AFP上)。通过(至少一种)其TN，所述mRNA可以在细胞中与本发明的融合蛋白的至少一种RNA-TP区段相互作用(结合)。所述细胞进一步包含一种或多种正交tRNA^ncAA分子(O-tRNA^ncAA)，其携带CS^POI的选择密码子的反密码子。所述O-tRNA^ncAA分子与细胞中融合蛋白的一个或多个O-RS区段形成一个或多个正交O-RS/O-tRNA^ncAA对，其允许将ncAA残基引入(翻译制备的)POI的氨基酸序列。

包含CS^POI和TN的mRNA与RNA-TP区段的相互作用，通过O-RS区段用ncAA对O-tRNA^ncAA的氨酰化，以及包括引入ncAA残基的POI的翻译制备，据认为发生在细胞质中，更特别是在ncAA存在下的细胞的OT组装器集合体(OT细胞器)中。

包含CS^POI和TN的mRNA(mRNA^POI)可以由引入细胞的重组构建体(例如表达载体)产生。或者，可以修饰细胞的一个或多个内源基因以包含一种或多种选择密码子以及一种或多种TN。将重组构建体引入细胞的技术以及修饰细胞内源基因的方法是本领域公知的。

本发明的tRNA^ncAA分子和融合蛋白可以由引入细胞的重组构建体(例如表达载体)产生。

使用本发明的表达载体，可以产生重组细胞，其可用于使用本发明的方法制备POI。有利地，将上述根据本发明的重组载体引入合适的细胞中并表达。

如本文所述用于制备POI的细胞可以通过将编码融合蛋白、tRNA^ncAA分子和POI的核苷酸序列引入细胞来制备。所述核苷酸序列可以以任何组合位于不同的核酸分子(载体)或同一核酸分子(例如，载体)上，并且可以组合或顺序方式引入细胞中。

优选地，使用本领域技术人员已知的常用克隆和转染技术，例如共沉淀、原生质体融合、电穿孔、病毒介导的基因递送、脂质转染、显微注射或其他，将所述核酸分子引入相应的细胞中。合适的技术描述于例如Current Protocols in Molecular Biology,F.Ausubelet al.,Ed.,Wiley Interscience,New York 1997，或者Sambrook et al.MolecularCloning:A Laboratory Manual.2nd edition,Cold Spring Harbor Laboratory,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,NY,1989。

对于本发明的方法，用于POI表达的细胞以本领域技术人员已知的方式进行生长或培养。取决于细胞的类型，可以使用液体培养基进行培养。培养可以是分批、半分批或连续的。营养物质可以在培养开始时存在，或者可以在后续培养中半连续或连续提供。

表达的POI可以通过已知技术纯化，例如分子筛层析(凝胶过滤)，如Q-琼脂糖层析、离子交换层析和疏水层析，以及其他常见的蛋白纯化技术如超滤、结晶、盐析、透析和天然凝胶电泳。合适的方法描述于例如Cooper,T.G.,Biochemische Arbeitsmethoden[Biochemistry processes],Verlag Walter de Gruyter,Berlin,New York或Scopes,R.,Protein Purification,Springer Verlag,New York,Heidelberg,Berlin。

为了分离POI，将POI与可以用于更容易纯化的标签相连接可能是有利的。这可以通过将相应的标签编码序列引入CS^POI来实现。用于蛋白纯化的合适标签是本领域公知的，并且包括例如组氨酸标签(例如，His₆标签)和可被识别为抗体抗原的表位(描述于例如Harlow，E.and Lane，D.，1988,Antibodies:A Laboratory Manual.Cold Spring Harbor(NY)Press)。这些标签可以用于将蛋白连接至固体载体，例如聚合物基质，其可以例如用作色谱柱中的填料，或者可以用于微量滴定板或一些其他载体上。

连接到POI的标签也可以用于检测POI。用于蛋白检测的标签是本领域公知的，并且包括例如荧光染料，酶标记物，其在与底物反应后形成可检测的反应产物，等等。

为了根据本发明的方法制备POI，可以通过在对应于POI的ncAA残基的一种或多种ncAA存在下培养细胞(其中所述ncAA可以方便地包含在培养基中)一段适合翻译POI的时间来实现表达。取决于编码POI的核酸(以及任选存在的本发明的融合蛋白和/或tRNA^ncAA分子)，可能需要通过添加诱导转录的化合物来诱导表达，例如允许转录的阿拉伯糖、异丙基β-D-硫代半乳糖苷(IPTG)或四环素。

翻译后，可以任选地从翻译系统中回收POI。为此目的，根据本领域技术人员已知和使用的流程，POI可以部分或基本上被回收和纯化至均质。除非靶多肽被分泌到培养基中，否则回收通常需要细胞破碎。细胞破碎的方法是本领域公知的，包括物理破碎，例如，通过(超声)声波作用，液体剪切破碎(例如，通过弗氏压碎器)，机械方法(如使用搅拌器或研磨机)或冻融循环，也包括化学裂解，所述化学裂解使用破坏脂质-脂质、蛋白-蛋白和/或蛋白-脂质相互作用的试剂(如去污剂)，以及物理破碎技术和化学裂解的组合。从细胞裂解液或培养基中纯化多肽的标准流程也是本领域公知的，并且包括例如硫酸铵或乙醇沉淀、酸或碱提取、柱层析、亲和柱层析、阴离子或阳离子交换层析、磷酸纤维素层析、疏水相互作用色谱、羟基磷灰石色谱、凝集素色谱、凝胶电泳等。根据需要，可以使用蛋白重折叠步骤来制备正确折叠的成熟蛋白。在需要高纯度的最终纯化步骤中，可以采用高效液相色谱(HPLC)、亲和色谱或其他合适的方法。针对本发明的多肽制备的抗体可用作纯化试剂，即用于多肽的基于亲和的纯化。多种纯化/蛋白折叠方法是本领域公知的，包括例如Scopes,ProteinPurification,Springer,Berlin(1993)；和Deutscher,Methods in Enzymology Vol.182:Guide to Protein Purification,Academic Press(1990)；以及其中引用的参考文献中示出的那些方法。

如上所述，本领域技术人员会认识到，在合成、表达和/或纯化之后，多肽可以具有与相关多肽的期望构象不同的构象。例如，由原核系统产生的多肽通常通过暴露于离液剂中以实现正确折叠来优化。在从例如细胞裂解液纯化期间，表达的多肽任选地变性然后复性。这是通过例如将蛋白溶解在离液剂如盐酸胍中来实现的。通常，有时需要使表达的多肽变性和还原，然后使多肽重新折叠成优选的构象。例如，胍、尿素、DTT、DTE和/或伴侣蛋白可以添加到感兴趣的翻译产物中。还原、变性和复性蛋白的方法是本领域技术人员公知的。多肽可以在含有例如氧化谷胱甘肽和L-精氨酸的氧化还原缓冲液中重新折叠。

本文还描述通过本发明的方法产生的多肽。这类多肽可通过本发明的方法制备，所述方法利用本文所述的OT系统。

7.试剂盒

本发明还提供用于制备POI的试剂盒，所述POI具有至少一个非典型氨基酸(ncAA)残基。本发明的试剂盒可以包含至少一种用于本发明的至少一种融合蛋白的表达载体。试剂盒中的表达载体编码的融合蛋白可以包含至少一个O-RS区段和至少一个RNA-TP区段。所述试剂盒可以进一步包含至少一种ncAA或其盐，对应于所述POI的至少一个ncAA残基。有利地，所述O-RS区段能够用至少一种ncAA氨酰化tRNA。所述试剂盒可以进一步包含至少一种用于正交tRNA^ncAA(O-tRNA^ncAA)分子的表达载体。试剂盒的其他成分可以包括至少一种表达载体，其包含多克隆位点和靶向核苷酸序列(TN)，其中包含所述TN的RNA分子能够通过所述TN与靶向RNA的多肽(RNA-TP)相互作用。有利地，所述TN是这样的序列，当存在于RNA分子中时，其能够与试剂盒包含的表达载体所编码的融合蛋白中的至少一种的RNA-TP区段相互作用。所述试剂盒可以进一步包含至少一种报告构建体，其编码易于检测(例如荧光)的报告多肽，所述报告多肽具有至少一个非典型氨基酸(ncAA)残基，使得从所述构建体翻译的mRNA包含如本文所述的TN。

本发明的试剂盒可在本发明的方法中用于制备本文所述的含有ncAA残基的POI。

具体实施方案

本发明还提供以下非限制性实施方案E1至E50。

E1:一种组装器融合蛋白(AFP)，其包含：

(a)充当组装器(AP)的至少一个第一多肽区段，其选自：

(b)充当效应物(EP)的至少一个第二多肽区段，其选自：

b1)靶向RNA的多肽(RNA-TP)区段，和

b2)正交氨酰tRNA合成酶(O-RS)区段；

其中所述多肽区段在所述AFP中功能性连接。

E2:E1的AFP，其包含至少两种AP，优选至少一个IC-TP区段和至少一个PSP区段。

E3:E1或E2的AFP，其具有以下结构之一(从N端到C端)：

[IC-TP]_m-[EP]_o

[EP]_o-[IC-TP]_m

[PSP]_n-[EP]_o

[EP]_o-[PSP]_n

[IC-TP]_m-[EP]_o-[PSP]_n

[PSP]_n-[EP]_o-[IC-TP]_m

[IC-TP]_m-[PSP]_n-[EP]_o

[EP]_o-[PSP]_n-[IC-TP]_m

[PSP]_n-[IC-TP]_m-[EP]_o

[EP]_o-[IC-TP]_m-[PSP]_n

其中m、n和o相互独立地是选自1、2、3、4或5的整数，并且“-”表示肽键。

E4:E1-E3中任一项的AFP，其中至少一个EP选自RNA-TP区段。

E5:E1-E3中任一项的AFP，其中至少一个EP选自O-RS区段。

E6:E1-E3中任一项的AFP，其包含至少一个选自RNA-TP区段的EP和至少一个选自O-RS区段的EP。

E7:E1-E6中任一项的AFP，其包含至少一个IC-TP区段，所述IC-TP区段选自动力蛋白和驱动蛋白以及动力蛋白和驱动蛋白的片段和突变体，其保留靶向微管的正末端或负末端并在微管的正末端或负末端富集的能力。

E8:E1-E6中任一项的AFP，其包含至少一个IC-TP区段，所述IC-TP区段选自膜蛋白的跨膜结构域以及跨膜结构域的功能片段和突变体，其保留靶向膜的细胞质侧并在膜的细胞质侧富集的能力，特别是选自细胞膜、核膜和线粒体膜的膜。

E9:E1-E8中任一项的AFP，其包含至少一个IC-TP区段，所述IC-TP区段选自：

-KIF16B_1-400，其包含SEQ ID NO:20的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:20的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；

-KIF13A_1-411,Δ390，其包含SEQ ID NO:22的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:22的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；

-TOMM20_1-70，其包含SEQ ID NO:24的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:24的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；

-LcK，其包含SEQ ID NO:26的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:26的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；

-FRB-CD28，其包含SEQ ID NO:28的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:28的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；

-FUS-CD28，其包含SEQ ID NO:30的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:30的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；

-EB1，其包含SEQ ID NO:302的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:303的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；

-CG1，其包含SEQ ID NO:304的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:304的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；

-EBAG9，其包含SEQ ID NO:292的氨基酸序列(全长)，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:292具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；或者包含SEQ IDNO:294的前29个N端氨基酸残基；或者其功能片段或突变体，所述功能片段或突变体与SEQID NO:294具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；

-CMP Sia Tr，其包含SEQ ID NO:296的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:296的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；以及

-P450 2C1，其靶向ER膜的细胞质侧，或者其功能片段或突变体，所述功能片段或突变体与其具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性，特别是包含N端前27个(SEQ ID NO:298)氨基酸残基的片段；或包含前29个(SEQ ID NO:300)氨基酸残基的片段；或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:298或300具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性。

E10:E1-E9中任一项的AFP，其包含至少一个PSP区段，所述PSP区段选自天然无序蛋白(IDP)，特别是朊病毒样结构域，以及IDP或朊病毒样结构域的功能片段和突变体，其保留在细胞的细胞质中自缔合的能力，从而在细胞质中产生局部高浓度位点。

E11:E1-E10中任一项的AFP，其包含至少一个PSP区段，所述PSP区段选自：

-SPD5，其包含SEQ ID NO:32的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:32的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；

-FUS，其包含SEQ ID NO:34的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:34的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；以及

-EWSR1，其包含SEQ ID NO:36的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:36的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性。

E12:E1-E11中任一项的AFP，其包含至少一个RNA-TP区段，所述RNA-TP区段选自病毒外壳蛋白的RNA结合区段以及病毒外壳蛋白的RNA结合区段的功能片段和突变体，其保留与病毒的RNA基序特异性相互作用的能力。

E13:E1-E12中任一项的AFP，其包含至少一个RNA-TP区段，所述RNA-TP区段选自：

-MCP，其包含SEQ ID NO:14的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:14的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；

-λ_N22，其包含SEQ ID NO:16的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:16的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；以及

-PCP，其包含SEQ ID NO:306的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:306的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性。

E14:E1-E13中任一项的AFP，其包含至少一个O-RS区段，所述O-RS区段选自：

-詹氏甲烷球菌酪氨酰-tRNA合成酶；

-大肠杆菌酪氨酰-tRNA合成酶；

-大肠杆菌亮氨酰-tRNA合成酶；

-马氏甲烷八叠球菌吡咯赖氨酰-tRNA合成酶；

-巴氏甲烷八叠球菌吡咯赖氨酰-tRNA合成酶；

-乙酸甲烷八叠球菌吡咯赖氨酰-tRNA合成酶；

-嗜热甲烷八叠球菌吡咯赖氨酰-tRNA合成酶；

-布氏拟甲烷球菌吡咯赖氨酰-tRNA合成酶；

-Desulfitobacterium hafniense吡咯赖氨酰-tRNA合成酶；和

及其保留氨酰-tRNA合成酶酶活性的功能片段和突变体。

E15:E1-E14中任一项的AFP，其包含至少一个O-RS区段，所述O-RS区段选自：

-PylRS^AF，其包含SEQ ID NO:8的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:8的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；

-PylRS^AA，其包含SEQ ID NO:10的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:10的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；

-PylRS^AAAF，其包含SEQ ID NO:12的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:12的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；

-IFRS1，其包含SEQ ID NO:224的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:224的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；

-CbzRS，其包含SEQ ID NO:226的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:226的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；

-CpkRS，其包含SEQ ID NO:228的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:228的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；以及

-OMeRS，其包含SEQ ID NO:236的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:236的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性。

E16:一种组装器融合蛋白(AFP)组合，其包含至少两种E1-E15中任一项的AFP。

E17:E16的AFP组合，其包含至少一个第一AFP，以及至少一个第二AFP，所述第一AFP包含至少一个RNA-TP区段，所述第二AFP包含至少一个O-RS区段。

E18:一种融合蛋白(RNA-TP/O-RS融合蛋白)，其包含：

(ⅰ)至少一个靶向RNA的多肽(RNA-TP)区段；和

(ⅱ)至少一个正交氨酰tRNA合成酶(O-RS)区段，

其中所述多肽区段在所述RNA-TP/O-RS融合蛋白中功能性连接。

E19:E18的RNA-TP/O-RS融合蛋白，其具有以下结构之一(从N端到C端)：

[RNA-TP]_x-[O-RS]_y

[O-RS]_y-[RNA-TP]_x

其中x和y相互独立地是选自1、2、3、4和5的整数；并且“-”表示肽键。

E20:E18或E19的RNA-TP/O-RS融合蛋白，其包含至少一个RNA-TP区段，所述RNA-TP区段选自病毒外壳蛋白的RNA结合区段以及病毒外壳蛋白的RNA结合区段的功能片段和突变体，其保留与病毒的RNA基序特异性相互作用的能力。

E21:E18-E20中任一项的RNA-TP/O-RS融合蛋白，其包含至少一个RNA-TP区段，所述RNA-TP区段选自：

E22:E18-E21中任一项的RNA-TP/O-RS融合蛋白，其包含至少一个O-RS区段，所述O-RS区段选自：

-詹氏甲烷球菌酪氨酰-tRNA合成酶；

-大肠杆菌酪氨酰-tRNA合成酶；

-大肠杆菌亮氨酰-tRNA合成酶；

-马氏甲烷八叠球菌吡咯赖氨酰-tRNA合成酶；

-巴氏甲烷八叠球菌吡咯赖氨酰-tRNA合成酶；

-乙酸甲烷八叠球菌吡咯赖氨酰-tRNA合成酶；

-嗜热甲烷八叠球菌吡咯赖氨酰-tRNA合成酶；

-布氏拟甲烷球菌吡咯赖氨酰-tRNA合成酶；

-Desulfitobacterium hafniense吡咯赖氨酰-tRNA合成酶；和

及其保留氨酰-tRNA合成酶酶活性的功能片段和突变体。

E23:E18-E22中任一项的RNA-TP/O-RS融合蛋白，其包含至少一个O-RS区段，所述O-RS区段选自：

-PylRS^AF，其包含SEQ ID NO:8的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:8的氨基酸序列具有至少60％序列相同性；

-PylRS^AA，其包含SEQ ID NO:10的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:10的氨基酸序列具有至少60％序列相同性；

-PylRS^AAAF，其包含SEQ ID NO:12的氨基酸序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:12的氨基酸序列具有至少60％序列相同性；

E24:一种核酸分子，或者两种或更多种核酸分子的组合，其包含：

(i)核苷酸序列，其编码至少一种E1-E15中任一项的AFP，或者至少一种E16或E17的AFP组合，或

(ii)与(i)的核苷酸序列互补的核酸序列，

(ⅲ)(i)和(ii)。

E25:一种核酸分子，或者两种或更多种核酸分子的组合，其包含：

(i)核苷酸序列，其编码至少一种E18-E23中任一项的RNA-TP/O-RS融合蛋白，或

(ii)与(i)互补的核酸序列，或

(ⅲ)(i)和(ii)。

E26:一种表达盒，其包含E24或E25的核酸分子或者核酸分子的组合的核苷酸序列。

E27:一种表达载体，其包含至少一种E26的表达盒。

E28:一种细胞，其包含至少一种E24或E25的核酸分子或核酸分子的组合、至少一种E26的表达盒或者至少一种E27的表达载体。

E29:E28的细胞，其为真核细胞。

E30:E28的细胞，其为哺乳动物细胞。

E31:E28-E30中任一项的细胞，其包含至少一种E24的核酸分子或核酸分子的组合，或者至少一种表达盒，所述表达盒包含所述核酸分子或核酸分子的组合的核苷酸序列，或者至少一种包含所述表达盒的表达载体。

E32:E31的细胞，其包含核苷酸序列，所述核苷酸序列编码至少一种E1-E3和E7-E15中任一项的AFP或者与编码至少一种E1-E3和E7-E15中任一项的AFP的核苷酸序列互补，所述AFP包含至少一个选自RNA-TP区段的EP和至少一个选自O-RS区段的EP。

E33:E31的细胞，其包含核苷酸序列，所述核苷酸序列编码以下AFP或与编码以下AFP的核苷酸序列互补：

至少一种E1-E3和E7-E15中任一项的AFP，所述AFP包含至少一个选自RNA-TP区段的EP；以及

至少一种E1-E3和E7-E15中任一项的AFP，所述AFP包含至少一个选自O-RS区段的EP。

E34:E28-E30中任一项的细胞，其包含至少一种E25的核酸分子或核酸分子的组合，或者至少一种表达盒，所述表达盒包含所述核酸分子或核酸分子的组合的核苷酸序列，或者至少一种包含所述表达盒的表达载体。

E35:E28-E34中任一项的细胞，其中所述细胞分别表达所述至少一种AFP、所述至少一种AFP组合或者所述至少一种RNA-TP/O-RS融合蛋白，其由所述核酸分子或核酸分子的组合的核苷酸序列编码。

E36:一种制备感兴趣的多肽(POI)的方法，所述POI在其氨基酸序列中包含一种或多种非典型氨基酸(ncAA)残基，其中所述方法包括在所述一种或多种ncAA的存在下，在E31-E33中任一项的细胞中表达所述POI，其中所述细胞包含：

(ⅰ)编码POI的核苷酸序列(CS^POI)，其中所述POI的一种或多种ncAA残基由选择密码子编码，

(ⅱ)靶向核苷酸序列(TN)，其功能性连接至所述CS^POI，并且能够与所述细胞中AFP中的至少一种的RNA-TP区段相互作用；

(ⅲ)一种或多种正交tRNA^ncAA(O-tRNA^ncAA)分子，其携带与所述CS^POI的选择密码子互补的反密码子，并且其中所述O-tRNA^ncAA分子与所述细胞中AFP中的至少一种的一个或多个O-RS区段一起形成一个或多个正交O-RS/O-tRNA^ncAA对，其允许将所述一种或多种ncAA残基引入POI的氨基酸序列中；

并且其中所述方法任选地进一步包括回收表达的POI。

E37:一种制备感兴趣的多肽(POI)的方法，所述POI在其氨基酸序列中包含一种或多种非典型氨基酸(ncAA)残基，其中所述方法包括在所述一种或多种ncAA的存在下，在E35的细胞中表达所述POI，其中所述细胞包含：

(ⅱ)靶向核苷酸序列(TN)，其功能性连接至所述CS^POI，并且能够与所述细胞中RNA-TP/O-RS融合蛋白中的至少一种的RNA-TP区段相互作用；

(ⅲ)一种或多种正交tRNA^ncAA(O-tRNA^ncAA)分子，其携带与所述CS^POI的选择密码子互补的反密码子，并且其中所述O-tRNA^ncAA分子与所述细胞中RNA-TP/O-RS融合蛋白的一个或多个O-RS区段一起形成一个或多个正交O-RS/O-tRNA^ncAA对，其允许将所述一种或多种ncAA残基引入所述POI的氨基酸序列中；

并且其中所述方法任选地进一步包括回收表达的POI。

E38:一种制备感兴趣的多肽(POI)的方法，所述POI在其氨基酸序列中包含一种或多种非典型氨基酸(ncAA)残基，其中所述方法包括以下步骤：

(a)在细胞中表达一种或多种E1-E3和E7-E15中任一项的AFP，所述AFP包含至少一个RNA-TP区段，以及一种或多种E1-E3和E7-E15中任一项的AFP，所述AFP包含至少一个O-RS区段；

-所述正交tRNA^ncAA分子与细胞中AFP的一个或多个O-RS区段形成一个或多个正交氨酰tRNA合成酶tRNA^ncAA(O-RS/O-tRNA^ncAA)对，

-所述O-RS/O-tRNA^ncAA对允许将所述一种或多种ncAA残基引入所述POI的氨基酸序列中，其中步骤(a)和(b)可以同时或以任意顺序依次进行；

-所述CS^POI/TN融合序列能通过其TN与所述细胞中AFP中的至少一种的RNA-TP区段相互作用；以及

(d)任选地回收表达的POI。

E39:一种制备感兴趣的多肽(POI)的方法，所述POI在其氨基酸序列中包含一种或多种非典型氨基酸(ncAA)残基，所述方法包括以下步骤：

(a)在细胞中表达E18-E23中任一项的RNA-TP/O-RS融合蛋白；

-所述正交tRNA^ncAA分子与细胞中RNA-TP/O-RS融合蛋白的一个或多个O-RS区段形成一个或多个正交氨酰tRNA合成酶/tRNA^ncAA(O-RS/O-tRNA^ncAA)对，

其中步骤(a)和(b)可以同时或以任意顺序依次进行；

(c)在所述一种或多种ncAA的存在下，在所述细胞中表达所述POI，其中

以及

(d)任选地回收表达的POI。

E40:E36-E39中任一项的方法，其中所述TN选自病毒外壳蛋白结合的病毒RNA基序，及其保留与病毒外壳蛋白结合能力的功能片段和突变体。

E41:E36-E40中任一项的方法，其中所述TN选自：

-MS2 RNA茎环，其包含由核苷酸序列SEQ ID NO:17编码的RNA序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:17的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；

-BoxB，其包含由核苷酸序列SEQ ID NO:18编码的RNA序列，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:18的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性；和

-pp7 RNA茎环，其以至少两种不同的形式存在并且包含由SEQ ID NO:289或SEQID NO:290的核苷酸序列编码的RNA序列，特别是具有对应于SEQ ID NO:289或SEQ ID NO:290的核苷酸(DNA)序列(由SEQ ID NO:289或SEQ ID NO:290的核苷酸(DNA)序列编码)的RNA序列的多核苷酸，或者其功能片段或突变体，所述功能片段或突变体与SEQ ID NO:289或290的氨基酸序列具有至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氨基酸序列相同性。

E42:E36-E41中任一项的方法，其中编码POI的ncAA残基的选择密码子选自琥珀、赭石和乳白终止密码子。

E43:一种核酸分子，其包含：

(i)编码感兴趣的多肽(POI)的核苷酸序列(CS^POI)，所述POI包含一种或多种非典型氨基酸(ncAA)残基，所述ncAA残基在CS^POI中由选择密码子编码，和

E44:E43的核酸分子，其中所述TN选自病毒外壳蛋白结合的病毒RNA基序，及其保留与病毒外壳蛋白结合能力的功能片段和突变体。

E45:E43或E44的核酸分子，其中所述TN选自：

E46:E43-E45中任一项的核酸分子，其中编码POI的ncAA残基的选择密码子选自琥珀、赭石和乳白终止密码子。

E47:一种试剂盒，其用于制备具有至少一个非典型氨基酸(ncAA)残基的感兴趣的多肽(POI)，所述试剂盒包含：

-至少一种E27的表达载体。

E48:E47的试剂盒，其中所述表达载体编码包含至少一个O-RS区段和至少一个RNA-TP区段的融合蛋白。

E49:E47或E48的试剂盒，其进一步包含至少一种正交tRNA^ncAA(O-tRNA^ncAA)分子的表达载体。

E50:E47-E49中任一项的试剂盒，其进一步包含至少一种表达载体，所述表达载体包含多克隆位点和靶向核苷酸序列(TN)，其中包含所述TN的RNA分子能够通过所述TN与靶向RNA的多肽(RNA-TP)相互作用。

上述实施方案中的任一个还涵盖以下修改：上述AP(即IC-TP和PSP)区段和/或EP(RNA-TP或O-RS)区段可以进一步与合成蛋白区段结合，其诱导并控制大分子相互作用。一个或多个，如2、3、4、5、6、7、8、9或10个，优选地，一个这样的蛋白区段可以可操作地融合到本发明的单个AFP中。本发明的上下文中特别感兴趣的是具有形成异二聚体卷曲螺旋蛋白结构能力的SYNZIP。这类SYNZIP是成对的合成肽，其能够相互作用，并用于诱导和控制大分子相互作用。非限制性实例是成对的SYNZIP 1:2；SYNZIP 3:4和SYNZIP 5:6。根据本发明特别优选的是如Reinke,A.W.,Grant,R.A.,Keating,A.E.(2010)J Am Chem Soc 132 6025-6031所述的异种特异性卷曲螺旋对SYNZIP2:SYNZIP1(SYNZIP 1:SEQ ID NO:312；SYNZIP2:SEQ ID NO:314；SYNZIP 3:SEQ ID NO:316；SYNZIP 4:SEQ ID NO:318，以及这些SYNZIP多肽的功能片段和突变体。所述功能片段和突变体可以包含与其来源的多肽的氨基酸至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％相同的氨基酸序列。

本发明通过以下非限制性实施例进一步说明。

实施例

方法

(A)细胞培养、转染和用ncAA补料

将HEK293T细胞(ATCC CRL-3216)和COS-7细胞(ATCC，CRL-1651)维持在Dulbecco改良的Eagle培养基(Life Technologies，41965-039)中，并补充有1％青霉素-链霉素(Sigma，10,000U/ml青霉素、10mg/ml链霉素、0.9％NaCl)、2mM L-谷氨酰胺(Sigma)、1mM丙酮酸钠(Life Technologies)和10％FBS(Sigma)。将细胞在37℃和5％CO₂气氛中培养，每2-3天传代一次，最多传代15-20次。

在所有情况下，转染前15-20小时，将细胞以转染时导致70-80％汇合的密度接种。使用具有塑料底的24孔板(Nunclon Delta Surface ThermoScientific)进行流式细胞术。免疫荧光标记和FISH在具有玻璃底的24孔板(Greiner Bio-One)或四孔Lab-Tek#1.0硼硅盖玻片(ThermoFisher)上进行。

HEK293T细胞的转染用聚乙烯亚胺(PEI，Sigma-Aldrich)进行，每1μg DNA使用3μgPEI。根据制造商的建议，使用JetPrime试剂(PeqLab)以1:2的比例转染COS-7细胞。

对于琥珀型抑制系统测试，用POI^TAG载体、tRNA^Pyl、合成酶和MCP或模拟构建体以1:1:1:1的比例转染细胞。转染4-6小时后，将培养基换成含有ncAA的新鲜培养基。

所有使用的ncAA的原液和工作液都如Nikic et al.(Nat Protoc 10(5):780-791,2015)所述制备。SCO(环辛炔赖氨酸，SiChem SC-8000)使用的最终浓度为250μM。3-碘苯丙氨酸(Chem-Impex International Inc.)使用的最终浓度为1mM。SCO被PylRS^AF(Y306A，Y384F)有效识别(参见Plass et al，Angew Chem 2011,50:3878-3881)。3-碘苯丙氨酸被PylRS^AA(C346A，N348A)识别(参见Wang et al，ACS Chem Biol 2013,8:405-415)。

(B)流式细胞术

转染一天后收获HEK293T细胞，重新悬浮在1xPBS中并通过100μm尼龙网。流式细胞术的共转染以1:1:1:1的比例进行，总DNA为1.2μg，以及：

-编码POI的报告质粒(终止密码子编码待被ncAA占据的氨基酸位置)，

-编码具有反密码子的tRNA^Pyl的质粒，所述反密码子与POI编码序列中的终止密码子匹配(即，反向互补)(以下简称为tRNA^Pyl)，

-分别编码PylRS或其功能突变体的质粒，和

-编码MCP融合多肽的质粒或模拟质粒。

在转染后4-6小时将细胞培养基更换为含有待掺入POI的ncAA的新鲜培养基，并放置至收集时间。

数据采集和分析使用LSRFortessa SORP细胞分析仪(Becton,Dickinson andCompany)和FlowJo软件(FlowJo)进行。首先使用前向散射区域(FSC-A)和侧向散射区域(SSC-A)参数按细胞类型对细胞进行门控。随后，根据SSC-A和侧向散射宽度(SSC-W)鉴定单细胞。每个显示的FFC图是三个独立的生物学重复的总和，并从中计算平均值和SEM。每个条件至少分析130,000个单细胞。GFP荧光在488-530/30通道中获得，mCherry荧光在561-610/20通道中获得。

(C)PylRS免疫染色和成像，荧光原位杂交(FISH)

对于免疫标记实验，将细胞用1xPBS润洗，在1xPBS中的2％多聚甲醛中于室温下固定10分钟，再次用1xPBS润洗，然后在1xPBS中的0.5％Triton X中于室温下透化15分钟。用1xPBS润洗透化的细胞样品两次后，将所述样品在封闭液中孵育90分钟(在1xPBS中的3％BSA中于室温下孵育90分钟)，然后加入1μg/ml一抗(多克隆大鼠抗PylRS，如Nikic等人(Angew Chem Int Ed Engl2016,55(52):16172-16176)所述制备，和/或多克隆兔抗MCP(Merck，ABE76)和/或单克隆兔抗RPL26L1抗体(EPR8478，Abcam，ab137046))在封闭液中4℃过夜。第二天，将细胞样品用1xPBS润洗，并与2μg/ml二抗(鸡抗大鼠IgG(H+L)交叉吸附的Alexa Fluor 594缀合的抗体(Thermo Fisher Scientific，A-21471)和/或山羊抗兔IgG(H+L)交叉吸附的Alexa Fluor 647缀合的F(ab')₂(Thermo Fisher Scientific，A-21246))在封闭液中于室温下孵育60分钟。DNA用Hoechst 33342(1xPBS中1μg/ml)在室温下染色10分钟。如果仅染色DNA，则按上述方法进行固定和透化细胞，然后用Hoechst 33342(1xPBS中1μg/ml)在室温下染色10分钟。最后，用1xPBS润洗细胞两次。

FISH实验在转染后一天进行，类似于Nikic等人(Angew Chem Int Ed Engl 2016,55(52):16172-16176)中描述的FISH实验。杂交方案适用于24孔板，来自Pierce等人(Methods Cell Biol122:415-436,2014)。

对于仅tRNA^Pyl的成像，使用0.25μM的杂交探针5'-CTAACCCGGCTGAACGGATTTAGAGTCCATTCGATC-3'(在5'末端用Cy5标记；SEQ ID NO:1)。用SSC洗涤四次和用TN缓冲液(0.1MTrisHCl，150mM NaCl)洗涤一次后，在上述标准免疫荧光标记前，将细胞用TN缓冲液中的3％BSA在室温下孵育1小时。

对于tRNA^Pyl和MS2 RNA茎环序列的成像，在5'末端用地高辛标记的tRNA^Pyl的杂交探针(5'-CTAACCCGGCTGAACGGATTTAGAGTCCATTCGATC-3'；SEQ ID NO:2)以0.16μM使用，在5'末端用Alexa Fluor 647标记的MS2 RNA茎环序列的杂交探针(5'-CTGCAGACATGGGTGATCCTCATGTTTTCTA-3'；SEQ ID NO:3)以0.75μM使用。用SSC洗涤四次后，将细胞在封闭缓冲液(0.1M TrisHCl、150mM NaCl、1x封闭试剂(Sigma 11096176001))中于室温下孵育1小时。然后，将细胞与荧光素缀合的绵羊抗地高辛Fab(Sigma 11207741910)在封闭缓冲液中以1:200稀释度在4℃下孵育过夜。第二天，在吐温缓冲液(0.1M TrisHCl、150mM NaCl、0.5％Tween20)中洗涤3次，每次5分钟。DNA用Hoechst 33342(1xPBS中1μg/ml)在室温下染色10分钟。

在配备63x/1.40油浸物镜的Leica SP8 STED 3X显微镜上获得共聚焦图像，使用以下激光线进行激发：Hoechst 33342为405nm，荧光素和GFP为488nm，mOrange为548nm，Alexa Fluor 594为594nm，Alexa Fluor 647和Cy5为647nm。用HyD检测器分别收集420-500nm和605-680nm的发射光。

在配备60x/1.40油浸物镜的Olympus Fluoroview FV3000显微镜上拍摄核糖体免疫荧光图像，使用以下激光线进行激发：GFP为488nm，Alexa Fluor 594为594nm，AlexaFluor 647为640nm。

使用FIJI软件处理图像。

(D)构建体、克隆和诱变

将两种不同的荧光蛋白报告基因(双色报告基因)克隆到pBI-CMV1载体(Clontech631630)中，一种蛋白位于一个多克隆位点，另一种报告基因位于另一个多克隆位点。其中一个报告基因的CDS编码携带两个MS2 RNA茎环的mRNA，其融合到3'非翻译区(“MS2-标签”)，而另一个报告基因编码的mRNA没有MS2标签。

为了检查琥珀型抑制，报告基因GFP^39TAG和mCherry^185TAG以与NLS的N端融合物使用。为了检查赭石型和乳白型抑制，(分别用GFP^39TAA和mCherry^185TAA、GFP^39TGA和mCherry^185TGA)制备类似的构建体。

NLS::GFP^39TAG::MS2-标签报告基因：将NLS::GFP^39TAG与两个拷贝的MS2 RNA茎环一起克隆到pBI-CMV1载体中，作为成像实验中琥珀型抑制成功的报告基因。

为了检查多个琥珀密码子抑制，制备GFP^39,149TAG和GFP^{39,149,182TAG}的pBI-CMV构建体，其在第二多克隆位点中不包括第二(例如mCherry)报告基因。

适用于本发明的上下文的GFP的其他非限制性实例有：

GFP^66TAG具有琥珀型位点的GFP(SEQ ID NO:238)

GFP^66TCG具有丝氨酸位点的GFP(SEQ ID NO:240)

GFP^66CCG具有脯氨酸位点的GFP(SEQ ID NO:242)

GFP^66CTA具有亮氨酸位点的GFP(SEQ ID NO:244)

GFP^66TTA具有亮氨酸位点的GFP(SEQ ID NO:246)

GFP^66ATA具有异亮氨酸位点的GFP(SEQ ID NO:248)

GFP^66CGG具有精氨酸位点的GFP(SEQ ID NO:250)

GFP^39TCG具有丝氨酸位点的GFP(SEQ ID NO:252)

GFP^39CCG具有脯氨酸位点的GFP(SEQ ID NO:254)

GFP^39CTA具有亮氨酸位点的GFP(SEQ ID NO:256)

GFP^39CGG具有精氨酸位点的GFP(SEQ ID NO:258)

GFP^39TCG具有丝氨酸位点的LCK-GFP(SEQ ID NO:278)

GFP^39CCG具有脯氨酸位点的LCK-GFP(SEQ ID NO:280)

GFP^39CTA具有亮氨酸位点的LCK-GFP(SEQ ID NO:282)

扩展的GFP^39TCG与GFP^66CCG基因融合的在第39位具有丝氨酸位点的GFP(SEQ ID NO:284)

扩展的GFP^39CCG与GFP^66TCG基因融合的在第39位具有脯氨酸位点的GFP(SEQ ID NO:286)

扩展的GFP^39CTA与GFP^66TCG基因融合的在第39位具有亮氨酸位点的GFP(SEQ ID NO:288)

适用于本发明的上下文的mCherry的其他非限制性实例有：

mCherry^72TAG具有琥珀型位点的mCherry(SEQ ID NO:260)

mCherry^72TCG具有丝氨酸位点的mCherry(SEQ ID NO:262)

mCherry^72CCG具有脯氨酸位点的mCherry(SEQ ID NO:264)

mCherry^72CTA具有亮氨酸位点的mCherry(SEQ ID NO:266)

mCherry^72TTA具有亮氨酸位点的mCherry(SEQ ID NO:268)

mCherry^72ATA具有异亮氨酸位点的mCherry(SEQ ID NO:270)

mCherry^185TCG具有丝氨酸位点的mCherry(SEQ ID NO:272)

mCherry^185CCG具有脯氨酸位点的mCherry(SEQ ID NO:274)

mCherry^185CTA具有亮氨酸位点的mCherry(SEQ ID NO:276)

适用于本发明的上下文的包含不同TN环的mCherry构建体的其他非限制性实例有：

mCherry^190TAG-2xPP7具有琥珀型位点和2x pp7环的mCherry(SEQ ID NO:216)

mCherry^190TAG-4xPP7具有琥珀型位点和4x pp7环的mCherry(SEQ ID NO:218)

mCherry^190TAG-6xPP7具有琥珀型位点和6x pp7环的mCherry(SEQ ID NO:220)

H2B-mCherry^190TAG-2xMS2人组蛋白H2B 1-J型(Uniprot：P06899)与具有琥珀型位点和2x ms2-环的mCherry融合(SEQ ID NO：222)

可以将它们融合到本文所述的任何AFP分子的多肽链中，特别是融合分子内不抑制AFP分子的任何其他多肽区段(AP和EP)的功能的位置。下面给出这类含有AFP分子的表位-标签的实例。

OT组装器集合体的构建体制备如下：tRNA^Pyl在人U6启动子的控制下进行克隆，所有其他构建体在pcDNA3.1(Invitrogen V86020)载体中克隆的CMV启动子下。从addgene质粒#31230克隆MCP蛋白，而FUS来自Addgene质粒#26374。在所有FUS融合物中，使用氨基酸1-478(S108N)，用Flag标签替换C末端NLS区域。在所有RS融合物中，使用先前报道的高效NES::PylRS^AF(Y306A，Y384F)序列(参见，例如，Nikic et al.,Angew Chem Int Ed Engl2016,55(52):16172-16176)。从野生型PylRS开始，通过定点诱变克隆PylRS突变体PylRS^AA(N346A，C348A)。SPD5基因从Genewiz订购并通过限制性克隆与MCP和PylRS^AF融合。KIF13A_1-411和KIF16B_1-400从人cDNA克隆，并通过限制性克隆插入pcDNA3.1。通过定点诱变去除KIF13A_1-411的P390。KIF13A_1-411,ΔP390和KIF16B_1-400与MCP、PylRS^AF、EWSR1::MCP、FUS::PylRS^AF、FUS::PylRS^AA、SPD5::MCP和SPD5::PylRS^AF的融合物通过Gibson组装进行组装(参见Gibson et al.,Nat Methods 2009,6:343-345)。

用于差分成像实验的构建体：为了选择性地表达Nup153-EGFP^149TAG和Vim^116TAG-mOrange，首先将一个基因与MS2标签一起插入pBI-CMV1(比较Nikic et al.,Angew ChemInt Ed Engl 2016,55(52):16172-16176)。随后，在没有MS2标签的情况下插入另一个基因。通过替换包含Nup153::EGFP^149TAG和Vim^116TAG::mOrange::MS2-标签的pBI载体中的Vim^116TAG-mOrange将INSR^676TAG::mOrange融合到MS2标签上，以产生一种双顺反子载体，其中一个盒具有INSR^676TAG::mOrange，而另一个盒具有Nup153::EGFP^149TAG。

用于COS-7细胞实验的多顺反子琥珀型抑制载体：由于COS-7细胞转染效率较低；我们生成包含OT组装器集合体组件的多顺反子载体。为了组装多顺反子琥珀型抑制载体，首先通过Gibson组装将人U6启动子控制下的一个tRNA^Pyl拷贝插入pBI-CMV1载体中。随后，通过Gibson组装首先插入AFP CDS KIF16B::FUS::PylRS^AF，最后插入AFP CDS KIF16B::EWSR1::MCP。或者，使用先前公布的在CMV启动子下表达NES::PylRS^AF和在人U6启动子下表达tRNA^Pyl的基于pcDNA3.1的构建体(参见Nikic et al.,Angew Chem Int Ed Engl 2016,55(52):16172-16176)。或者将具有U6-tRNA^Pyl、KIF16B::FUS::PylRS^AF和KIF16B::EWSR1::MCP或NES::PylRS^AF的构建体插入pDonor载体(GeneCopoeia)。

以下实验中使用的AFP的相应序列信息可以从下面给出的序列表中获取。

实施例1–RNA-TP/O-RS融合物和包含单个AP的AFP

OT组装器集合体(“OT细胞器”，图1)设计为具有以下组件：

i)mRNA靶向系统，其中将两个MS2 RNA茎环(MS2标签)与编码POI的所选mRNA融合，形成mRNA::ms2融合物。MS2标签与MS2细菌噬菌体外壳蛋白(MCP)特异性地结合(参见Bertrand et al.,Mol Cell 1998,2:437-445)，从而在细胞中形成稳定且特异性的mRNA::ms2–MCP复合物。MS2标签始终与mRNA的3'非翻译区(3'UTR)融合，这确保翻译以产生无痕的最终POI。

ii)tRNA/RS抑制子对。选择来自马氏甲烷八叠球菌吡咯赖氨酰系统(tRNA^Pyl/PylRS)的正交tRNA/RS对，因为其能够在多种细胞类型和物种(包括大肠杆菌，哺乳动物细胞甚至活小鼠)中，利用GCE将超过200种具有不同功能的ncAA编码为蛋白(参见，例如，Liuet al.,Annu Rev Biochem2010,79:413-444；Lemke,ChemBioChem 2014,15:1691-1694；Chin,Nature 2017,550；53-60)。

iii)组装器(AP)是形成OT组装器集合体所需的关键组件。组装器的目的是以致密相、聚集体、液滴或冷凝物的形式产生无膜结构，其中mRNA::ms2–MCP复合物与tRNA^Pyl/PylRS对紧密相邻。

测试的最简单策略是MCP::PylRS的双分子融合物(称为B，图2)。此外，还测试预期产生更大组装器集合体的策略。所有这些组装器集合体系统都包含与PylRS融合的组装器和与MCP融合的组装器的共同表达。组装器::PylRS·组装器::MCP预期形成大的聚集体(本文中的共表达用“·”表示)。一种测试的组装器集合体策略是基于蛋白的相分离，另一种是基于驱动蛋白的组装器集合体，在本文中分别缩写为P和K(图2A)。此外，对于每种P和K方法，测试两种不同的分子设计(分别为P1、P2和K1、K2)，总结如下：

P1.先前的研究已经确定蛋白融合肉瘤(FUS)和尤文肉瘤断点区域1(EWSR1)通过相分离形成混合液滴状结构的能力。它们都包含类似朊病毒的无序结构域，可促进相分离成液体、凝胶和固体状态(参见，例如，Altmeyer et al.,Nat Commun 2015,6:8088；Patelet al.,Cell 2015,162:1066-1077)。在相分离状态下，与细胞质中剩余的可溶性部分相比，这些蛋白在局部高度浓缩(几个数量级)。FUS与PylRS融合，并且EWSR1与MCP融合。预期这会导致形成其中高度富集MCP和PylRS的液滴。P1表示为FUS::PylRS·EWSR1::MCP。

P2.已显示秀丽隐杆线虫蛋白纺锤体缺陷蛋白5(SPD5)相分离成特别大(几个微米大小)的液滴(参见Woodruff et al.，Cell 2017,169:1066-1077,e1010)。在相分离状态下，与细胞质中剩余的可溶性部分相比，SPD5局部高度浓缩(几个数量级)。预期与SPD5融合的蛋白将凝结成液滴。与FUS-EWSR1液滴类似，预期与SPD5融合的PylRS和与SPD5融合的MCP会高度富集。P2表示为SPD5::PylRS·SPD5::MCP。

K1.某些截短驱动蛋白组成性地向活细胞中的微管正末端移动(Soppina et al.,Proc Natl Acad Sci U.S.A.2014,111:5562-5567)。一种这样的截短驱动蛋白为KIF13A_1-411,ΔP390，预期分别与这种截短驱动蛋白融合并共表达的PylRS和MCP会局部富集，由于空间靶向微管正末端。K1表示为KIF13A_1-411,ΔP390::PylRS·KIF13A_1-411,ΔP390::MCP。

K2.通过与K1类比，还测试了截短驱动蛋白KIF16B1-400。K2表示为KIF16B_1-400::PylRS·KIF16B_1-400::MCP。

为了评估这些组装器促进MS2标记的mRNA的功能性正交翻译的情况，设计一种双报告基因构建体，其中GFP和mCherry突变体从一个质粒的两个不同表达盒中同时表达，确保它们之间的mRNA比率在所有实验中都是恒定的。在容许位点将终止密码子引入GFP的第39位(GFP^39STOP)和mCherry的第185位(mCherry^185STOP；图2B)。仅当终止密码子抑制成功时，才会产生相应的绿色或红色荧光蛋白。通过荧光流式细胞术(FFC)分析转染的细胞(tRNA^Pyl和ncAA始终存在，除非另有特别说明)；如果使用无法区分mRNA的常规细胞质PylRS系统从该质粒表达GFP和mCherry，则调整设置以便在FFC图中产生近似对角线。只有当MS2标签与mCherry mRNA的3'UTR融合时，选择性和功能性OT细胞器才应选择性地表达mCherry，从而导致在细胞计数图中出现一条垂直线(图2B)。除非另有报道，所有实验均在tRNA^Pyl和ncAASCO存在下进行，这是一种广泛使用且特征明确的赖氨酸衍生物，其侧链带有环辛炔基，可用于各种点击化学反应以在蛋白上安装不同的化学基团。如以前报道的，这种ncAA由PylRS的Y306A、Y384F双突变体有效编码(为简单起见，除非另有说明，否则本文将这种突变体称为PylRS)(参见Nikic et al.,Angew Chem 2014,53:2245-2249；Plass,Angew Chem2012,51:4166-4170；Plass et al.,Angew Chem 2011,50:3878-3881)。省略ncAA作为标准阴性对照，导致没有GFP或mCherry的表达。

根据其选择性和相对效率评估每个OT系统的性能。选择性定义为平均mCherryFFC信号除以平均GFP信号的比率r。最终值表示为相对于细胞质PylRS的选择性倍数。相对效率定义为每个系统的平均mCherry信号除以作为参考的细胞质PylRS系统的平均mCherry信号(此处定义为100％)。关于选择性(深灰色正值条)和效率(浅灰色负值条)的所有结果总结在图2C的条形图中。选定的FFC数据也显示在图2D中。

最简单的策略B(MCP与PylRS融合)显示大约1.5倍的选择性增益(图2C)。OT系统P1(基于FUS/EWSR1的相分离)具有较低的选择性增益(图2C、D)。P2系统(基于SPD5)显示大约两倍的选择性增益(图2C)。对于K1，观察到选择性增加两倍(图2C)。K2系统的表现类似(图2C、D)。总体而言，选择性增益相对较小，但被可靠地检测到并与简单的效率下降区分开来。所观察到的选择性效应(数据未显示)在琥珀型抑制效率的滴定中是可靠的(具体地，分别使用0.48ng、2.4ng、12ng、60ng或300ng tRNA^Pyl构建体)，表明使ncAA氨酰化活性(即在ncAA存在下的tRNA^Pyl/PylRS)直接接近靶mRNA是一种更具选择性的密码子抑制途径。

实施例2–包含两种AP的组合的AFP

以类似方式测试包含实施例1中描述的AP的组合的AFP，它们是：

K1::P1＝KIF13A_{1–411,ΔP390}::FUS::PylRS·KIF13A_{1–411,ΔP390}::EWSR1::MCP，

K2::P1＝KIF16B_1–400::FUS::PylRS·KIF16B_1–400::EWSR1::MCP，

K1::P2＝KIF13A_{1–411,ΔP390}::SPD5::PylRS·KIF13A_{1–411,ΔP390}::SPD5::MCP，

K2::P2＝KIF16B_1–400::SPD5::PylRS·KIF16B_1–400::SPD5::MCP。

对于所有组合，观察到至少五倍的选择性增益，表明发生正交翻译。这些系统中表现最好的是基于FUS/EWSR1与KIF16B_1-400的融合，K2::P1，并表现出八倍的选择性(图2C中的框)。这在FFC数据中也很明显，其中清晰地保留明亮的mCherry阳性细胞群，而GFP表达极少(图2D中的箭头)。

实施例3–包含AP的组合的AFP，所述AP包括膜靶向AP

AFP包含源自相分离多肽(PSP)、FUS和EWSR1(本文也称为EWS)的AP的组合，其任选地融合到SYNZIP区段，并且以类似于实施例2的方式测试作为膜靶向信号的不同AP，LcK、EB1、CG1、EBAG9_全长、EBAG9_1-29、CMP Sia Tr P450 2C1_1-27和P450 2C1_1-29。

LcK是一种细胞膜靶向信号(Resh,Bba-Mol Cell Res 1999,1451:1-16)，其在翻译后向POI添加两亲性螺旋。对于这些实验，AFP LcK::FUS::PylRS和LcK::EWSR1::MCP在HE293T细胞中共表达(见图3和6C)。与PylRS对照相比，用相同的双报告基因测试这个系统导致信号的显著迁移以及仅对MS2标记的mCherry表达具有强选择性。参见图4和图5，显示与对照相比26倍的选择性增益。MCP、PylRS和tRNA的IF和FISH显示清晰的膜信号，偶尔出现液滴状结构，并且所有元件都完美地共定位。

不希望受理论束缚，假设将OT系统靶向到膜导致将元件限制在2D表面(即膜)，提供比细胞质液滴更高的空间分离。根据两种组合的组装器策略(用于膜靶向的LcK和用于液滴生成的FUS/EWSR1)的这种累积效应，表明为获得选择性琥珀型抑制，LcK-融合(以及由此形成的膜锚定系统)中对FUS/EWSR1“组装器”的存在不做要求(数据未显示)。尽管如此，LcK靶向与FUS/EWSR1的组合导致系统的更高选择性。此外，据发现交换荧光报告基因上的MS2标签，在FFC数据中产生交换的选择性，强调MS2标记的mRNA的选择性(正交)翻译。

对于进一步基于LcK的实验，AFP构建体LcK::FUS::SYNZIP1::PylRS和EWSR1::SYNZIP2::MCP在HE293T细胞中共表达(见图8A)。用相同的双报告基因测试这个系统导致信号的显著迁移以及仅对MS2标记的mCherry表达具有强选择性。表达后SYNZIP1和2配对并将MCP招募到基于质膜的OT细胞器。在共表达AFP构建体LcK::FUS::PylRS和EWSR1::SYNZIP2::MCP的比较方法中，其中缺少SYNZIP1，没有观察到翻译的选择性(见图8B)。

EB1是一种微管正末端靶向信号((Nehlig A,Molina A,Rodrigues-Ferreira S,HonoréS,Nahmias C.Regulation of end-binding protein EB1 in the control ofmicrotubule dynamics.Cell Mol Life Sci.2017；74(13):2381–2393.doi:10.1007/s00018-017-2476-2)。对于这些实验，AFP构建体EB1::PylRS与EB1::MCP、EB1:FUS::PylRS与EB1::EWSR1::MCP或EB1::FUS::MCP::PylRS在HE293T细胞中表达。与对照PylRS相比，用相同的双报告基因测试这个系统导致信号的迁移以及仅对MS2标记的mCherry表达具有强选择性。见图6B。

CG1是一种核膜靶向信号(Kim SJ,Fernandez-Martinez J,Nudelman I,etal.Integrative structure and functional anatomy of a nuclear porecomplex.Nature.2018；555(7697):475–482.doi:10.1038/nature26003)。对于这些实验，AFP构建体CG1::FUS::PylRS和CG1::EWSR1::MCP在HE293T细胞中共表达。与对照PylRS相比，用相同的双报告基因测试这个系统导致信号的迁移以及仅对MS2标记的mCherry表达具有强选择性。见图6E。

EBAG9_全长和EBAG9_1-29是高尔基体膜靶向信号(Engelsberg A,Hermosilla R,Karsten U,Schülein R,

B,Rehm A.The Golgi protein RCAS1 controls cellsurface expression of tumor-associated O-linked glycan antigens.J BiolChem.2003；278(25):22998–23007.doi:10.1074/jbc.M301361200)。对于这些实验，AFP构建体EBAG9_1-29::FUS::PylRS和EBAG9_1-29::EWSR1::MCP在HE293T细胞中共表达。与对照PylRS相比，用相同的双报告基因测试这个系统导致信号的迁移以及仅对MS2标记的mCherry表达具有强选择性。见图6F(左侧)。

CMP Sia Tr是一种高尔基体膜靶向信号(Eckhardt M,Gotza B,Gerardy-SchahnR.Membrane topology of the mammalian CMP-sialic acid transporter.J BiolChem.1999；274(13):8779–8787.doi:10.1074/jbc.274.13.8779)。对于这些实验，AFP构建体CMP Sia Tr::FUS::PylRS和CMP Sia Tr::MCP在HE293T细胞中共表达。与对照PylRS相比，用相同的双报告基因测试这个系统导致信号的迁移以及仅对MS2标记的mCherry表达具有强选择性。见图6F(右侧)。

P450 2C1_1-27是一种ER膜靶向信号(Fazal FM,Han S,Parker KR,et al.Atlas ofSubcellular RNA Localization Revealed by APEX-Seq.Cell.2019；178(2):473–490.e26.doi:10.1016/j.cell.2019.05.027)。对于这些实验，AFP构建体P450 2C1_1-27::FUS::PylRS和P450 2C1_1-27::EWSR1::MCP或P4502C1_1-29::FUS::MCP::PylRS在HE293T细胞中共表达。与对照PylRS相比，用相同的双报告基因测试这个系统导致信号的迁移以及仅对MS2标记的mCherry表达具有强选择性。见图6G。

实施例4–mRNAMS2标签和MCP相互作用所特有的选择性增益的验证

为了验证观察到的选择性增益是MCP区段与mRNA的MS2标签相互作用所特有的，通过在没有MCP的情况下表达每个OT系统的RS组装器融合物来表征所有OT系统。正如预期的那样，在这些情况下没有观察到MS2标记的mRNA的选择性正交翻译(见图6A到G)。此外，通过将MS2标签从mCherry移动到双色报告基因中的GFP盒中来进行报告基因反转，正如预期的，这反转系统对显性GFP表达的选择性(数据未显示)。这确定OT系统选择性地作用于MS2标记的RNA。

实施例5–将多个ncAA引入同一POI

GCE还可用于将多个ncAA引入同一POI(参见，例如，Liu et al.,Annu RevBiochem 2010,79:413-444；Lemke,ChemBioChem 2014,15:1691-1694；Chin,Nature 2017,550；53-60)。然而，只有极少数出版物报道真核生物中同一蛋白超过一个，即，两个或三个密码子抑制，因为与单密码子抑制相比，产量通常会受到影响(参见Xiao et al.,AngewChem 2013,52:14080-14083；Schmied et al.,J Am Chem Soc 2014,136:15577-15583；Zhang et al.,Biochem Biophys Res Co 2017,489:490-496)。值得注意的是，即使是双重和三重琥珀型蛋白仍被OT细胞器抑制(数据未显示)。

实施例6–具有3-碘苯丙氨酸的OT

为了确保其他ncAA也可以通过OT组装器集合体进行翻译，测试另一种结构不同的ncAA(3-碘苯丙氨酸)，它是苯丙氨酸衍生物而不是赖氨酸衍生物(例如SCO)，并且由不同的PylRS突变体(N346A，C348A)编码(参见Wang et al.,ACS Chem Biol 2013,8:405-415)。这个系统也观察到一致的结果(图2C)。

实施例7–具有不同选择密码子的OT

由于乳白和赭石密码子在真核生物基因组中非常丰富(人基因组中乳白占52％，赭石占28％)，因此琥珀密码子是迄今为止真核生物中最常用于GCE的密码子。此外，通过去除整个真核基因组中的那些密码子来进行正交翻译的基因组方法比琥珀密码子更具挑战性，并且目前超出现有技术水平。然而，在本发明的OT系统中，tRNA^Pyl的反密码子环以及MS2标记的POI编码mRNA中相应密码子中的简单突变允许这些密码子的正交翻译。FFC分析表明，本发明的OT系统提供关于终止(选择)密码子的选择自由(图2C、E)。事实上，乳白型抑制是性能最好的系统，选择性提高11倍。赭石型抑制仍然显示选择性提高5倍，效率提高20％。

实施例8–各种细胞区室蛋白的正交翻译

为了使OT^K2::P1系统(在选择性和效率方面表现最佳的琥珀型抑制OT系统)超越“简单”报告基因的能力可视化，旨在显示人核孔蛋白153(Nup153)与细胞骨架波形蛋白的差异表达。Nup153位于核孔复合体中，长度超过1500个氨基酸。因此，它的mRNA大约比以上使用的荧光蛋白报告基因大六倍。对于这个实验，使用先前描述的C端GFP融合物，其具有琥珀型突变(Nup153::EGFP^149TAG)，仅当琥珀型抑制成功时，才会在共聚焦成像中产生特征性核包膜染色(参见Nikic et al.,Angew Chem2016,55:16172-16276)。所述Nup153::EGFP^149TAG现在在mRNA水平上用MS2标签(nup153::egfp^149TAG::ms2)进行标记，并与波形蛋白(一种细胞骨架蛋白)从相同的质粒共表达，所述波形蛋白在第116位包含琥珀密码子，与mOrange融合(Vim^116TAG::mOrange)。在细胞质PylRS的存在下，HEK293T细胞中的表达导致两种蛋白的产生，分别显示出特征性的核包膜和细胞骨架染色。使用OT^K2::P1组装器集合体，仅Nup153::GFP可见(共转染HEK293T细胞的共聚焦成像中的选择性核边缘染色)。在COS7细胞中也观察到一致的结果。将MS标签交换为波形蛋白会反转效果，因此只有Vim^116TAG::mOrange可见(在COS-7和HEK293T细胞实验中均观察到)。这表明OT^K2::P1对截然不同的mRNA发挥作用。

实施例9-跨膜蛋白的正交翻译

还表明跨膜蛋白可以使用OT^K2::P1组装器集合体进行选择性表达。膜蛋白表达代表翻译复杂性的另一层次，因为核糖体在翻译过程中需要结合内质网，在内质网中蛋白被共翻译插入膜中。在这个实验中，使用在第676位具有琥珀密码子的胰岛素受体1与mOrange的融合物(INSR^676TAG::mOrange)，其位于质膜并在HEK293T细胞中产生特征性质膜染色(参见Nikic et al.,Angew Chem 2014,53:2245-2249)。将这个构建体在3'UTR中用MS2标签标记，并与Nup153::EGFP^149TAG克隆到一个双盒质粒中。然后，在细胞质PylRS系统或OT^K2::P1组装器集合体的存在下，在HEK293T细胞中表达构建体。在OT^K2::P1组装器集合体的存在下，观察到MS2标记蛋白的选择性表达和预期的INSR^676TAG::mOrange质膜定位(数据未显示)，表明本发明的OT系统参与更为复杂的膜相关翻译过程的潜力。

实施例10–细胞中OT系统元件的空间分布

采用免疫荧光(IF)评估AFP特别是PylRS在细胞中的空间分布。此外，采用荧光原位杂交(FISH)检测tRNA^Pyl。与上述FFC实验中使用的双色报告基因相比，在所有IF/FISH实验中，采用融合到MS2标签(nls-gfp^39TAG::ms2)的单色NLS-GFP^39TAG报告基因鉴定琥珀型抑制中的细胞活动(如果琥珀型抑制成功，则会产生绿色核，并有助于优化可区分的颜色通道)。IF和FISH染色显示，与细胞质PylRS相比，P1系统形成小的细胞内组装器::PylRS液滴(数据未显示)。这表明发生相分离。tRNA^Pyl与高度分散的组装器::PylRS液滴很好地共定位，表明tRNA^Pyl可以很好地分隔到组装器::PylRS相中。额外的染色显示其与组装器::MCP的进一步共定位(数据未显示)。与P1相比，P2系统显示更大但仍然是多分散的液滴状结构(数据未显示)。用两种组装策略(K1::P1、K2::P1、K1::P2、K2::P2)的组合，在细胞质中观察到大微米级细胞器样结构的形成，在大多数情况下，这些结构局限于每个细胞的几个甚至单个位置。对于组合的组装器，mRNA::ms2、tRNA^Pyl、组装器::PylRS和组装器::MCP都共定位于细胞器样结构。如通过FISH和IF确定的，两种组装器策略的组合，即，与截短驱动蛋白的空间靶向配对的相分离，产生最佳位置限制和最高选择性增加。这与以下假设一致：tRNA^Pyl、PylRS和mRNA的较高空间隔离和由此产生的较高局部浓度与较高的选择性相关。

对核糖体进行染色，以便观察其是否共定位到OT^K2::P1组装器集合体。核糖体蛋白RPL26L1的IF染色显示与OT^K2::P1细胞器的强共定位(数据未显示)，证明核糖体的招募暂时是由于在翻译过程中与mRNA::ms2结合。高核糖体迁移也可以解释为什么可以成功表达膜蛋白INSR(结构：INSR^676TAG::mOrange::ms2)。

不希望受理论束缚，实验结果强烈表明选择性正交翻译是通过一组招募的核糖体发生在靠近OT组装器集合体的位置，甚至可能在OT组装器集合体内部，所述核糖体靠近浓缩的tRNA^Pyl池或完全浸入浓缩的tRNA^Pyl池中。由于tRNA^Pyl对组装器::PylRS的亲和性，tRNA^Pyl本身被招募到OT^K2::P1组装器集合体中，并可以很容易地共分隔到液滴中与其同源的ncAA进行氨酰化，同时组装器::MCP招募MS2标记的mRNA。这反过来吸引核糖体共分隔到由双组装器系统(K2::P1＝KIF16B::FUS::PylRS和KIF16B::EWSR1::MCP)形成的致密相中，从而保持翻译的其他翻译因子进入并发挥作用。未暴露于tRNA^Pyl的细胞质中其他位置的核糖体在遇到终止密码子时执行其终止翻译的常规功能。

实施例11–其他OT系统

除了前述实施例中描述的OT系统之外，还测试各种其他OT系统，并发现其允许报告基因(即POI)的选择性正交翻译。这些实验的总结如下表1中所示。除非另有说明，否则如Nikic等人(Angew Chem Int Ed Engl 2016,55(52):16172-16176)先前描述的但使用相应的AF、AA或AAAF突变的细胞质NES-PylRS系统用作非特异性参考(阴性对照)。所有实验都在密码子特异性tRNA^Pyl和PylRS突变体对应的ncAA的存在下进行。

表1:测试的OT系统

实施例12–其他OT系统

除了前述实施例中描述的OT系统之外，还测试各种类似的OT系统，它们在mRNA靶向元件方面不同，并发现其允许报告基因(即POI)的选择性正交翻译。这些实验的总结如下表2中所示。结果如图7A、B和C所示。如Nikic等人(Angew Chem Int Ed Engl 2016,55(52):16172-16176)先前描述的细胞质NES-PylRS系统用作非特异性参考(阴性对照)。所有实验都在密码子特异性tRNA^Pyl和PylRS突变体对应的ncAA的存在下进行。

表2:测试的OT系统

结果示于图7A、B和C。

实施例13–测试的其他OT融合构建体

除了前述实施例中描述的OT系统之外，还制备并测试各种其他OT融合构建体，并发现其允许报告基因(即POI)的选择性正交翻译。测试构建体的总结如下表3中所示。除非另有说明，否则如Nikic等人(Angew Chem Int Ed Engl 2016,55(52):16172-16176)先前描述的但用相应的AF、AA或AAAF突变，或者Pyl RS突变体CpkRS、CbzRS、IFRS1和OMeRS其中之一的细胞质NES-PylRS系统用作非特异性参考(阴性对照)。

所有实验都在密码子特异性tRNA^Pyl和PylRS突变体对应的非典型氨基酸的存在下进行[例如CpkRS与环丙烯-L-赖氨酸，CbzRS与N(ε)-苄氧羰基-L-赖氨酸，IFRS-1与3-碘-L-苯丙氨酸，OMeRS与4-甲氧基-L-苯丙氨酸)]。

用各自的报告基因测试所有构建体，MCP采用ms2-环，λ_N22采用boxB-环，PCP采用pp7-环。

在所有融合构建体中，合成酶应可以自由互换。

对于SYNZIP构建体，重要的是注意SYNZIP1与SYNZIP2成对，SYNZIP3与SYNZIP4成对。原则上，描述的所有其他SYNZIP应当类似地工作(https://pubs.acs.org/doi/pdf/10.1021/ja907617a)。

表3:测试的OT融合构建体

AA：氨基酸序列

缩写

“-”或“::” 代表肽链的符号

“·” 代表多肽的组合的符号

AP 充当组装器的多肽区段

AFP 组装器融合蛋白

BSA 牛血清白蛋白

BoxB λ噬菌体RNA茎环，λ_N22的特异性结合位点

CbzRS 马氏甲烷八叠球菌PylRS(Y306M、L309G、C348T)

CDS 编码序列

CG1 靶向核膜的CG1(Nup42)核孔蛋白

CMPSiaTr 靶向高尔基体膜的CMP唾液酸转运蛋白

CpkRS 马氏甲烷八叠球菌PylRS(A302S

EB1 靶向微管正末端的EB1蛋白

EBAG9 SiSo细胞上表达的受体结合癌抗原

EBAG9_FL 靶向高尔基体膜的EBAG9全长蛋白

EBAG9_1-29 靶向高尔基体膜的EBAG9氨基酸残基1-29(N端)

EGFP^149TAG 增强型绿色荧光蛋白，氨基酸149位由琥珀密码子(TAG)编码

EP 充当效应器的多肽区段

ER 内质网

EWSR1 尤文肉瘤断点区域1(本文也称为EWS)

FBS 胎牛血清

FFC 荧光流式细胞术

FISH 荧光原位杂交

FRB-CD28 源自跨膜蛋白CD4、FRB(类似于mTOR)和CD28的合成膜靶向结构域

FSC-A 前向散射区域

FUS 融合肉瘤

FUS-CD28 (源自CD4、FUS和CD28的合成膜靶向融合多肽

GCE 遗传密码子扩展

GFP 绿色荧光蛋白

GFP^39TAA 绿色荧光蛋白，氨基酸39位由赭石密码子(TAA)编码

GFP^39TAG 绿色荧光蛋白，氨基酸39位由琥珀密码子(TAG)编码

GFP^39TGA 绿色荧光蛋白，氨基酸39位由乳白密码子(TGA)编码

GFP^39,149TAG 绿色荧光蛋白，氨基酸39和149位均由琥珀密码子(TAG)编码

GFP^{39,149,182TAG} 绿色荧光蛋白，氨基酸39、149和182位均由琥珀密码子(TAG)编码

IC-TP 细胞内靶向多肽

IDP 天然无序蛋白

IFRS1 马氏甲烷八叠球菌PylRS(L305M、Y306L、L309S、N346S、C348M)

INSR 胰岛素受体

INSR^676TAG 胰岛素受体，氨基酸676位由琥珀密码子(TAG)编码

iRFP 近红外荧光蛋白

KIF13A 驱动蛋白家族成员13A-除非本文另有说明，否则“KIF13A”特指覆盖KIF13A的氨基酸残基1-411的片段，其中P390缺失(KIF13A_{1-411，ΔP390})

KIF16B 驱动蛋白家族成员16B-除非本文另有说明，否则“KIF16B”特指覆盖KIF16B的氨基酸残基1-400的片段(KIF16B_1-400)

λ_N22 λ噬菌体抗终止子蛋白N的22个氨基酸的RNA结合结构域

LcK 用于淋巴细胞特异性蛋白酪氨酸激酶的质膜靶向的翻译后修饰位点

mCherry^185TAG mCherry，氨基酸185位由琥珀密码子(TAG)编码

MCP MS2细菌噬菌体外壳蛋白

MLC 无膜区室

MS2 肠杆菌噬菌体MS2

MS2-tag 与mRNA的3'非翻译区(或其编码序列)融合的两个MS2 RNA茎环

ms2 MS2标签

ncAA 非典型氨基酸

NLS 核定位序列

Nup153 核孔蛋白153

O-RS 正交氨酰tRNA合成酶

OMeRS 马氏甲烷八叠球菌PyrRS(A302T、Y384F、N346V、C348W、V401L)

OT组装器集合体在无膜组装器集合体中空间富集的GCE系统组件，其能够充当人工正交翻译(OT)细胞器

P450 2C1_1-27 靶向ER膜的P450 2C1残基1-27(N端)

PBS 磷酸盐缓冲溶液

PCP 靶向pp7环标签的细菌噬菌体外壳蛋白

PEI 聚乙烯亚胺

POI 感兴趣的多肽(＝靶多肽)

POI^TAG 包含琥珀-(TAG-)编码的氨基酸残基的POI(或其编码序列)

pp7 来自RNA细菌噬菌体pp7的pp7环标签

PSP 相分离多肽

PylRS 吡咯赖氨酰tRNA合成酶

PylRS^AA 突变的马氏甲烷八叠球菌吡咯赖氨酰tRNA合成酶，包含氨基酸取代N346A和C348A

PylRS^AF 突变的马氏甲烷八叠球菌吡咯赖氨酰tRNA合成酶，包含氨基酸取代Y306A和Y384F

PylRS^AAAF 突变的马氏甲烷八叠球菌吡咯赖氨酰tRNA合成酶，包含氨基酸取代Y306A、N346A、C348A和Y384F

RNA-TP 靶向RNA的多肽

RS 氨酰tRNA合成酶

RT 室温

SCO 环辛炔赖氨酸

SEM 平均值的标准误差

SSC 盐水-柠檬酸钠(缓冲液)

SSC-A 侧向散射区域

SSC-W 侧向散射宽度

SPD5 纺锤体缺陷蛋白5

SYNZIP1 合成卷曲螺旋肽1

SYNZIP2 合成卷曲螺旋肽2

SYNZIP3 合成卷曲螺旋肽3

SYNZIP4 合成卷曲螺旋肽4

TOMM20 线粒体外膜转位酶20

TOMM20_1-70 覆盖TOMM20的氨基酸残基1-70的片段

tRNA^Pyl tRNA，其通过野生型或修饰的PylRS与吡咯赖氨酰或另一非典型氨基酸残基偶联并具有反密码子，所述反密码子用于将(非典型)氨基酸残基位点特异性地掺入POI中，优选为选择密码子的反向互补序列。-实施例中使用的tRNA^Pyl携带针对终止密码子琥珀(tRNA^Pyl,CUA)、赭石(tRNA^Pyl,UUA)或乳白(tRNA^Pyl,UCA)的反密码子，取决于这些中的哪一个用作POI编码序列中的选择密码子。

3'UTR 3'非翻译区

Vim^116TAG 波形蛋白，氨基酸116位由琥珀密码子(TAG)编码

序列

下节示出本文所述的多肽和多核苷酸的序列。

核酸序列以5’至3’方向表示，蛋白序列以N端至C端表示。

序列-集合1

1.杂交探针

在5’端用Cy5标记的tRNA^Pyl的杂交探针

CTAACCCGGCTGAACGGATTTAGAGTCCATTCGATC(SEQ ID NO:1)

在5’端用地高辛标记的tRNA^Pyl的杂交探针

CTAACCCGGCTGAACGGATTTAGAGTCCATTCGATC(SEQ ID NO:2)

在5’端用Alexa Fluor 647标记的MS2 RNA茎环序列的杂交探针

CTGCAGACATGGGTGATCCTCATGTTTTCTA(SEQ ID NO:3)

2.tRNA

tRNA^Pyl,CUA的DNA序列(琥珀密码子的马氏甲烷八叠球菌的吡咯赖氨酰tRNA；下划线示出反密码子)

GGAAACCTGATCATGTAGATCGAATGGACTCTAAATCCGTTCAGCCGGGTTAGATTCCCGGGGTTTCCG(SEQ ID NO:4)

tRNA^Pyl,UCA的DNA序列(乳白密码子的马氏甲烷八叠球菌的吡咯赖氨酰tRNA；下划线示出反密码子)

GGAAACCTGATCATGTAGATCGAATGGACTTCAAATCCGTTCAGCCGGGTTAGATTCCCGGGGTTTCCG(SEQ ID NO:5)

tRNA^Pyl,UUA的DNA序列(赭石密码子的马氏甲烷八叠球菌的吡咯赖氨酰tRNA；下划线示出反密码子)GGAAACCTGATCATGTAGATCGAATGGACTTTAAATCCGTTCAGCCGGGTTAGATTCCCGGGGTTTCCG(SEQ ID NO:6)

3.O-RS

PylRS^AF(马氏甲烷八叠球菌吡咯赖氨酰tRNA合成酶双突变体：Y306A、Y384F；Uniprot:Q8PWY1)

DNA:

ATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:7)

蛋白:MACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:8)

PylRS^AA(马氏甲烷八叠球菌吡咯赖氨酰tRNA合成酶双突变体：N346A、C348A；Uniprot:Q8PWY1)

DNA:

ATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:9)

蛋白:

MACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:10)

PylRS^AAAF(马氏甲烷八叠球菌吡咯赖氨酰tRNA合成酶四突变体:Y306A、N346A、C348A、Y384F；Uniprot:Q8PWY1)

DNA:

GCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:11)

蛋白:

ACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:12)

4.RNA-TP

MCP(肠杆菌噬菌体MS2的外壳蛋白)

DNA:

GCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTAC(SEQ ID NO:13)

蛋白:

ASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNM ELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(SEQ ID NO:14)

λ_N22(λ噬菌体抗终止子蛋白N的22个氨基酸的RNA结合结构域)

DNA:

ATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAAC(SEQ ID NO:15)

蛋白:

MDAQTRRRERRAEKQAQWKAAN(SEQ ID NO:16)

5.TN

肠杆菌噬菌体MS2 RNA茎环的DNA序列

ACATGAGGATCACCCATGT(SEQ ID NO:17)

BoxB的DNA序列(λ噬菌体RNA茎环，λ_N22的特异性结合位点)

GCCCTGAAAAAGGGC(SEQ ID NO:18)

6.IC-TPKIF16B_1-400(智人驱动蛋白家族成员16B片段，覆盖氨基酸残基1-400；Uniprot:Q96L93)DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACA(SEQ IDNO:19)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPT(SEQ ID NO:20)

KIF13A_1-411,ΔP390(智人驱动蛋白家族成员13A片段，覆盖氨基酸残基1-411，其中P390缺失；Uniprot:Q9H1H9)

DNA:

ATGTCGGATACCAAGGTAAAAGTTGCCGTCCGGGTCCGGCCCATGAACCGACGAGAACTGGAACTGAACACCAAGTGCGTGGTGGAGATGGAAGGGAATCAAACGGTCCTGCACCCTCCTCCTTCTAACACCAAACAGGGAGAAAGGAAACCTCCCAAGGTATTTGCCTTTGATTATTGCTTTTGGTCCATGGATGAATCTAACACTACAAAATACGCTGGTCAAGAAGTGGTTTTCAAGTGCCTTGGGGAAGGAATTCTTGAAAAAGCCTTTCAGGGGTATAATGCGTGTATTTTTGCATATGGACAGACAGGTTCGGGAAAATCCTTTTCCATGATGGGCCATGCTGAGCAGCTGGGCCTTATTCCAAGGCTCTGCTGTGCTTTATTTAAAAGGATCTCTTTGGAGCAAAATGAGTCACAGACCTTTAAAGTTGAAGTGTCCTATATGGAAATTTATAATGAGAAAGTTCGGGATCTTTTAGACCCCAAAGGGAGTAGACAGTCTCTTAAAGTTCGAGAACATAAAGTTTTGGGACCATATGTAGATGGTTTATCTCAACTAGCTGTCACTAGTTTTGAGGATATTGAGTCATTGATGTCTGAGGGAAATAAGTCTCGAACGGTAGCTGCTACCAACATGAACGAAGAAAGCAGCCGCTCCCATGCTGTGTTCAACATCATAATCACACAGACACTTTATGACCTGCAGTCTGGGAATTCCGGGGAGAAAGTCAGTAAGGTCAGCTTGGTAGACCTGGCGGGTAGCGAAAGAGTATCTAAAACAGGAGCTGCAGGAGAGCGACTGAAAGAAGGCAGCAACATTAACAAATCGCTTACAACCTTGGGGTTGGTTATATCATCACTGGCTGACCAGGCAGCTGGCAAGGGTAAAAGCAAATTTGTGCCTTATCGAGATTCAGTCCTCACTTGGCTGCTTAAGGACAACTTGGGGGGCAACAGCCAAACCTCTATGATAGCCACAATCAGCCCAGCCGCAGACAACTATGAAGAGACCCTCTCCACATTAAGATATGCAGACCGAGCCAAAAGGATTGTGAACCATGCTGTTGTGAATGAGGACCCCAACGCAAAAGTGATCCGAGAACTGCGGGAGGAAGTCGAGAAACTGAGAGAGCAGCTCTCTCAGGCAGAGGCCATGAAGGCCGAACTGAAGGAGAAGCTCGAAGAGTCTGAAAAGCTGATAAAAGAACTAACAGTGACTTGGGAA(SEQ ID NO:21)

蛋白:

MSDTKVKVAVRVRPMNRRELELNTKCVVEMEGNQTVLHPPPSNTKQGERKPPKVFAFDYCFWSMDESNTTKYAGQEVVFKCLGEGILEKAFQGYNACIFAYGQTGSGKSFSMMGHAEQLGLIPRLCCALFKRISLEQNESQTFKVEVSYMEIYNEKVRDLLDPKGSRQSLKVREHKVLGPYVDGLSQLAVTSFEDIESLMSEGNKSRTVAATNMNEESSRSHAVFNIIITQTLYDLQSGNSGEKVSKVSLVDLAGSERVSKTGAAGERLKEGSNINKSLTTLGLVISSLADQAAGKGKSKFVPYRDSVLTWLLKDNLGGNSQTSMIATISPAADNYEETLSTLRYADRAKRIVNHAVVNEDPNAKVIRELREEVEKLREQLSQAEAMKAELKEKLEESEKLIKELTVTWE(SEQ ID NO:22)

TOMM20_1-70(智人线粒体外膜转位酶20片段，覆盖氨基酸残基1-70；Uniprot:Q15388)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTC(SEQ ID NO:23)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFF(SEQ ID NO:24)

LcK(用于小家鼠淋巴细胞特异性蛋白酪氨酸激酶的质膜靶向的翻译后修饰位点；Uniprot:P06240)DNA:

GGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTC(SEQ ID NO:25)

蛋白:(下划线示出相同部分P06240)

GCVCSSNPEGTEL(SEQ ID NO:26)

FRB-CD28(源自小家鼠CD4(Uniprot:P06332)、FRB(与智人mTOR相似；Uniprot:P42345)和小家鼠CD28(Uniprot:P31041)的合成膜靶向融合多肽)

DNA:ATGTGCCGAGCCATCTCTCTTAGGCGCTTGCTGCTGCTGCTGCTGCAGCTGTCACAACTCCTAGCTGTCACTCAAGGGATGCTCGAGATGTGGCATGAAGGCCTGGAAGAGGCATCTCGTTTGTACTTTGGGGAAAGGAACGTGAAAGGCATGTTTGAGGTGCTGGAGCCCTTGCATGCTATGATGGAACGGGGCCCCCAGACTCTGAAGGAAACATCCTTTAATCAGGCCTATGGTCGAGATTTAATGGAGGCCCAAGAGTGGTGCAGGAAGTACATGAAATCAGGGAATGTCAAGGACCTCCTCCAAGCCTGGGACCTCTATTATCATGTGTTCCGACGAATCTCAAAGACTAGAACCGGTAAGCTTTTTTGGGCACTGGTCGTGGTTGCTGGAGTCCTGTTTTGTTATGGCTTGCTAGTGACAGTGGCTCTTTGTGTT(SEQID NO:27)

蛋白:

MCRAISLRRLLLLLLQLSQLLAVTQGMLEMWHEGLEEASRLYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFNQAYGRDLMEAQEWCRKYMKSGNVKDLLQAWDLYYHVFRRISKTRTGKLFWALVVVAGVLFCYGLLVTVALCV(SEQ ID NO:28)

FUS-CD28(源自小家鼠CD4(Uniprot:P06332)、智人融合肉瘤(Uniprot:P35637)和小家鼠CD28(Uniprot:P31041)的合成膜靶向融合多肽)

DNA:

ATGTGCCGAGCCATCTCTCTTAGGCGCTTGCTGCTGCTGCTGCTGCAGCTGTCACAACTCCTAGCTGTCACTCAAGGGATGCTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCACCGGTAAGCTTTTTTGGGCACTGGTCGTGGTTGCTGGAGTCCTGTTTTGTTATGGCTTGCTAGTGACAGTGGCTCTTTGTGTT(SEQ ID NO:29)

蛋白:

MCRAISLRRLLLLLLQLSQLLAVTQGMLMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGTGKLFWALVVVAGVLFCYGLLVTVALCV(SEQ ID NO:30)

7.PSP

SPD5(秀丽隐杆线虫纺锤体缺陷蛋白5；Uniprot:P91349)

DNA:

ATGGAGGACAACAGCGTGCTGAACGAGGACAGCAACCTGGAGCACGTGGAGGGCCAGCCCAGAAGAAGCATGAGCCAGCCCGTGCTGAACGTGGAGGGCGACAAGAGAACCAGCAGCACCAGCGCCACCCAGCAGCAGGTGCTGAGCGGCGCCTTCAGCAGCGCCGACGTGAGAAGCATCCCCATCATCCAGACCTGGGAGGAGAACAAGGCCCTGAAGACCAAGATCACCATCCTGAGAGGCGAGCTGCAGATGTACCAGAGAAGATACAGCGAGGCCAAGGAGGCCAGCCAGAAGAGAGTGAAGGAGGTGATGGACGACTACGTGGACCTGAAGCTGGGCCAGGAGAACGTGCAGGAGAAGATGGAGCAGTACAAGCTGATGGAGGAGGACCTGCTGGCCATGCAGAGCAGAATCGAGACCAGCGAGGACAACTTCGCCAGACAGATGAAGGAGTTCGAGGCCCAGAAGCACGCCATGGAGGAGAGAATCAAGGAGCTGGAGCTGAGCGCCACCGACGCCAACAACACCACCGTGGGCAGCTTCAGAGGCACCCTGGACGACATCCTGAAGAAGAACGACCCCGACTTCACCCTGACCAGCGGCTACGAGGAGAGAAAGATCAACGACCTGGAGGCCAAGCTGCTGAGCGAGATCGACAAGGTGGCCGAGCTGGAGGACCACATCCAGCAGCTGAGACAGGAGCTGGACGACCAGAGCGCCAGACTGGCCGACAGCGAGAACGTGAGAGCCCAGCTGGAGGCCGCCACCGGCCAGGGCATCCTGGGCGCCGCCGGCAACGCCATGGTGCCCAACAGCACCTTCATGATCGGCAACGGCAGAGAGAGCCAGACCAGAGACCAGCTGAACTACATCGACGACCTGGAGACCAAGCTGGCCGACGCCAAGAAGGAGAACGACAAGGCCAGACAGGCCCTGGTGGAGTACATGAACAAGTGCAGCAAGCTGGAGCACGAGATCAGAACCATGGTGAAGAACAGCACCTTCGACAGCAGCAGCATGCTGCTGGGCGGCCAGACCAGCGACGAGCTGAAGATCCAGATCGGCAAGGTGAACGGCGAGCTGAACGTGCTGAGAGCCGAGAACAGAGAGCTGAGAATCAGATGCGACCAGCTGACCGGCGGCGACGGCAACCTGAGCATCAGCCTGGGCCAGAGCAGACTGATGGCCGGCATCGCCACCAACGACGTGGACAGCATCGGCCAGGGCAACGAGACCGGCGGCACCAGCATGAGAATCCTGCCCAGAGAGAGCCAGCTGGACGACCTGGAGGAGAGCAAGCTGCCCCTGATGGACACCAGCAGCGCCGTGAGAAACCAGCAGCAGTTCGCCAGCATGTGGGAGGACTTCGAGAGCGTGAAGGACAGCCTGCAGAACAACCACAACGACACCCTGGAGGGCAGCTTCAACAGCAGCATGCCCCCCCCCGGCAGAGACGCCACCCAGAGCTTCCTGAGCCAGAAGAGCTTCAAGAACAGCCCCATCGTGATGCAGAAGCCCAAGAGCCTGCACCTGCACCTGAAGAGCCACCAGAGCGAGGGCGCCGGCGAGCAGATCCAGAACAACAGCTTCAGCACCAAGACCGCCAGCCCCCACGTGAGCCAGAGCCACATCCCCATCCTGCACGACATGCAGCAGATCCTGGACAGCAGCGCCATGTTCCTGGAGGGCCAGCACGACGTGGCCGTGAACGTGGAGCAGATGCAGGAGAAGATGAGCCAGATCAGAGAGGCCCTGGCCAGACTGTTCGAGAGACTGAAGAGCAGCGCCGCCCTGTTCGAGGAGATCCTGGAGAGAATGGGCAGCAGCGACCCCAACGCCGACAAGATCAAGAAGATGAAGCTGGCCTTCGAGACCAGCATCAACGACAAGCTGAACGTGAGCGCCATCCTGGAGGCCGCCGAGAAGGACCTGCACAACATGAGCCTGAACTTCAGCATCCTGGAGAAGAGCATCGTGAGCCAGGCCGCCGAGGCCAGCAGAAGATTCACCATCGCCCCCGACGCCGAGGACGTGGCCAGCAGCAGCCTGCTGAACGCCAGCTACAGCCCCCTGTTCAAGTTCACCAGCAACAGCGACATCGTGGAGAAGCTGCAGAACGAGGTGAGCGAGCTGAAGAACGAGCTGGAGATGGCCAGAACCAGAGACATGAGAAGCCCCCTGAACGGCAGCAGCGGCAGACTGAGCGACGTGCAGATCAACACCAACAGAATGTTCGAGGACCTGGAGGTGAGCGAGGCCACCCTGCAGAAGGCCAAGGAGGAGAACAGCACCCTGAAGAGCCAGTTCGCCGAGCTGGAGGCCAACCTGCACCAGGTGAACAGCAAGCTGGGCGAGGTGAGATGCGAGCTGAACGAGGCCCTGGCCAGAGTGGACGGCGAGCAGGAGACCAGAGTGAAGGCCGAGAACGCCCTGGAGGAGGCCAGACAGCTGATCAGCAGCCTGAAGCACGAGGAGAACGAGCTGAAGAAGACCATCACCGACATGGGCATGAGACTGAACGAGGCCAAGAAGAGCGACGAGTTCCTGAAGAGCGAGCTGAGCACCGCCCTGGAGGAGGAGAAGAAGAGCCAGAACCTGGCCGACGAGCTGAGCGAGGAGCTGAACGGCTGGAGAATGAGAACCAAGGAGGCCGAGAACAAGGTGGAGCACGCCAGCAGCGAGAAGAGCGAGATGCTGGAGAGAATCGTGCACCTGGAGACCGAGATGGAGAAGCTGAGCACCAGCGAGATCGCCGCCGACTACTGCAGCACCAAGATGACCGAGAGAAAGAAGGAGATCGAGCTGGCCAAGTACAGAGAGGACTTCGAGAACGCCGCCATCGTGGGCCTGGAGAGAATCAGCAAGGAGATCAGCGAGCTGACCAAGAAGACCCTGAAGGCCAAGATCATCCCCAGCAACATCAGCAGCATCCAGCTGGTGTGCGACGAGCTGTGCAGAAGACTGAGCAGAGAGAGAGAGCAGCAGCACGAGTACGCCAAGGTGATGAGAGACGTGAACGAGAAGATCGAGAAGCTGCAGCTGGAGAAGGACGCCCTGGAGCACGAGCTGAAGATGATGAGCAGCAACAACGAGAACGTGCCCCCCGTGGGCACCAGCGTGAGCGGCATGCCCACCAAGACCAGCAACCAGAAGTGCGCCCAGCCCCACTACACCAGCCCCACCAGACAGCTGCTGCACGAGAGCACCATGGCCGTGGACGCCATCGTGCAGAAGCTGAAGAAGACCCACAACATGAGCGGCATGGGCCCCGAGCTGAAGGAGACCATCGGCAACGTGATCAACGAGAGCAGAGTGCTGAGAGACTTCCTGCACCAGAAGCTGATCCTGTTCAAGGGCATCGACATGAGCAACTGGAAGAACGAGACCGTGGACCAGCTGATCACCGACCTGGGCCAGCTGCACCAGGACAACCTGATGCTGGAGGAGCAGATCAAGAAGTACAAGAAGGAGCTGAAGCTGACCAAGAGCGCCATCCCCACCCTGGGCGTGGAGTTCCAGGACAGAATCAAGACCGAGATCGGCAAGATCGCCACCGACATGGGCGGCGCCGTGAAGGAGATCAGAAAGAAG(SEQ ID NO:31)

蛋白:

MEDNSVLNEDSNLEHVEGQPRRSMSQPVLNVEGDKRTSSTSATQQQVLSGAFSSADVRSIPIIQTWEENKALKTKITILRGELQMYQRRYSEAKEASQKRVKEVMDDYVDLKLGQENVQEKMEQYKLMEEDLLAMQSRIETSEDNFARQMKEFEAQKHAMEERIKELELSATDANNTTVGSFRGTLDDILKKNDPDFTLTSGYEERKINDLEAKLLSEIDKVAELEDHIQQLRQELDDQSARLADSENVRAQLEAATGQGILGAAGNAMVPNSTFMIGNGRESQTRDQLNYIDDLETKLADAKKENDKARQALVEYMNKCSKLEHEIRTMVKNSTFDSSSMLLGGQTSDELKIQIGKVNGELNVLRAENRELRIRCDQLTGGDGNLSISLGQSRLMAGIATNDVDSIGQGNETGGTSMRILPRESQLDDLEESKLPLMDTSSAVRNQQQFASMWEDFESVKDSLQNNHNDTLEGSFNSSMPPPGRDATQSFLSQKSFKNSPIVMQKPKSLHLHLKSHQSEGAGEQIQNNSFSTKTASPHVSQSHIPILHDMQQILDSSAMFLEGQHDVAVNVEQMQEKMSQIREALARLFERLKSSAALFEEILERMGSSDPNADKIKKMKLAFETSINDKLNVSAILEAAEKDLHNMSLNFSILEKSIVSQAAEASRRFTIAPDAEDVASSSLLNASYSPLFKFTSNSDIVEKLQNEVSELKNELEMARTRDMRSPLNGSSGRLSDVQINTNRMFEDLEVSEATLQKAKEENSTLKSQFAELEANLHQVNSKLGEVRCELNEALARVDGEQETRVKAENALEEARQLISSLKHEENELKKTITDMGMRLNEAKKSDEFLKSELSTALEEEKKSQNLADELSEELNGWRMRTKEAENKVEHASSEKSEMLERIVHLETEMEKLSTSEIAADYCSTKMTERKKEIELAKYREDFENAAIVGLERISKEISELTKKTLKAKIIPSNISSIQLVCDELCRRLSREREQQHEYAKVMRDVNEKIEKLQLEKDALEHELKMMSSNNENVPPVGTSVSGMPTKTSNQKCAQPHYTSPTRQLLHESTMAVDAIVQKLKKTHNMSGMGPELKETIGNVINESRVLRDFLHQKLILFKGIDMSNWKNETVDQLITDLGQLHQDNLMLEEQIKKYKKELKLTKSAIPTLGVEFQDRIKTEIGKIATDMGGAVKEIRKK(SEQ ID NO:32)

FUS(智人融合肉瘤；Uniprot:P35637)

DNA:

ATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGC(SEQ ID NO:33)

蛋白:

MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGG(SEQ ID NO:34)

EWSR1(智人尤文肉瘤断点区域1；Uniprot:Q01844)

DNA:

ATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCCACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAG(SEQ IDNO:35)

蛋白:

MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQS SYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQ(SEQ I D NO:36)

8.AFP

EWSR1-MCP

DNA:

ATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCCACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATTACAAGGATGACGACGATAAGGGTACCGAGCAGAAGCTGATCTCAGAGGAGGACCTGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ I D NO:37)

蛋白:

MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDYKDDDDKGTEQKLISEEDLGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(SEQ ID NO:38)

FUS-MCP

DNA:

ATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGAGCAGAAGCTGATCTCAGAGGAGGACCTGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ IDNO:39)

蛋白:

MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTEQKLISEEDLGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(SEQ ID NO:40)

FUS-PylRS^AF

DNA:

ATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:41)

蛋白:

MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:42)

MCP-PylRS^AF

DNA:

ATGGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ IDNO:43)

蛋白:

MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:44)

SPD5-MCP

DNA:

ATGGAGGACAACAGCGTGCTGAACGAGGACAGCAACCTGGAGCACGTGGAGGGCCAGCCCAGAAGAAGCATGAGCCAGCCCGTGCTGAACGTGGAGGGCGACAAGAGAACCAGCAGCACCAGCGCCACCCAGCAGCAGGTGCTGAGCGGCGCCTTCAGCAGCGCCGACGTGAGAAGCATCCCCATCATCCAGACCTGGGAGGAGAACAAGGCCCTGAAGACCAAGATCACCATCCTGAGAGGCGAGCTGCAGATGTACCAGAGAAGATACAGCGAGGCCAAGGAGGCCAGCCAGAAGAGAGTGAAGGAGGTGATGGACGACTACGTGGACCTGAAGCTGGGCCAGGAGAACGTGCAGGAGAAGATGGAGCAGTACAAGCTGATGGAGGAGGACCTGCTGGCCATGCAGAGCAGAATCGAGACCAGCGAGGACAACTTCGCCAGACAGATGAAGGAGTTCGAGGCCCAGAAGCACGCCATGGAGGAGAGAATCAAGGAGCTGGAGCTGAGCGCCACCGACGCCAACAACACCACCGTGGGCAGCTTCAGAGGCACCCTGGACGACATCCTGAAGAAGAACGACCCCGACTTCACCCTGACCAGCGGCTACGAGGAGAGAAAGATCAACGACCTGGAGGCCAAGCTGCTGAGCGAGATCGACAAGGTGGCCGAGCTGGAGGACCACATCCAGCAGCTGAGACAGGAGCTGGACGACCAGAGCGCCAGACTGGCCGACAGCGAGAACGTGAGAGCCCAGCTGGAGGCCGCCACCGGCCAGGGCATCCTGGGCGCCGCCGGCAACGCCATGGTGCCCAACAGCACCTTCATGATCGGCAACGGCAGAGAGAGCCAGACCAGAGACCAGCTGAACTACATCGACGACCTGGAGACCAAGCTGGCCGACGCCAAGAAGGAGAACGACAAGGCCAGACAGGCCCTGGTGGAGTACATGAACAAGTGCAGCAAGCTGGAGCACGAGATCAGAACCATGGTGAAGAACAGCACCTTCGACAGCAGCAGCATGCTGCTGGGCGGCCAGACCAGCGACGAGCTGAAGATCCAGATCGGCAAGGTGAACGGCGAGCTGAACGTGCTGAGAGCCGAGAACAGAGAGCTGAGAATCAGATGCGACCAGCTGACCGGCGGCGACGGCAACCTGAGCATCAGCCTGGGCCAGAGCAGACTGATGGCCGGCATCGCCACCAACGACGTGGACAGCATCGGCCAGGGCAACGAGACCGGCGGCACCAGCATGAGAATCCTGCCCAGAGAGAGCCAGCTGGACGACCTGGAGGAGAGCAAGCTGCCCCTGATGGACACCAGCAGCGCCGTGAGAAACCAGCAGCAGTTCGCCAGCATGTGGGAGGACTTCGAGAGCGTGAAGGACAGCCTGCAGAACAACCACAACGACACCCTGGAGGGCAGCTTCAACAGCAGCATGCCCCCCCCCGGCAGAGACGCCACCCAGAGCTTCCTGAGCCAGAAGAGCTTCAAGAACAGCCCCATCGTGATGCAGAAGCCCAAGAGCCTGCACCTGCACCTGAAGAGCCACCAGAGCGAGGGCGCCGGCGAGCAGATCCAGAACAACAGCTTCAGCACCAAGACCGCCAGCCCCCACGTGAGCCAGAGCCACATCCCCATCCTGCACGACATGCAGCAGATCCTGGACAGCAGCGCCATGTTCCTGGAGGGCCAGCACGACGTGGCCGTGAACGTGGAGCAGATGCAGGAGAAGATGAGCCAGATCAGAGAGGCCCTGGCCAGACTGTTCGAGAGACTGAAGAGCAGCGCCGCCCTGTTCGAGGAGATCCTGGAGAGAATGGGCAGCAGCGACCCCAACGCCGACAAGATCAAGAAGATGAAGCTGGCCTTCGAGACCAGCATCAACGACAAGCTGAACGTGAGCGCCATCCTGGAGGCCGCCGAGAAGGACCTGCACAACATGAGCCTGAACTTCAGCATCCTGGAGAAGAGCATCGTGAGCCAGGCCGCCGAGGCCAGCAGAAGATTCACCATCGCCCCCGACGCCGAGGACGTGGCCAGCAGCAGCCTGCTGAACGCCAGCTACAGCCCCCTGTTCAAGTTCACCAGCAACAGCGACATCGTGGAGAAGCTGCAGAACGAGGTGAGCGAGCTGAAGAACGAGCTGGAGATGGCCAGAACCAGAGACATGAGAAGCCCCCTGAACGGCAGCAGCGGCAGACTGAGCGACGTGCAGATCAACACCAACAGAATGTTCGAGGACCTGGAGGTGAGCGAGGCCACCCTGCAGAAGGCCAAGGAGGAGAACAGCACCCTGAAGAGCCAGTTCGCCGAGCTGGAGGCCAACCTGCACCAGGTGAACAGCAAGCTGGGCGAGGTGAGATGCGAGCTGAACGAGGCCCTGGCCAGAGTGGACGGCGAGCAGGAGACCAGAGTGAAGGCCGAGAACGCCCTGGAGGAGGCCAGACAGCTGATCAGCAGCCTGAAGCACGAGGAGAACGAGCTGAAGAAGACCATCACCGACATGGGCATGAGACTGAACGAGGCCAAGAAGAGCGACGAGTTCCTGAAGAGCGAGCTGAGCACCGCCCTGGAGGAGGAGAAGAAGAGCCAGAACCTGGCCGACGAGCTGAGCGAGGAGCTGAACGGCTGGAGAATGAGAACCAAGGAGGCCGAGAACAAGGTGGAGCACGCCAGCAGCGAGAAGAGCGAGATGCTGGAGAGAATCGTGCACCTGGAGACCGAGATGGAGAAGCTGAGCACCAGCGAGATCGCCGCCGACTACTGCAGCACCAAGATGACCGAGAGAAAGAAGGAGATCGAGCTGGCCAAGTACAGAGAGGACTTCGAGAACGCCGCCATCGTGGGCCTGGAGAGAATCAGCAAGGAGATCAGCGAGCTGACCAAGAAGACCCTGAAGGCCAAGATCATCCCCAGCAACATCAGCAGCATCCAGCTGGTGTGCGACGAGCTGTGCAGAAGACTGAGCAGAGAGAGAGAGCAGCAGCACGAGTACGCCAAGGTGATGAGAGACGTGAACGAGAAGATCGAGAAGCTGCAGCTGGAGAAGGACGCCCTGGAGCACGAGCTGAAGATGATGAGCAGCAACAACGAGAACGTGCCCCCCGTGGGCACCAGCGTGAGCGGCATGCCCACCAAGACCAGCAACCAGAAGTGCGCCCAGCCCCACTACACCAGCCCCACCAGACAGCTGCTGCACGAGAGCACCATGGCCGTGGACGCCATCGTGCAGAAGCTGAAGAAGACCCACAACATGAGCGGCATGGGCCCCGAGCTGAAGGAGACCATCGGCAACGTGATCAACGAGAGCAGAGTGCTGAGAGACTTCCTGCACCAGAAGCTGATCCTGTTCAAGGGCATCGACATGAGCAACTGGAAGAACGAGACCGTGGACCAGCTGATCACCGACCTGGGCCAGCTGCACCAGGACAACCTGATGCTGGAGGAGCAGATCAAGAAGTACAAGAAGGAGCTGAAGCTGACCAAGAGCGCCATCCCCACCCTGGGCGTGGAGTTCCAGGACAGAATCAAGACCGAGATCGGCAAGATCGCCACCGACATGGGCGGCGCCGTGAAGGAGATCAGAAAGAAGGGTACCGAGCAGAAGCTGATCTCAGAGGAGGACCTGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:45)

蛋白:

MEDNSVLNEDSNLEHVEGQPRRSMSQPVLNVEGDKRTSSTSATQQQVLSGAFSSADVRSIPI IQTWEENKALKTKITILRGELQMYQRRYSEAKEASQKRVKEVMDDYVDLKLGQENVQEKMEQYKLMEEDLLAMQSRIETSEDNFARQMKEFEAQKHAMEERIKELELSATDANNTTVGSFRGTLDDILKKNDPDFTLTSGYEERKINDLEAKLLSEIDKVAELEDHIQQLRQELDDQSARLADSENVRAQLEAATGQGILGAAGNAMVPNSTFMIGNGRESQTRDQLNYIDDLETKLADAKKENDKARQALVEYMNKCSKLEHEIRTMVKNSTFDSSSMLLGGQTSDELKIQIGKVNGELNVLRAENRELRIRCDQLTGGDGNLSISLGQSRLMAGIATNDVDSIGQGNETGGTSMRILPRESQLDDLEESKLPLMDTSSAVRNQQQFASMWEDFESVKDSLQNNHNDTLEGSFNSSMPPPGRDATQSFLSQKSFKNSPIVMQKPKSLHLHLKSHQSEGAGEQIQNNSFSTKTASPHVSQSHIPILHDMQQILDSSAMFLEGQHDVAVNVEQMQEKMSQIREALARLFERLKSSAALFEEILERMGSSDPNADKIKKMKLAFETSINDKLNVSAILEAAEKDLHNMSLNFSILEKSIVSQAAEASRRFTIAPDAEDVASSSLLNASYSPLFKFTSNSDIVEKLQNEVSELKNELEMARTRDMRSPLNGSSGRLSDVQINTNRMFEDLEVSEATLQKAKEENSTLKSQFAELEANLHQVNSKLGEVRCELNEALARVDGEQETRVKAENALEEARQLISSLKHEENELKKTITDMGMRLNEAKKSDEFLKSELSTALEEEKKSQNLADELSEELNGWRMRTKEAENKVEHASSEKSEMLERIVHLETEMEKLSTSEIAADYCSTKMTERKKEIELAKYREDFENAAIVGLERISKEISELTKKTLKAKIIPSNISSIQLVCDELCRRLSREREQQHEYAKVMRDVNEKIEKLQLEKDALEHELKMMSSNNENVPPVGTSVSGMPTKTSNQKCAQPHYTSPTRQLLHESTMAVDAIVQKLKKTHNMSGMGPELKETIGNVINESRVLRDFLHQKLILFKGIDMSNWKNETVDQLITDLGQLHQDNLMLEEQIKKYKKELKLTKSAIPTLGVEFQDRIKTEIGKIATDMGGAVKEIRKKGTEQKLISEEDLGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(SEQ IDNO:46)

SPD5-PylRS^AF

DNA:

ATGGAGGACAACAGCGTGCTGAACGAGGACAGCAACCTGGAGCACGTGGAGGGCCAGCCCAGAAGAAGCATGAGCCAGCCCGTGCTGAACGTGGAGGGCGACAAGAGAACCAGCAGCACCAGCGCCACCCAGCAGCAGGTGCTGAGCGGCGCCTTCAGCAGCGCCGACGTGAGAAGCATCCCCATCATCCAGACCTGGGAGGAGAACAAGGCCCTGAAGACCAAGATCACCATCCTGAGAGGCGAGCTGCAGATGTACCAGAGAAGATACAGCGAGGCCAAGGAGGCCAGCCAGAAGAGAGTGAAGGAGGTGATGGACGACTACGTGGACCTGAAGCTGGGCCAGGAGAACGTGCAGGAGAAGATGGAGCAGTACAAGCTGATGGAGGAGGACCTGCTGGCCATGCAGAGCAGAATCGAGACCAGCGAGGACAACTTCGCCAGACAGATGAAGGAGTTCGAGGCCCAGAAGCACGCCATGGAGGAGAGAATCAAGGAGCTGGAGCTGAGCGCCACCGACGCCAACAACACCACCGTGGGCAGCTTCAGAGGCACCCTGGACGACATCCTGAAGAAGAACGACCCCGACTTCACCCTGACCAGCGGCTACGAGGAGAGAAAGATCAACGACCTGGAGGCCAAGCTGCTGAGCGAGATCGACAAGGTGGCCGAGCTGGAGGACCACATCCAGCAGCTGAGACAGGAGCTGGACGACCAGAGCGCCAGACTGGCCGACAGCGAGAACGTGAGAGCCCAGCTGGAGGCCGCCACCGGCCAGGGCATCCTGGGCGCCGCCGGCAACGCCATGGTGCCCAACAGCACCTTCATGATCGGCAACGGCAGAGAGAGCCAGACCAGAGACCAGCTGAACTACATCGACGACCTGGAGACCAAGCTGGCCGACGCCAAGAAGGAGAACGACAAGGCCAGACAGGCCCTGGTGGAGTACATGAACAAGTGCAGCAAGCTGGAGCACGAGATCAGAACCATGGTGAAGAACAGCACCTTCGACAGCAGCAGCATGCTGCTGGGCGGCCAGACCAGCGACGAGCTGAAGATCCAGATCGGCAAGGTGAACGGCGAGCTGAACGTGCTGAGAGCCGAGAACAGAGAGCTGAGAATCAGATGCGACCAGCTGACCGGCGGCGACGGCAACCTGAGCATCAGCCTGGGCCAGAGCAGACTGATGGCCGGCATCGCCACCAACGACGTGGACAGCATCGGCCAGGGCAACGAGACCGGCGGCACCAGCATGAGAATCCTGCCCAGAGAGAGCCAGCTGGACGACCTGGAGGAGAGCAAGCTGCCCCTGATGGACACCAGCAGCGCCGTGAGAAACCAGCAGCAGTTCGCCAGCATGTGGGAGGACTTCGAGAGCGTGAAGGACAGCCTGCAGAACAACCACAACGACACCCTGGAGGGCAGCTTCAACAGCAGCATGCCCCCCCCCGGCAGAGACGCCACCCAGAGCTTCCTGAGCCAGAAGAGCTTCAAGAACAGCCCCATCGTGATGCAGAAGCCCAAGAGCCTGCACCTGCACCTGAAGAGCCACCAGAGCGAGGGCGCCGGCGAGCAGATCCAGAACAACAGCTTCAGCACCAAGACCGCCAGCCCCCACGTGAGCCAGAGCCACATCCCCATCCTGCACGACATGCAGCAGATCCTGGACAGCAGCGCCATGTTCCTGGAGGGCCAGCACGACGTGGCCGTGAACGTGGAGCAGATGCAGGAGAAGATGAGCCAGATCAGAGAGGCCCTGGCCAGACTGTTCGAGAGACTGAAGAGCAGCGCCGCCCTGTTCGAGGAGATCCTGGAGAGAATGGGCAGCAGCGACCCCAACGCCGACAAGATCAAGAAGATGAAGCTGGCCTTCGAGACCAGCATCAACGACAAGCTGAACGTGAGCGCCATCCTGGAGGCCGCCGAGAAGGACCTGCACAACATGAGCCTGAACTTCAGCATCCTGGAGAAGAGCATCGTGAGCCAGGCCGCCGAGGCCAGCAGAAGATTCACCATCGCCCCCGACGCCGAGGACGTGGCCAGCAGCAGCCTGCTGAACGCCAGCTACAGCCCCCTGTTCAAGTTCACCAGCAACAGCGACATCGTGGAGAAGCTGCAGAACGAGGTGAGCGAGCTGAAGAACGAGCTGGAGATGGCCAGAACCAGAGACATGAGAAGCCCCCTGAACGGCAGCAGCGGCAGACTGAGCGACGTGCAGATCAACACCAACAGAATGTTCGAGGACCTGGAGGTGAGCGAGGCCACCCTGCAGAAGGCCAAGGAGGAGAACAGCACCCTGAAGAGCCAGTTCGCCGAGCTGGAGGCCAACCTGCACCAGGTGAACAGCAAGCTGGGCGAGGTGAGATGCGAGCTGAACGAGGCCCTGGCCAGAGTGGACGGCGAGCAGGAGACCAGAGTGAAGGCCGAGAACGCCCTGGAGGAGGCCAGACAGCTGATCAGCAGCCTGAAGCACGAGGAGAACGAGCTGAAGAAGACCATCACCGACATGGGCATGAGACTGAACGAGGCCAAGAAGAGCGACGAGTTCCTGAAGAGCGAGCTGAGCACCGCCCTGGAGGAGGAGAAGAAGAGCCAGAACCTGGCCGACGAGCTGAGCGAGGAGCTGAACGGCTGGAGAATGAGAACCAAGGAGGCCGAGAACAAGGTGGAGCACGCCAGCAGCGAGAAGAGCGAGATGCTGGAGAGAATCGTGCACCTGGAGACCGAGATGGAGAAGCTGAGCACCAGCGAGATCGCCGCCGACTACTGCAGCACCAAGATGACCGAGAGAAAGAAGGAGATCGAGCTGGCCAAGTACAGAGAGGACTTCGAGAACGCCGCCATCGTGGGCCTGGAGAGAATCAGCAAGGAGATCAGCGAGCTGACCAAGAAGACCCTGAAGGCCAAGATCATCCCCAGCAACATCAGCAGCATCCAGCTGGTGTGCGACGAGCTGTGCAGAAGACTGAGCAGAGAGAGAGAGCAGCAGCACGAGTACGCCAAGGTGATGAGAGACGTGAACGAGAAGATCGAGAAGCTGCAGCTGGAGAAGGACGCCCTGGAGCACGAGCTGAAGATGATGAGCAGCAACAACGAGAACGTGCCCCCCGTGGGCACCAGCGTGAGCGGCATGCCCACCAAGACCAGCAACCAGAAGTGCGCCCAGCCCCACTACACCAGCCCCACCAGACAGCTGCTGCACGAGAGCACCATGGCCGTGGACGCCATCGTGCAGAAGCTGAAGAAGACCCACAACATGAGCGGCATGGGCCCCGAGCTGAAGGAGACCATCGGCAACGTGATCAACGAGAGCAGAGTGCTGAGAGACTTCCTGCACCAGAAGCTGATCCTGTTCAAGGGCATCGACATGAGCAACTGGAAGAACGAGACCGTGGACCAGCTGATCACCGACCTGGGCCAGCTGCACCAGGACAACCTGATGCTGGAGGAGCAGATCAAGAAGTACAAGAAGGAGCTGAAGCTGACCAAGAGCGCCATCCCCACCCTGGGCGTGGAGTTCCAGGACAGAATCAAGACCGAGATCGGCAAGATCGCCACCGACATGGGCGGCGCCGTGAAGGAGATCAGAAAGAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:47)

蛋白:

MEDNSVLNEDSNLEHVEGQPRRSMSQPVLNVEGDKRTSSTSATQQQVLSGAFSSADVRSIPIIQTWEENKALKTKITILRGELQMYQRRYSEAKEASQKRVKEVMDDYVDLKLGQENVQEKMEQYKLMEEDLLAMQSRIETSEDNFARQMKEFEAQKHAMEERIKELELSATDANNTTVGSFRGTLDDILKKNDPDFTLTSGYEERKINDLEAKLLSEIDKVAELEDHIQQLRQELDDQSARLADSENVRAQLEAATGQGILGAAGNAMVPNSTFMIGNGRESQTRDQLNYIDDLETKLADAKKENDKARQALVEYMNKCSKLEHEIRTMVKNSTFDSSSMLLGGQTSDELKIQIGKVNGELNVLRAENRELRIRCDQLTGGDGNLSISLGQSRLMAGIATNDVDSIGQGNETGGTSMRILPRESQLDDLEESKLPLMDTSSAVRNQQQFASMWEDFESVKDSLQNNHNDTLEGSFNSSMPPPGRDATQSFLSQKSFKNSPIVMQKPKSLHLHLKSHQSEGAGEQIQNNSFSTKTASPHVSQSHIPILHDMQQILDSSAMFLEGQHDVAVNVEQMQEKMSQIREALARLFERLKSSAALFEEILERMGSSDPNADKIKKMKLAFETSINDKLNVSAILEAAEKDLHNMSLNFSILEKSIVSQAAEASRRFTIAPDAEDVASSSLLNASYSPLFKFTSNSDIVEKLQNEVSELKNELEMARTRDMRSPLNGSSGRLSDVQINTNRMFEDLEVSEATLQKAKEENSTLKSQFAELEANLHQVNSKLGEVRCELNEALARVDGEQETRVKAENALEEARQLISSLKHEENELKKTITDMGMRLNEAKKSDEFLKSELSTALEEEKKSQNLADELSEELNGWRMRTKEAENKVEHASSEKSEMLERIVHLETEMEKLSTSEIAADYCSTKMTERKKEIELAKYREDFENAAIVGLERISKEISELTKKTLKAKIIPSNISSIQLVCDELCRRLSREREQQHEYAKVMRDVNEKIEKLQLEKDALEHELKMMSSNNENVPPVGTSVSGMPTKTSNQKCAQPHYTSPTRQLLHESTMAVDAIVQKLKKTHNMSGMGPELKETIGNVINESRVLRDFLHQKLILFKGIDMSNWKNETVDQLITDLGQLHQDNLMLEEQIKKYKKELKLTKSAIPTLGVEFQDRIKTEIGKIATDMGGAVKEIRKKGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:48)

KIF16B-FUS-PylRS^AF

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:49)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTYTDIEMNRLGKGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGI IKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:50)KIF16B-VSV-G-FUS-PylRS^AF

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQID NO:51)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTYTDIEMNRLGKGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:52)

KIF16B-FUS-PylRS^AA

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:53)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTYTDIEMNRLGKGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGAPGSAGSAAGSGMACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:54)

KIF16B-FUS-PylRS^AAAF

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:55)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTYTDIEMNRLGKGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ I D NO:56)

KIF16B-EWSR1-MCP

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACAATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATTACAAGGATGACGACGATAAGGGTACCGAGCAGAAGCTGATCTCAGAGGAGGACCTGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:57)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDYKDDDDKGTEQKLISEEDLGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(SEQ ID NO:58)

KIF16B-FUS-4xλ_N22-PylRS^AF

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:59)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTYTDIEMNRLGKGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDYKDDDDKGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:60)

KIF16B-FUS-MCP-PylRS^AF

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:61)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTYTDIEMNRLGKGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:62)

KIF16B-PylRS^AF

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:63)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTYTDIEMNRLGKGAPGSAGSAGSAAGSGMACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESI ITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQID NO:64)

KIF16B-MCP

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:65)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTYTDIEMNRLGKGAPGSAGSAAGSGMASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(SEQ ID NO:66)

KIF16B-MCP-PylRS^AF

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:67)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTYTDIEMNRLGKGAPGSAGSAAGSGMASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:68)

KIF16B-SPD5-PylRS^AF

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTcGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACAATGGAGGACAACAGCGTGCTGAACGAGGACAGCAACCTGGAGCACGTGGAGGGCCAGCCCAGAAGAAGCATGAGCCAGCCCGTGCTGAACGTGGAGGGCGACAAGAGAACCAGCAGCACCAGCGCCACCCAGCAGCAGGTGCTGAGCGGCGCCTTCAGCAGCGCCGACGTGAGAAGCATCCCCATCATCCAGACCTGGGAGGAGAACAAGGCCCTGAAGACCAAGATCACCATCCTGAGAGGCGAGCTGCAGATGTACCAGAGAAGATACAGCGAGGCCAAGGAGGCCAGCCAGAAGAGAGTGAAGGAGGTGATGGACGACTACGTGGACCTGAAGCTGGGCCAGGAGAACGTGCAGGAGAAGATGGAGCAGTACAAGCTGATGGAGGAGGACCTGCTGGCCATGCAGAGCAGAATCGAGACCAGCGAGGACAACTTCGCCAGACAGATGAAGGAGTTCGAGGCCCAGAAGCACGCCATGGAGGAGAGAATCAAGGAGCTGGAGCTGAGCGCCACCGACGCCAACAACACCACCGTGGGCAGCTTCAGAGGCACCCTGGACGACATCCTGAAGAAGAACGACCCCGACTTCACCCTGACCAGCGGCTACGAGGAGAGAAAGATCAACGACCTGGAGGCCAAGCTGCTGAGCGAGATCGACAAGGTGGCCGAGCTGGAGGACCACATCCAGCAGCTGAGACAGGAGCTGGACGACCAGAGCGCCAGACTGGCCGACAGCGAGAACGTGAGAGCCCAGCTGGAGGCCGCCACCGGCCAGGGCATCCTGGGCGCCGCCGGCAACGCCATGGTGCCCAACAGCACCTTCATGATCGGCAACGGCAGAGAGAGCCAGACCAGAGACCAGCTGAACTACATCGACGACCTGGAGACCAAGCTGGCCGACGCCAAGAAGGAGAACGACAAGGCCAGACAGGCCCTGGTGGAGTACATGAACAAGTGCAGCAAGCTGGAGCACGAGATCAGAACCATGGTGAAGAACAGCACCTTCGACAGCAGCAGCATGCTGCTGGGCGGCCAGACCAGCGACGAGCTGAAGATCCAGATCGGCAAGGTGAACGGCGAGCTGAACGTGCTGAGAGCCGAGAACAGAGAGCTGAGAATCAGATGCGACCAGCTGACCGGCGGCGACGGCAACCTGAGCATCAGCCTGGGCCAGAGCAGACTGATGGCCGGCATCGCCACCAACGACGTGGACAGCATCGGCCAGGGCAACGAGACCGGCGGCACCAGCATGAGAATCCTGCCCAGAGAGAGCCAGCTGGACGACCTGGAGGAGAGCAAGCTGCCCCTGATGGACACCAGCAGCGCCGTGAGAAACCAGCAGCAGTTCGCCAGCATGTGGGAGGACTTCGAGAGCGTGAAGGACAGCCTGCAGAACAACCACAACGACACCCTGGAGGGCAGCTTCAACAGCAGCATGCCCCCCCCCGGCAGAGACGCCACCCAGAGCTTCCTGAGCCAGAAGAGCTTCAAGAACAGCCCCATCGTGATGCAGAAGCCCAAGAGCCTGCACCTGCACCTGAAGAGCCACCAGAGCGAGGGCGCCGGCGAGCAGATCCAGAACAACAGCTTCAGCACCAAGACCGCCAGCCCCCACGTGAGCCAGAGCCACATCCCCATCCTGCACGACATGCAGCAGATCCTGGACAGCAGCGCCATGTTCCTGGAGGGCCAGCACGACGTGGCCGTGAACGTGGAGCAGATGCAGGAGAAGATGAGCCAGATCAGAGAGGCCCTGGCCAGACTGTTCGAGAGACTGAAGAGCAGCGCCGCCCTGTTCGAGGAGATCCTGGAGAGAATGGGCAGCAGCGACCCCAACGCCGACAAGATCAAGAAGATGAAGCTGGCCTTCGAGACCAGCATCAACGACAAGCTGAACGTGAGCGCCATCCTGGAGGCCGCCGAGAAGGACCTGCACAACATGAGCCTGAACTTCAGCATCCTGGAGAAGAGCATCGTGAGCCAGGCCGCCGAGGCCAGCAGAAGATTCACCATCGCCCCCGACGCCGAGGACGTGGCCAGCAGCAGCCTGCTGAACGCCAGCTACAGCCCCCTGTTCAAGTTCACCAGCAACAGCGACATCGTGGAGAAGCTGCAGAACGAGGTGAGCGAGCTGAAGAACGAGCTGGAGATGGCCAGAACCAGAGACATGAGAAGCCCCCTGAACGGCAGCAGCGGCAGACTGAGCGACGTGCAGATCAACACCAACAGAATGTTCGAGGACCTGGAGGTGAGCGAGGCCACCCTGCAGAAGGCCAAGGAGGAGAACAGCACCCTGAAGAGCCAGTTCGCCGAGCTGGAGGCCAACCTGCACCAGGTGAACAGCAAGCTGGGCGAGGTGAGATGCGAGCTGAACGAGGCCCTGGCCAGAGTGGACGGCGAGCAGGAGACCAGAGTGAAGGCCGAGAACGCCCTGGAGGAGGCCAGACAGCTGATCAGCAGCCTGAAGCACGAGGAGAACGAGCTGAAGAAGACCATCACCGACATGGGCATGAGACTGAACGAGGCCAAGAAGAGCGACGAGTTCCTGAAGAGCGAGCTGAGCACCGCCCTGGAGGAGGAGAAGAAGAGCCAGAACCTGGCCGACGAGCTGAGCGAGGAGCTGAACGGCTGGAGAATGAGAACCAAGGAGGCCGAGAACAAGGTGGAGCACGCCAGCAGCGAGAAGAGCGAGATGCTGGAGAGAATCGTGCACCTGGAGACCGAGATGGAGAAGCTGAGCACCAGCGAGATCGCCGCCGACTACTGCAGCACCAAGATGACCGAGAGAAAGAAGGAGATCGAGCTGGCCAAGTACAGAGAGGACTTCGAGAACGCCGCCATCGTGGGCCTGGAGAGAATCAGCAAGGAGATCAGCGAGCTGACCAAGAAGACCCTGAAGGCCAAGATCATCCCCAGCAACATCAGCAGCATCCAGCTGGTGTGCGACGAGCTGTGCAGAAGACTGAGCAGAGAGAGAGAGCAGCAGCACGAGTACGCCAAGGTGATGAGAGACGTGAACGAGAAGATCGAGAAGCTGCAGCTGGAGAAGGACGCCCTGGAGCACGAGCTGAAGATGATGAGCAGCAACAACGAGAACGTGCCCCCCGTGGGCACCAGCGTGAGCGGCATGCCCACCAAGACCAGCAACCAGAAGTGCGCCCAGCCCCACTACACCAGCCCCACCAGACAGCTGCTGCACGAGAGCACCATGGCCGTGGACGCCATCGTGCAGAAGCTGAAGAAGACCCACAACATGAGCGGCATGGGCCCCGAGCTGAAGGAGACCATCGGCAACGTGATCAACGAGAGCAGAGTGCTGAGAGACTTCCTGCACCAGAAGCTGATCCTGTTCAAGGGCATCGACATGAGCAACTGGAAGAACGAGACCGTGGACCAGCTGATCACCGACCTGGGCCAGCTGCACCAGGACAACCTGATGCTGGAGGAGCAGATCAAGAAGTACAAGAAGGAGCTGAAGCTGACCAAGAGCGCCATCCCCACCCTGGGCGTGGAGTTCCAGGACAGAATCAAGACCGAGATCGGCAAGATCGCCACCGACATGGGCGGCGCCGTGAAGGAGATCAGAAAGAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:69)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTMEDNSVLNEDSNLEHVEGQPRRSMSQPVLNVEGDKRTSSTSATQQQVLSGAFSSADVRSIPIIQTWEENKALKTKITILRGELQMYQRRYSEAKEASQKRVKEVMDDYVDLKLGQENVQEKMEQYKLMEEDLLAMQSRIETSEDNFARQMKEFEAQKHAMEERIKELELSATDANNTTVGSFRGTLDDILKKNDPDFTLTSGYEERKINDLEAKLLSEIDKVAELEDHIQQLRQELDDQSARLADSENVRAQLEAATGQGILGAAGNAMVPNSTFMIGNGRESQTRDQLNYIDDLETKLADAKKENDKARQALVEYMNKCSKLEHEIRTMVKNSTFDSSSMLLGGQTSDELKIQIGKVNGELNVLRAENRELRIRCDQLTGGDGNLSISLGQSRLMAGIATNDVDSIGQGNETGGTSMRILPRESQLDDLEESKLPLMDTSSAVRNQQQFASMWEDFESVKDSLQNNHNDTLEGSFNSSMPPPGRDATQSFLSQKSFKNSPIVMQKPKSLHLHLKSHQSEGAGEQIQNNSFSTKTASPHVSQSHIPILHDMQQILDSSAMFLEGQHDVAVNVEQMQEKMSQIREALARLFERLKSSAALFEEILERMGSSDPNADKIKKMKLAFETSINDKLNVSAILEAAEKDLHNMSLNFSILEKSIVSQAAEASRRFTIAPDAEDVASSSLLNASYSPLFKFTSNSDIVEKLQNEVSELKNELEMARTRDMRSPLNGSSGRLSDVQINTNRMFEDLEVSEATLQKAKEENSTLKSQFAELEANLHQVNSKLGEVRCELNEALARVDGEQETRVKAENALEEARQLISSLKHEENELKKTITDMGMRLNEAKKSDEFLKSELSTALEEEKKSQNLADELSEELNGWRMRTKEAENKVEHASSEKSEMLERIVHLETEMEKLSTSEIAADYCSTKMTERKKEIELAKYREDFENAAIVGLERISKEISELTKKTLKAKIIPSNISSIQLVCDELCRRLSREREQQHEYAKVMRDVNEKIEKLQLEKDALEHELKMMSSNNENVPPVGTSVSGMPTKTSNQKCAQPHYTSPTRQLLHESTMAVDAIVQKLKKTHNMSGMGPELKETIGNVINESRVLRDFLHQKLILFKGIDMSNWKNETVDQLITDLGQLHQDNLMLEEQIKKYKKELKLTKSAIPTLGVEFQDRIKTEIGKIATDMGGAVKEIRKKGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ I D NO:70)

KIF16B-SPD5-MCP

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACAATGGAGGACAACAGCGTGCTGAACGAGGACAGCAACCTGGAGCACGTGGAGGGCCAGCCCAGAAGAAGCATGAGCCAGCCCGTGCTGAACGTGGAGGGCGACAAGAGAACCAGCAGCACCAGCGCCACCCAGCAGCAGGTGCTGAGCGGCGCCTTCAGCAGCGCCGACGTGAGAAGCATCCCCATCATCCAGACCTGGGAGGAGAACAAGGCCCTGAAGACCAAGATCACCATCCTGAGAGGCGAGCTGCAGATGTACCAGAGAAGATACAGCGAGGCCAAGGAGGCCAGCCAGAAGAGAGTGAAGGAGGTGATGGACGACTACGTGGACCTGAAGCTGGGCCAGGAGAACGTGCAGGAGAAGATGGAGCAGTACAAGCTGATGGAGGAGGACCTGCTGGCCATGCAGAGCAGAATCGAGACCAGCGAGGACAACTTCGCCAGACAGATGAAGGAGTTCGAGGCCCAGAAGCACGCCATGGAGGAGAGAATCAAGGAGCTGGAGCTGAGCGCCACCGACGCCAACAACACCACCGTGGGCAGCTTCAGAGGCACCCTGGACGACATCCTGAAGAAGAACGACCCCGACTTCACCCTGACCAGCGGCTACGAGGAGAGAAAGATCAACGACCTGGAGGCCAAGCTGCTGAGCGAGATCGACAAGGTGGCCGAGCTGGAGGACCACATCCAGCAGCTGAGACAGGAGCTGGACGACCAGAGCGCCAGACTGGCCGACAGCGAGAACGTGAGAGCCCAGCTGGAGGCCGCCACCGGCCAGGGCATCCTGGGCGCCGCCGGCAACGCCATGGTGCCCAACAGCACCTTCATGATCGGCAACGGCAGAGAGAGCCAGACCAGAGACCAGCTGAACTACATCGACGACCTGGAGACCAAGCTGGCCGACGCCAAGAAGGAGAACGACAAGGCCAGACAGGCCCTGGTGGAGTACATGAACAAGTGCAGCAAGCTGGAGCACGAGATCAGAACCATGGTGAAGAACAGCACCTTCGACAGCAGCAGCATGCTGCTGGGCGGCCAGACCAGCGACGAGCTGAAGATCCAGATCGGCAAGGTGAACGGCGAGCTGAACGTGCTGAGAGCCGAGAACAGAGAGCTGAGAATCAGATGCGACCAGCTGACCGGCGGCGACGGCAACCTGAGCATCAGCCTGGGCCAGAGCAGACTGATGGCCGGCATCGCCACCAACGACGTGGACAGCATCGGCCAGGGCAACGAGACCGGCGGCACCAGCATGAGAATCCTGCCCAGAGAGAGCCAGCTGGACGACCTGGAGGAGAGCAAGCTGCCCCTGATGGACACCAGCAGCGCCGTGAGAAACCAGCAGCAGTTCGCCAGCATGTGGGAGGACTTCGAGAGCGTGAAGGACAGCCTGCAGAACAACCACAACGACACCCTGGAGGGCAGCTTCAACAGCAGCATGCCCCCCCCCGGCAGAGACGCCACCCAGAGCTTCCTGAGCCAGAAGAGCTTCAAGAACAGCCCCATCGTGATGCAGAAGCCCAAGAGCCTGCACCTGCACCTGAAGAGCCACCAGAGCGAGGGCGCCGGCGAGCAGATCCAGAACAACAGCTTCAGCACCAAGACCGCCAGCCCCCACGTGAGCCAGAGCCACATCCCCATCCTGCACGACATGCAGCAGATCCTGGACAGCAGCGCCATGTTCCTGGAGGGCCAGCACGACGTGGCCGTGAACGTGGAGCAGATGCAGGAGAAGATGAGCCAGATCAGAGAGGCCCTGGCCAGACTGTTCGAGAGACTGAAGAGCAGCGCCGCCCTGTTCGAGGAGATCCTGGAGAGAATGGGCAGCAGCGACCCCAACGCCGACAAGATCAAGAAGATGAAGCTGGCCTTCGAGACCAGCATCAACGACAAGCTGAACGTGAGCGCCATCCTGGAGGCCGCCGAGAAGGACCTGCACAACATGAGCCTGAACTTCAGCATCCTGGAGAAGAGCATCGTGAGCCAGGCCGCCGAGGCCAGCAGAAGATTCACCATCGCCCCCGACGCCGAGGACGTGGCCAGCAGCAGCCTGCTGAACGCCAGCTACAGCCCCCTGTTCAAGTTCACCAGCAACAGCGACATCGTGGAGAAGCTGCAGAACGAGGTGAGCGAGCTGAAGAACGAGCTGGAGATGGCCAGAACCAGAGACATGAGAAGCCCCCTGAACGGCAGCAGCGGCAGACTGAGCGACGTGCAGATCAACACCAACAGAATGTTCGAGGACCTGGAGGTGAGCGAGGCCACCCTGCAGAAGGCCAAGGAGGAGAACAGCACCCTGAAGAGCCAGTTCGCCGAGCTGGAGGCCAACCTGCACCAGGTGAACAGCAAGCTGGGCGAGGTGAGATGCGAGCTGAACGAGGCCCTGGCCAGAGTGGACGGCGAGCAGGAGACCAGAGTGAAGGCCGAGAACGCCCTGGAGGAGGCCAGACAGCTGATCAGCAGCCTGAAGCACGAGGAGAACGAGCTGAAGAAGACCATCACCGACATGGGCATGAGACTGAACGAGGCCAAGAAGAGCGACGAGTTCCTGAAGAGCGAGCTGAGCACCGCCCTGGAGGAGGAGAAGAAGAGCCAGAACCTGGCCGACGAGCTGAGCGAGGAGCTGAACGGCTGGAGAATGAGAACCAAGGAGGCCGAGAACAAGGTGGAGCACGCCAGCAGCGAGAAGAGCGAGATGCTGGAGAGAATCGTGCACCTGGAGACCGAGATGGAGAAGCTGAGCACCAGCGAGATCGCCGCCGACTACTGCAGCACCAAGATGACCGAGAGAAAGAAGGAGATCGAGCTGGCCAAGTACAGAGAGGACTTCGAGAACGCCGCCATCGTGGGCCTGGAGAGAATCAGCAAGGAGATCAGCGAGCTGACCAAGAAGACCCTGAAGGCCAAGATCATCCCCAGCAACATCAGCAGCATCCAGCTGGTGTGCGACGAGCTGTGCAGAAGACTGAGCAGAGAGAGAGAGCAGCAGCACGAGTACGCCAAGGTGATGAGAGACGTGAACGAGAAGATCGAGAAGCTGCAGCTGGAGAAGGACGCCCTGGAGCACGAGCTGAAGATGATGAGCAGCAACAACGAGAACGTGCCCCCCGTGGGCACCAGCGTGAGCGGCATGCCCACCAAGACCAGCAACCAGAAGTGCGCCCAGCCCCACTACACCAGCCCCACCAGACAGCTGCTGCACGAGAGCACCATGGCCGTGGACGCCATCGTGCAGAAGCTGAAGAAGACCCACAACATGAGCGGCATGGGCCCCGAGCTGAAGGAGACCATCGGCAACGTGATCAACGAGAGCAGAGTGCTGAGAGACTTCCTGCACCAGAAGCTGATCCTGTTCAAGGGCATCGACATGAGCAACTGGAAGAACGAGACCGTGGACCAGCTGATCACCGACCTGGGCCAGCTGCACCAGGACAACCTGATGCTGGAGGAGCAGATCAAGAAGTACAAGAAGGAGCTGAAGCTGACCAAGAGCGCCATCCCCACCCTGGGCGTGGAGTTCCAGGACAGAATCAAGACCGAGATCGGCAAGATCGCCACCGACATGGGCGGCGCCGTGAAGGAGATCAGAAAGAAGGGTACCGAGCAGAAGCTGATCTCAGAGGAGGACCTGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:71)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTMEDNSVLNEDSNLEHVEGQPRRSMSQPVLNVEGDKRTSSTSATQQQVLSGAFSSADVRSIPIIQTWEENKALKTKITILRGELQMYQRRYSEAKEASQKRVKEVMDDYVDLKLGQENVQEKMEQYKLMEEDLLAMQSRIETSEDNFARQMKEFEAQKHAMEERIKELELSATDANNTTVGSFRGTLDDILKKNDPDFTLTSGYEERKINDLEAKLLSEIDKVAELEDHIQQLRQELDDQSARLADSENVRAQLEAATGQGILGAAGNAMVPNSTFMIGNGRESQTRDQLNYIDDLETKLADAKKENDKARQALVEYMNKCSKLEHEIRTMVKNSTFDSSSMLLGGQTSDELKIQIGKVNGELNVLRAENRELRIRCDQLTGGDGNLSISLGQSRLMAGIATNDVDSIGQGNETGGTSMRILPRESQLDDLEESKLPLMDTSSAVRNQQQFASMWEDFESVKDSLQNNHNDTLEGSFNSSMPPPGRDATQSFLSQKSFKNSPIVMQKPKSLHLHLKSHQSEGAGEQIQNNSFSTKTASPHVSQSHIPILHDMQQILDSSAMFLEGQHDVAVNVEQMQEKMSQIREALARLFERLKSSAALFEEILERMGSSDPNADKIKKMKLAFETSINDKLNVSAILEAAEKDLHNMSLNFSILEKSIVSQAAEASRRFTIAPDAEDVASSSLLNASYSPLFKFTSNSDIVEKLQNEVSELKNELEMARTRDMRSPLNGSSGRLSDVQINTNRMFEDLEVSEATLQKAKEENSTLKSQFAELEANLHQVNSKLGEVRCELNEALARVDGEQETRVKAENALEEARQLISSLKHEENELKKTITDMGMRLNEAKKSDEFLKSELSTALEEEKKSQNLADELSEELNGWRMRTKEAENKVEHASSEKSEMLERIVHLETEMEKLSTSEIAADYCSTKMTERKKEIELAKYREDFENAAIVGLERISKEISELTKKTLKAKIIPSNISSIQLVCDELCRRLSREREQQHEYAKVMRDVNEKIEKLQLEKDALEHELKMMSSNNENVPPVGTSVSGMPTKTSNQKCAQPHYTSPTRQLLHESTMAVDAIVQKLKKTHNMSGMGPELKETIGNVINESRVLRDFLHQKLILFKGIDMSNWKNETVDQLITDLGQLHQDNLMLEEQIKKYKKELKLTKSAIPTLGVEFQDRIKTEIGKIATDMGGAVKEIRKKGTEQKLISEEDLGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(SEQ ID NO:72)

KIF16B-SPD5-MCP-PylRS^AF

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACAATGGAGGACAACAGCGTGCTGAACGAGGACAGCAACCTGGAGCACGTGGAGGGCCAGCCCAGAAGAAGCATGAGCCAGCCCGTGCTGAACGTGGAGGGCGACAAGAGAACCAGCAGCACCAGCGCCACCCAGCAGCAGGTGCTGAGCGGCGCCTTCAGCAGCGCCGACGTGAGAAGCATCCCCATCATCCAGACCTGGGAGGAGAACAAGGCCCTGAAGACCAAGATCACCATCCTGAGAGGCGAGCTGCAGATGTACCAGAGAAGATACAGCGAGGCCAAGGAGGCCAGCCAGAAGAGAGTGAAGGAGGTGATGGACGACTACGTGGACCTGAAGCTGGGCCAGGAGAACGTGCAGGAGAAGATGGAGCAGTACAAGCTGATGGAGGAGGACCTGCTGGCCATGCAGAGCAGAATCGAGACCAGCGAGGACAACTTCGCCAGACAGATGAAGGAGTTCGAGGCCCAGAAGCACGCCATGGAGGAGAGAATCAAGGAGCTGGAGCTGAGCGCCACCGACGCCAACAACACCACCGTGGGCAGCTTCAGAGGCACCCTGGACGACATCCTGAAGAAGAACGACCCCGACTTCACCCTGACCAGCGGCTACGAGGAGAGAAAGATCAACGACCTGGAGGCCAAGCTGCTGAGCGAGATCGACAAGGTGGCCGAGCTGGAGGACCACATCCAGCAGCTGAGACAGGAGCTGGACGACCAGAGCGCCAGACTGGCCGACAGCGAGAACGTGAGAGCCCAGCTGGAGGCCGCCACCGGCCAGGGCATCCTGGGCGCCGCCGGCAACGCCATGGTGCCCAACAGCACCTTCATGATCGGCAACGGCAGAGAGAGCCAGACCAGAGACCAGCTGAACTACATCGACGACCTGGAGACCAAGCTGGCCGACGCCAAGAAGGAGAACGACAAGGCCAGACAGGCCCTGGTGGAGTACATGAACAAGTGCAGCAAGCTGGAGCACGAGATCAGAACCATGGTGAAGAACAGCACCTTCGACAGCAGCAGCATGCTGCTGGGCGGCCAGACCAGCGACGAGCTGAAGATCCAGATCGGCAAGGTGAACGGCGAGCTGAACGTGCTGAGAGCCGAGAACAGAGAGCTGAGAATCAGATGCGACCAGCTGACCGGCGGCGACGGCAACCTGAGCATCAGCCTGGGCCAGAGCAGACTGATGGCCGGCATCGCCACCAACGACGTGGACAGCATCGGCCAGGGCAACGAGACCGGCGGCACCAGCATGAGAATCCTGCCCAGAGAGAGCCAGCTGGACGACCTGGAGGAGAGCAAGCTGCCCCTGATGGACACCAGCAGCGCCGTGAGAAACCAGCAGCAGTTCGCCAGCATGTGGGAGGACTTCGAGAGCGTGAAGGACAGCCTGCAGAACAACCACAACGACACCCTGGAGGGCAGCTTCAACAGCAGCATGCCCCCCCCCGGCAGAGACGCCACCCAGAGCTTCCTGAGCCAGAAGAGCTTCAAGAACAGCCCCATCGTGATGCAGAAGCCCAAGAGCCTGCACCTGCACCTGAAGAGCCACCAGAGCGAGGGCGCCGGCGAGCAGATCCAGAACAACAGCTTCAGCACCAAGACCGCCAGCCCCCACGTGAGCCAGAGCCACATCCCCATCCTGCACGACATGCAGCAGATCCTGGACAGCAGCGCCATGTTCCTGGAGGGCCAGCACGACGTGGCCGTGAACGTGGAGCAGATGCAGGAGAAGATGAGCCAGATCAGAGAGGCCCTGGCCAGACTGTTCGAGAGACTGAAGAGCAGCGCCGCCCTGTTCGAGGAGATCCTGGAGAGAATGGGCAGCAGCGACCCCAACGCCGACAAGATCAAGAAGATGAAGCTGGCCTTCGAGACCAGCATCAACGACAAGCTGAACGTGAGCGCCATCCTGGAGGCCGCCGAGAAGGACCTGCACAACATGAGCCTGAACTTCAGCATCCTGGAGAAGAGCATCGTGAGCCAGGCCGCCGAGGCCAGCAGAAGATTCACCATCGCCCCCGACGCCGAGGACGTGGCCAGCAGCAGCCTGCTGAACGCCAGCTACAGCCCCCTGTTCAAGTTCACCAGCAACAGCGACATCGTGGAGAAGCTGCAGAACGAGGTGAGCGAGCTGAAGAACGAGCTGGAGATGGCCAGAACCAGAGACATGAGAAGCCCCCTGAACGGCAGCAGCGGCAGACTGAGCGACGTGCAGATCAACACCAACAGAATGTTCGAGGACCTGGAGGTGAGCGAGGCCACCCTGCAGAAGGCCAAGGAGGAGAACAGCACCCTGAAGAGCCAGTTCGCCGAGCTGGAGGCCAACCTGCACCAGGTGAACAGCAAGCTGGGCGAGGTGAGATGCGAGCTGAACGAGGCCCTGGCCAGAGTGGACGGCGAGCAGGAGACCAGAGTGAAGGCCGAGAACGCCCTGGAGGAGGCCAGACAGCTGATCAGCAGCCTGAAGCACGAGGAGAACGAGCTGAAGAAGACCATCACCGACATGGGCATGAGACTGAACGAGGCCAAGAAGAGCGACGAGTTCCTGAAGAGCGAGCTGAGCACCGCCCTGGAGGAGGAGAAGAAGAGCCAGAACCTGGCCGACGAGCTGAGCGAGGAGCTGAACGGCTGGAGAATGAGAACCAAGGAGGCCGAGAACAAGGTGGAGCACGCCAGCAGCGAGAAGAGCGAGATGCTGGAGAGAATCGTGCACCTGGAGACCGAGATGGAGAAGCTGAGCACCAGCGAGATCGCCGCCGACTACTGCAGCACCAAGATGACCGAGAGAAAGAAGGAGATCGAGCTGGCCAAGTACAGAGAGGACTTCGAGAACGCCGCCATCGTGGGCCTGGAGAGAATCAGCAAGGAGATCAGCGAGCTGACCAAGAAGACCCTGAAGGCCAAGATCATCCCCAGCAACATCAGCAGCATCCAGCTGGTGTGCGACGAGCTGTGCAGAAGACTGAGCAGAGAGAGAGAGCAGCAGCACGAGTACGCCAAGGTGATGAGAGACGTGAACGAGAAGATCGAGAAGCTGCAGCTGGAGAAGGACGCCCTGGAGCACGAGCTGAAGATGATGAGCAGCAACAACGAGAACGTGCCCCCCGTGGGCACCAGCGTGAGCGGCATGCCCACCAAGACCAGCAACCAGAAGTGCGCCCAGCCCCACTACACCAGCCCCACCAGACAGCTGCTGCACGAGAGCACCATGGCCGTGGACGCCATCGTGCAGAAGCTGAAGAAGACCCACAACATGAGCGGCATGGGCCCCGAGCTGAAGGAGACCATCGGCAACGTGATCAACGAGAGCAGAGTGCTGAGAGACTTCCTGCACCAGAAGCTGATCCTGTTCAAGGGCATCGACATGAGCAACTGGAAGAACGAGACCGTGGACCAGCTGATCACCGACCTGGGCCAGCTGCACCAGGACAACCTGATGCTGGAGGAGCAGATCAAGAAGTACAAGAAGGAGCTGAAGCTGACCAAGAGCGCCATCCCCACCCTGGGCGTGGAGTTCCAGGACAGAATCAAGACCGAGATCGGCAAGATCGCCACCGACATGGGCGGCGCCGTGAAGGAGATCAGAAAGAAGGGTACCGAGCAGAAGCTGATCTCAGAGGAGGACCTGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQID NO:73)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTMEDNSVLNEDSNLEHVEGQPRRSMSQPVLNVEGDKRTSSTSATQQQVLSGAFSSADVRSIPIIQTWEENKALKTKITILRGELQMYQRRYSEAKEASQKRVKEVMDDYVDLKLGQENVQEKMEQYKLMEEDLLAMQSRIETSEDNFARQMKEFEAQKHAMEERIKELELSATDANNTTVGSFRGTLDDILKKNDPDFTLTSGYEERKINDLEAKLLSEIDKVAELEDHIQQLRQELDDQSARLADSENVRAQLEAATGQGILGAAGNAMVPNSTFMIGNGRESQTRDQLNYIDDLETKLADAKKENDKARQALVEYMNKCSKLEHEIRTMVKNSTFDSSSMLLGGQTSDELKIQIGKVNGELNVLRAENRELRIRCDQLTGGDGNLSISLGQSRLMAGIATNDVDSIGQGNETGGTSMRILPRESQLDDLEESKLPLMDTSSAVRNQQQFASMWEDFESVKDSLQNNHNDTLEGSFNSSMPPPGRDATQSFLSQKSFKNSPIVMQKPKSLHLHLKSHQSEGAGEQIQNNSFSTKTASPHVSQSHIPILHDMQQILDSSAMFLEGQHDVAVNVEQMQEKMSQIREALARLFERLKSSAALFEEILERMGSSDPNADKIKKMKLAFETSINDKLNVSAILEAAEKDLHNMSLNFSILEKSIVSQAAEASRRFTIAPDAEDVASSSLLNASYSPLFKFTSNSDIVEKLQNEVSELKNELEMARTRDMRSPLNGSSGRLSDVQINTNRMFEDLEVSEATLQKAKEENSTLKSQFAELEANLHQVNSKLGEVRCELNEALARVDGEQETRVKAENALEEARQLISSLKHEENELKKTITDMGMRLNEAKKSDEFLKSELSTALEEEKKSQNLADELSEELNGWRMRTKEAENKVEHASSEKSEMLERIVHLETEMEKLSTSEIAADYCSTKMTERKKEIELAKYREDFENAAIVGLERISKEISELTKKTLKAKIIPSNISSIQLVCDELCRRLSREREQQHEYAKVMRDVNEKIEKLQLEKDALEHELKMMSSNNENVPPVGTSVSGMPTKTSNQKCAQPHYTSPTRQLLHESTMAVDAIVQKLKKTHNMSGMGPELKETIGNVINESRVLRDFLHQKLILFKGIDMSNWKNETVDQLITDLGQLHQDNLMLEEQIKKYKKELKLTKSAIPTLGVEFQDRIKTEIGKIATDMGGAVKEIRKKGTEQKLISEEDLGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:74)

KIF16B-SPD5-4xλ_N22-PylRS^AF

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACAATGGAGGACAACAGCGTGCTGAACGAGGACAGCAACCTGGAGCACGTGGAGGGCCAGCCCAGAAGAAGCATGAGCCAGCCCGTGCTGAACGTGGAGGGCGACAAGAGAACCAGCAGCACCAGCGCCACCCAGCAGCAGGTGCTGAGCGGCGCCTTCAGCAGCGCCGACGTGAGAAGCATCCCCATCATCCAGACCTGGGAGGAGAACAAGGCCCTGAAGACCAAGATCACCATCCTGAGAGGCGAGCTGCAGATGTACCAGAGAAGATACAGCGAGGCCAAGGAGGCCAGCCAGAAGAGAGTGAAGGAGGTGATGGACGACTACGTGGACCTGAAGCTGGGCCAGGAGAACGTGCAGGAGAAGATGGAGCAGTACAAGCTGATGGAGGAGGACCTGCTGGCCATGCAGAGCAGAATCGAGACCAGCGAGGACAACTTCGCCAGACAGATGAAGGAGTTCGAGGCCCAGAAGCACGCCATGGAGGAGAGAATCAAGGAGCTGGAGCTGAGCGCCACCGACGCCAACAACACCACCGTGGGCAGCTTCAGAGGCACCCTGGACGACATCCTGAAGAAGAACGACCCCGACTTCACCCTGACCAGCGGCTACGAGGAGAGAAAGATCAACGACCTGGAGGCCAAGCTGCTGAGCGAGATCGACAAGGTGGCCGAGCTGGAGGACCACATCCAGCAGCTGAGACAGGAGCTGGACGACCAGAGCGCCAGACTGGCCGACAGCGAGAACGTGAGAGCCCAGCTGGAGGCCGCCACCGGCCAGGGCATCCTGGGCGCCGCCGGCAACGCCATGGTGCCCAACAGCACCTTCATGATCGGCAACGGCAGAGAGAGCCAGACCAGAGACCAGCTGAACTACATCGACGACCTGGAGACCAAGCTGGCCGACGCCAAGAAGGAGAACGACAAGGCCAGACAGGCCCTGGTGGAGTACATGAACAAGTGCAGCAAGCTGGAGCACGAGATCAGAACCATGGTGAAGAACAGCACCTTCGACAGCAGCAGCATGCTGCTGGGCGGCCAGACCAGCGACGAGCTGAAGATCCAGATCGGCAAGGTGAACGGCGAGCTGAACGTGCTGAGAGCCGAGAACAGAGAGCTGAGAATCAGATGCGACCAGCTGACCGGCGGCGACGGCAACCTGAGCATCAGCCTGGGCCAGAGCAGACTGATGGCCGGCATCGCCACCAACGACGTGGACAGCATCGGCCAGGGCAACGAGACCGGCGGCACCAGCATGAGAATCCTGCCCAGAGAGAGCCAGCTGGACGACCTGGAGGAGAGCAAGCTGCCCCTGATGGACACCAGCAGCGCCGTGAGAAACCAGCAGCAGTTCGCCAGCATGTGGGAGGACTTCGAGAGCGTGAAGGACAGCCTGCAGAACAACCACAACGACACCCTGGAGGGCAGCTTCAACAGCAGCATGCCCCCCCCCGGCAGAGACGCCACCCAGAGCTTCCTGAGCCAGAAGAGCTTCAAGAACAGCCCCATCGTGATGCAGAAGCCCAAGAGCCTGCACCTGCACCTGAAGAGCCACCAGAGCGAGGGCGCCGGCGAGCAGATCCAGAACAACAGCTTCAGCACCAAGACCGCCAGCCCCCACGTGAGCCAGAGCCACATCCCCATCCTGCACGACATGCAGCAGATCCTGGACAGCAGCGCCATGTTCCTGGAGGGCCAGCACGACGTGGCCGTGAACGTGGAGCAGATGCAGGAGAAGATGAGCCAGATCAGAGAGGCCCTGGCCAGACTGTTCGAGAGACTGAAGAGCAGCGCCGCCCTGTTCGAGGAGATCCTGGAGAGAATGGGCAGCAGCGACCCCAACGCCGACAAGATCAAGAAGATGAAGCTGGCCTTCGAGACCAGCATCAACGACAAGCTGAACGTGAGCGCCATCCTGGAGGCCGCCGAGAAGGACCTGCACAACATGAGCCTGAACTTCAGCATCCTGGAGAAGAGCATCGTGAGCCAGGCCGCCGAGGCCAGCAGAAGATTCACCATCGCCCCCGACGCCGAGGACGTGGCCAGCAGCAGCCTGCTGAACGCCAGCTACAGCCCCCTGTTCAAGTTCACCAGCAACAGCGACATCGTGGAGAAGCTGCAGAACGAGGTGAGCGAGCTGAAGAACGAGCTGGAGATGGCCAGAACCAGAGACATGAGAAGCCCCCTGAACGGCAGCAGCGGCAGACTGAGCGACGTGCAGATCAACACCAACAGAATGTTCGAGGACCTGGAGGTGAGCGAGGCCACCCTGCAGAAGGCCAAGGAGGAGAACAGCACCCTGAAGAGCCAGTTCGCCGAGCTGGAGGCCAACCTGCACCAGGTGAACAGCAAGCTGGGCGAGGTGAGATGCGAGCTGAACGAGGCCCTGGCCAGAGTGGACGGCGAGCAGGAGACCAGAGTGAAGGCCGAGAACGCCCTGGAGGAGGCCAGACAGCTGATCAGCAGCCTGAAGCACGAGGAGAACGAGCTGAAGAAGACCATCACCGACATGGGCATGAGACTGAACGAGGCCAAGAAGAGCGACGAGTTCCTGAAGAGCGAGCTGAGCACCGCCCTGGAGGAGGAGAAGAAGAGCCAGAACCTGGCCGACGAGCTGAGCGAGGAGCTGAACGGCTGGAGAATGAGAACCAAGGAGGCCGAGAACAAGGTGGAGCACGCCAGCAGCGAGAAGAGCGAGATGCTGGAGAGAATCGTGCACCTGGAGACCGAGATGGAGAAGCTGAGCACCAGCGAGATCGCCGCCGACTACTGCAGCACCAAGATGACCGAGAGAAAGAAGGAGATCGAGCTGGCCAAGTACAGAGAGGACTTCGAGAACGCCGCCATCGTGGGCCTGGAGAGAATCAGCAAGGAGATCAGCGAGCTGACCAAGAAGACCCTGAAGGCCAAGATCATCCCCAGCAACATCAGCAGCATCCAGCTGGTGTGCGACGAGCTGTGCAGAAGACTGAGCAGAGAGAGAGAGCAGCAGCACGAGTACGCCAAGGTGATGAGAGACGTGAACGAGAAGATCGAGAAGCTGCAGCTGGAGAAGGACGCCCTGGAGCACGAGCTGAAGATGATGAGCAGCAACAACGAGAACGTGCCCCCCGTGGGCACCAGCGTGAGCGGCATGCCCACCAAGACCAGCAACCAGAAGTGCGCCCAGCCCCACTACACCAGCCCCACCAGACAGCTGCTGCACGAGAGCACCATGGCCGTGGACGCCATCGTGCAGAAGCTGAAGAAGACCCACAACATGAGCGGCATGGGCCCCGAGCTGAAGGAGACCATCGGCAACGTGATCAACGAGAGCAGAGTGCTGAGAGACTTCCTGCACCAGAAGCTGATCCTGTTCAAGGGCATCGACATGAGCAACTGGAAGAACGAGACCGTGGACCAGCTGATCACCGACCTGGGCCAGCTGCACCAGGACAACCTGATGCTGGAGGAGCAGATCAAGAAGTACAAGAAGGAGCTGAAGCTGACCAAGAGCGCCATCCCCACCCTGGGCGTGGAGTTCCAGGACAGAATCAAGACCGAGATCGGCAAGATCGCCACCGACATGGGCGGCGCCGTGAAGGAGATCAGAAAGAAGTCCGGATATCCCTATGATGTGCCGGATTATGCTTCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQID NO:75)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTMEDNSVLNEDSNLEHVEGQPRRSMSQPVLNVEGDKRTSSTSATQQQVLSGAFSSADVRSIPIIQTWEENKALKTKITILRGELQMYQRRYSEAKEASQKRVKEVMDDYVDLKLGQENVQEKMEQYKLMEEDLLAMQSRIETSEDNFARQMKEFEAQKHAMEERIKELELSATDANNTTVGSFRGTLDDILKKNDPDFTLTSGYEERKINDLEAKLLSEIDKVAELEDHIQQLRQELDDQSARLADSENVRAQLEAATGQGILGAAGNAMVPNSTFMIGNGRESQTRDQLNYIDDLETKLADAKKENDKARQALVEYMNKCSKLEHEIRTMVKNSTFDSSSMLLGGQTSDELKIQIGKVNGELNVLRAENRELRIRCDQLTGGDGNLSISLGQSRLMAGIATNDVDSIGQGNETGGTSMRILPRESQLDDLEESKLPLMDTSSAVRNQQQFASMWEDFESVKDSLQNNHNDTLEGSFNSSMPPPGRDATQSFLSQKSFKNSPIVMQKPKSLHLHLKSHQSEGAGEQIQNNSFSTKTASPHVSQSHIPILHDMQQILDSSAMFLEGQHDVAVNVEQMQEKMSQIREALARLFERLKSSAALFEEILERMGSSDPNADKIKKMKLAFETSINDKLNVSAILEAAEKDLHNMSLNFSILEKSIVSQAAEASRRFTIAPDAEDVASSSLLNASYSPLFKFTSNSDIVEKLQNEVSELKNELEMARTRDMRSPLNGSSGRLSDVQINTNRMFEDLEVSEATLQKAKEENSTLKSQFAELEANLHQVNSKLGEVRCELNEALARVDGEQETRVKAENALEEARQLISSLKHEENELKKTITDMGMRLNEAKKSDEFLKSELSTALEEEKKSQNLADELSEELNGWRMRTKEAENKVEHASSEKSEMLERIVHLETEMEKLSTSEIAADYCSTKMTERKKEIELAKYREDFENAAIVGLERISKEISELTKKTLKAKIIPSNISSIQLVCDELCRRLSREREQQHEYAKVMRDVNEKIEKLQLEKDALEHELKMMSSNNENVPPVGTSVSGMPTKTSNQKCAQPHYTSPTRQLLHESTMAVDAIVQKLKKTHNMSGMGPELKETIGNVINESRVLRDFLHQKLILFKGIDMSNWKNETVDQLITDLGQLHQDNLMLEEQIKKYKKELKLTKSAIPTLGVEFQDRIKTEIGKIATDMGGAVKEIRKKSGYPYDVPDYASTMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:76)

KIF13A-FUS-PylRS^AF

DNA:

ATGTCGGATACCAAGGTAAAAGTTGCCGTCCGGGTCCGGCCCATGAACCGACGAGAACTGGAACTGAACACCAAGTGCGTGGTGGAGATGGAAGGGAATCAAACGGTCCTGCACCCTCCTCCTTCTAACACCAAACAGGGAGAAAGGAAACCTCCCAAGGTATTTGCCTTTGATTATTGCTTTTGGTCCATGGATGAATCTAACACTACAAAATACGCTGGTCAAGAAGTGGTTTTCAAGTGCCTTGGGGAAGGAATTCTTGAAAAAGCCTTTCAGGGGTATAATGCGTGTATTTTTGCATATGGACAGACAGGTTCGGGAAAATCCTTTTCCATGATGGGCCATGCTGAGCAGCTGGGCCTTATTCCAAGGCTCTGCTGTGCTTTATTTAAAAGGATCTCTTTGGAGCAAAATGAGTCACAGACCTTTAAAGTTGAAGTGTCCTATATGGAAATTTATAATGAGAAAGTTCGGGATCTTTTAGACCCCAAAGGGAGTAGACAGTCTCTTAAAGTTCGAGAACATAAAGTTTTGGGACCATATGTAGATGGTTTATCTCAACTAGCTGTCACTAGTTTTGAGGATATTGAGTCATTGATGTCTGAGGGAAATAAGTCTCGAACGGTAGCTGCTACCAACATGAACGAAGAAAGCAGCCGCTCCCATGCTGTGTTCAACATCATAATCACACAGACACTTTATGACCTGCAGTCTGGGAATTCCGGGGAGAAAGTCAGTAAGGTCAGCTTGGTAGACCTGGCGGGTAGCGAAAGAGTATCTAAAACAGGAGCTGCAGGAGAGCGACTGAAAGAAGGCAGCAACATTAACAAATCGCTTACAACCTTGGGGTTGGTTATATCATCACTGGCTGACCAGGCAGCTGGCAAGGGTAAAAGCAAATTTGTGCCTTATCGAGATTCAGTCCTCACTTGGCTGCTTAAGGACAACTTGGGGGGCAACAGCCAAACCTCTATGATAGCCACAATCAGCCCAGCCGCAGACAACTATGAAGAGACCCTCTCCACATTAAGATATGCAGACCGAGCCAAAAGGATTGTGAACCATGCTGTTGTGAATGAGGACCCCAACGCAAAAGTGATCCGAGAACTGCGGGAGGAAGTCGAGAAACTGAGAGAGCAGCTCTCTCAGGCAGAGGCCATGAAGGCCGAACTGAAGGAGAAGCTCGAAGAGTCTGAAAAGCTGATAAAAGAACTAACAGTGACTTGGGAATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:77)

蛋白:

MSDTKVKVAVRVRPMNRRELELNTKCVVEMEGNQTVLHPPPSNTKQGERKPPKVFAFDYCFWSMDESNTTKYAGQEVVFKCLGEGILEKAFQGYNACIFAYGQTGSGKSFSMMGHAEQLGLIPRLCCALFKRISLEQNESQTFKVEVSYMEIYNEKVRDLLDPKGSRQSLKVREHKVLGPYVDGLSQLAVTSFEDIESLMSEGNKSRTVAATNMNEESSRSHAVFNIIITQTLYDLQSGNSGEKVSKVSLVDLAGSERVSKTGAAGERLKEGSNINKSLTTLGLVISSLADQAAGKGKSKFVPYRDSVLTWLLKDNLGGNSQTSMIATISPAADNYEETLSTLRYADRAKRIVNHAVVNEDPNAKVIRELREEVEKLREQLSQAEAMKAELKEKLEESEKLIKELTVTWEYTDIEMNRLGKGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:78)

KIF13A-FUS-PylRS^AA

DNA:

ATGTCGGATACCAAGGTAAAAGTTGCCGTCCGGGTCCGGCCCATGAACCGACGAGAACTGGAACTGAACACCAAGTGCGTGGTGGAGATGGAAGGGAATCAAACGGTCCTGCACCCTCCTCCTTCTAACACCAAACAGGGAGAAAGGAAACCTCCCAAGGTATTTGCCTTTGATTATTGCTTTTGGTCCATGGATGAATCTAACACTACAAAATACGCTGGTCAAGAAGTGGTTTTCAAGTGCCTTGGGGAAGGAATTCTTGAAAAAGCCTTTCAGGGGTATAATGCGTGTATTTTTGCATATGGACAGACAGGTTCGGGAAAATCCTTTTCCATGATGGGCCATGCTGAGCAGCTGGGCCTTATTCCAAGGCTCTGCTGTGCTTTATTTAAAAGGATCTCTTTGGAGCAAAATGAGTCACAGACCTTTAAAGTTGAAGTGTCCTATATGGAAATTTATAATGAGAAAGTTCGGGATCTTTTAGACCCCAAAGGGAGTAGACAGTCTCTTAAAGTTCGAGAACATAAAGTTTTGGGACCATATGTAGATGGTTTATCTCAACTAGCTGTCACTAGTTTTGAGGATATTGAGTCATTGATGTCTGAGGGAAATAAGTCTCGAACGGTAGCTGCTACCAACATGAACGAAGAAAGCAGCCGCTCCCATGCTGTGTTCAACATCATAATCACACAGACACTTTATGACCTGCAGTCTGGGAATTCCGGGGAGAAAGTCAGTAAGGTCAGCTTGGTAGACCTGGCGGGTAGCGAAAGAGTATCTAAAACAGGAGCTGCAGGAGAGCGACTGAAAGAAGGCAGCAACATTAACAAATCGCTTACAACCTTGGGGTTGGTTATATCATCACTGGCTGACCAGGCAGCTGGCAAGGGTAAAAGCAAATTTGTGCCTTATCGAGATTCAGTCCTCACTTGGCTGCTTAAGGACAACTTGGGGGGCAACAGCCAAACCTCTATGATAGCCACAATCAGCCCAGCCGCAGACAACTATGAAGAGACCCTCTCCACATTAAGATATGCAGACCGAGCCAAAAGGATTGTGAACCATGCTGTTGTGAATGAGGACCCCAACGCAAAAGTGATCCGAGAACTGCGGGAGGAAGTCGAGAAACTGAGAGAGCAGCTCTCTCAGGCAGAGGCCATGAAGGCCGAACTGAAGGAGAAGCTCGAAGAGTCTGAAAAGCTGATAAAAGAACTAACAGTGACTTGGGAATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:79)

蛋白:

MSDTKVKVAVRVRPMNRRELELNTKCVVEMEGNQTVLHPPPSNTKQGERKPPKVFAFDYCFWSMDESNTTKYAGQEVVFKCLGEGILEKAFQGYNACIFAYGQTGSGKSFSMMGHAEQLGLIPRLCCALFKRISLEQNESQTFKVEVSYMEIYNEKVRDLLDPKGSRQSLKVREHKVLGPYVDGLSQLAVTSFEDIESLMSEGNKSRTVAATNMNEESSRSHAVFNIIITQTLYDLQSGNSGEKVSKVSLVDLAGSERVSKTGAAGERLKEGSNINKSLTTLGLVISSLADQAAGKGKSKFVPYRDSVLTWLLKDNLGGNSQTSMIATISPAADNYEETLSTLRYADRAKRIVNHAVVNEDPNAKVIRELREEVEKLREQLSQAEAMKAELKEKLEESEKLIKELTVTWEYTDIEMNRLGKGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGAPGSAGSAAGSGMACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:80)

KIF13A-FUS-PylRS^AAAF

DNA:

ATGTCGGATACCAAGGTAAAAGTTGCCGTCCGGGTCCGGCCCATGAACCGACGAGAACTGGAACTGAACACCAAGTGCGTGGTGGAGATGGAAGGGAATCAAACGGTCCTGCACCCTCCTCCTTCTAACACCAAACAGGGAGAAAGGAAACCTCCCAAGGTATTTGCCTTTGATTATTGCTTTTGGTCCATGGATGAATCTAACACTACAAAATACGCTGGTCAAGAAGTGGTTTTCAAGTGCCTTGGGGAAGGAATTCTTGAAAAAGCCTTTCAGGGGTATAATGCGTGTATTTTTGCATATGGACAGACAGGTTCGGGAAAATCCTTTTCCATGATGGGCCATGCTGAGCAGCTGGGCCTTATTCCAAGGCTCTGCTGTGCTTTATTTAAAAGGATCTCTTTGGAGCAAAATGAGTCACAGACCTTTAAAGTTGAAGTGTCCTATATGGAAATTTATAATGAGAAAGTTCGGGATCTTTTAGACCCCAAAGGGAGTAGACAGTCTCTTAAAGTTCGAGAACATAAAGTTTTGGGACCATATGTAGATGGTTTATCTCAACTAGCTGTCACTAGTTTTGAGGATATTGAGTCATTGATGTCTGAGGGAAATAAGTCTCGAACGGTAGCTGCTACCAACATGAACGAAGAAAGCAGCCGCTCCCATGCTGTGTTCAACATCATAATCACACAGACACTTTATGACCTGCAGTCTGGGAATTCCGGGGAGAAAGTCAGTAAGGTCAGCTTGGTAGACCTGGCGGGTAGCGAAAGAGTATCTAAAACAGGAGCTGCAGGAGAGCGACTGAAAGAAGGCAGCAACATTAACAAATCGCTTACAACCTTGGGGTTGGTTATATCATCACTGGCTGACCAGGCAGCTGGCAAGGGTAAAAGCAAATTTGTGCCTTATCGAGATTCAGTCCTCACTTGGCTGCTTAAGGACAACTTGGGGGGCAACAGCCAAACCTCTATGATAGCCACAATCAGCCCAGCCGCAGACAACTATGAAGAGACCCTCTCCACATTAAGATATGCAGACCGAGCCAAAAGGATTGTGAACCATGCTGTTGTGAATGAGGACCCCAACGCAAAAGTGATCCGAGAACTGCGGGAGGAAGTCGAGAAACTGAGAGAGCAGCTCTCTCAGGCAGAGGCCATGAAGGCCGAACTGAAGGAGAAGCTCGAAGAGTCTGAAAAGCTGATAAAAGAACTAACAGTGACTTGGGAATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:81)

蛋白:

MSDTKVKVAVRVRPMNRRELELNTKCVVEMEGNQTVLHPPPSNTKQGERKPPKVFAFDYCFWSMDESNTTKYAGQEVVFKCLGEGILEKAFQGYNACIFAYGQTGSGKSFSMMGHAEQLGLIPRLCCALFKRISLEQNESQTFKVEVSYMEIYNEKVRDLLDPKGSRQSLKVREHKVLGPYVDGLSQLAVTSFEDIESLMSEGNKSRTVAATNMNEESSRSHAVFNIIITQTLYDLQSGNSGEKVSKVSLVDLAGSERVSKTGAAGERLKEGSNINKSLTTLGLVISSLADQAAGKGKSKFVPYRDSVLTWLLKDNLGGNSQTSMIATISPAADNYEETLSTLRYADRAKRIVNHAVVNEDPNAKVIRELREEVEKLREQLSQAEAMKAELKEKLEESEKLIKELTVTWEYTDIEMNRLGKGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:82)

KIF13A-EWSR1-MCP

DNA:

ATGTCGGATACCAAGGTAAAAGTTGCCGTCCGGGTCCGGCCCATGAACCGACGAGAACTGGAACTGAACACCAAGTGCGTGGTGGAGATGGAAGGGAATCAAACGGTCCTGCACCCTCCTCCTTCTAACACCAAACAGGGAGAAAGGAAACCTCCCAAGGTATTTGCCTTTGATTATTGCTTTTGGTCCATGGATGAATCTAACACTACAAAATACGCTGGTCAAGAAGTGGTTTTCAAGTGCCTTGGGGAAGGAATTCTTGAAAAAGCCTTTCAGGGGTATAATGCGTGTATTTTTGCATATGGACAGACAGGTTCGGGAAAATCCTTTTCCATGATGGGCCATGCTGAGCAGCTGGGCCTTATTCCAAGGCTCTGCTGTGCTTTATTTAAAAGGATCTCTTTGGAGCAAAATGAGTCACAGACCTTTAAAGTTGAAGTGTCCTATATGGAAATTTATAATGAGAAAGTTCGGGATCTTTTAGACCCCAAAGGGAGTAGACAGTCTCTTAAAGTTCGAGAACATAAAGTTTTGGGACCATATGTAGATGGTTTATCTCAACTAGCTGTCACTAGTTTTGAGGATATTGAGTCATTGATGTCTGAGGGAAATAAGTCTCGAACGGTAGCTGCTACCAACATGAACGAAGAAAGCAGCCGCTCCCATGCTGTGTTCAACATCATAATCACACAGACACTTTATGACCTGCAGTCTGGGAATTCCGGGGAGAAAGTCAGTAAGGTCAGCTTGGTAGACCTGGCGGGTAGCGAAAGAGTATCTAAAACAGGAGCTGCAGGAGAGCGACTGAAAGAAGGCAGCAACATTAACAAATCGCTTACAACCTTGGGGTTGGTTATATCATCACTGGCTGACCAGGCAGCTGGCAAGGGTAAAAGCAAATTTGTGCCTTATCGAGATTCAGTCCTCACTTGGCTGCTTAAGGACAACTTGGGGGGCAACAGCCAAACCTCTATGATAGCCACAATCAGCCCAGCCGCAGACAACTATGAAGAGACCCTCTCCACATTAAGATATGCAGACCGAGCCAAAAGGATTGTGAACCATGCTGTTGTGAATGAGGACCCCAACGCAAAAGTGATCCGAGAACTGCGGGAGGAAGTCGAGAAACTGAGAGAGCAGCTCTCTCAGGCAGAGGCCATGAAGGCCGAACTGAAGGAGAAGCTCGAAGAGTCTGAAAAGCTGATAAAAGAACTAACAGTGACTTGGGAAATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATTACAAGGATGACGACGATAAGGGTACCGAGCAGAAGCTGATCTCAGAGGAGGACCTGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:83)

蛋白:

MSDTKVKVAVRVRPMNRRELELNTKCVVEMEGNQTVLHPPPSNTKQGERKPPKVFAFDYCFWSMDESNTTKYAGQEVVFKCLGEGILEKAFQGYNACIFAYGQTGSGKSFSMMGHAEQLGLIPRLCCALFKRISLEQNESQTFKVEVSYMEIYNEKVRDLLDPKGSRQSLKVREHKVLGPYVDGLSQLAVTSFEDIESLMSEGNKSRTVAATNMNEESSRSHAVFNIIITQTLYDLQSGNSGEKVSKVSLVDLAGSERVSKTGAAGERLKEGSNINKSLTTLGLVISSLADQAAGKGKSKFVPYRDSVLTWLLKDNLGGNSQTSMIATISPAADNYEETLSTLRYADRAKRIVNHAVVNEDPNAKVIRELREEVEKLREQLSQAEAMKAELKEKLEESEKLIKELTVTWEMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDYKDDDDKGTEQKLISEEDLGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(SEQ ID NO:84)

KIF13A-SPD5-PylRS^AF

DNA:

ATGTCGGATACCAAGGTAAAAGTTGCCGTCCGGGTCCGGCCCATGAACCGACGAGAACTGGAACTGAACACCAAGTGCGTGGTGGAGATGGAAGGGAATCAAACGGTCCTGCACCCTCCTCCTTCTAACACCAAACAGGGAGAAAGGAAACCTCCCAAGGTATTTGCCTTTGATTATTGCTTTTGGTCCATGGATGAATCTAACACTACAAAATACGCTGGTCAAGAAGTGGTTTTCAAGTGCCTTGGGGAAGGAATTCTTGAAAAAGCCTTTCAGGGGTATAATGCGTGTATTTTTGCATATGGACAGACAGGTTCGGGAAAATCCTTTTCCATGATGGGCCATGCTGAGCAGCTGGGCCTTATTCCAAGGCTCTGCTGTGCTTTATTTAAAAGGATCTCTTTGGAGCAAAATGAGTCACAGACCTTTAAAGTTGAAGTGTCCTATATGGAAATTTATAATGAGAAAGTTCGGGATCTTTTAGACCCCAAAGGGAGTAGACAGTCTCTTAAAGTTCGAGAACATAAAGTTTTGGGACCATATGTAGATGGTTTATCTCAACTAGCTGTCACTAGTTTTGAGGATATTGAGTCATTGATGTCTGAGGGAAATAAGTCTCGAACGGTAGCTGCTACCAACATGAACGAAGAAAGCAGCCGCTCCCATGCTGTGTTCAACATCATAATCACACAGACACTTTATGACCTGCAGTCTGGGAATTCCGGGGAGAAAGTCAGTAAGGTCAGCTTGGTAGACCTGGCGGGTAGCGAAAGAGTATCTAAAACAGGAGCTGCAGGAGAGCGACTGAAAGAAGGCAGCAACATTAACAAATCGCTTACAACCTTGGGGTTGGTTATATCATCACTGGCTGACCAGGCAGCTGGCAAGGGTAAAAGCAAATTTGTGCCTTATCGAGATTCAGTCCTCACTTGGCTGCTTAAGGACAACTTGGGGGGCAACAGCCAAACCTCTATGATAGCCACAATCAGCCCAGCCGCAGACAACTATGAAGAGACCCTCTCCACATTAAGATATGCAGACCGAGCCAAAAGGATTGTGAACCATGCTGTTGTGAATGAGGACCCCAACGCAAAAGTGATCCGAGAACTGCGGGAGGAAGTCGAGAAACTGAGAGAGCAGCTCTCTCAGGCAGAGGCCATGAAGGCCGAACTGAAGGAGAAGCTCGAAGAGTCTGAAAAGCTGATAAAAGAACTAACAGTGACTTGGGAAATGGAGGACAACAGCGTGCTGAACGAGGACAGCAACCTGGAGCACGTGGAGGGCCAGCCCAGAAGAAGCATGAGCCAGCCCGTGCTGAACGTGGAGGGCGACAAGAGAACCAGCAGCACCAGCGCCACCCAGCAGCAGGTGCTGAGCGGCGCCTTCAGCAGCGCCGACGTGAGAAGCATCCCCATCATCCAGACCTGGGAGGAGAACAAGGCCCTGAAGACCAAGATCACCATCCTGAGAGGCGAGCTGCAGATGTACCAGAGAAGATACAGCGAGGCCAAGGAGGCCAGCCAGAAGAGAGTGAAGGAGGTGATGGACGACTACGTGGACCTGAAGCTGGGCCAGGAGAACGTGCAGGAGAAGATGGAGCAGTACAAGCTGATGGAGGAGGACCTGCTGGCCATGCAGAGCAGAATCGAGACCAGCGAGGACAACTTCGCCAGACAGATGAAGGAGTTCGAGGCCCAGAAGCACGCCATGGAGGAGAGAATCAAGGAGCTGGAGCTGAGCGCCACCGACGCCAACAACACCACCGTGGGCAGCTTCAGAGGCACCCTGGACGACATCCTGAAGAAGAACGACCCCGACTTCACCCTGACCAGCGGCTACGAGGAGAGAAAGATCAACGACCTGGAGGCCAAGCTGCTGAGCGAGATCGACAAGGTGGCCGAGCTGGAGGACCACATCCAGCAGCTGAGACAGGAGCTGGACGACCAGAGCGCCAGACTGGCCGACAGCGAGAACGTGAGAGCCCAGCTGGAGGCCGCCACCGGCCAGGGCATCCTGGGCGCCGCCGGCAACGCCATGGTGCCCAACAGCACCTTCATGATCGGCAACGGCAGAGAGAGCCAGACCAGAGACCAGCTGAACTACATCGACGACCTGGAGACCAAGCTGGCCGACGCCAAGAAGGAGAACGACAAGGCCAGACAGGCCCTGGTGGAGTACATGAACAAGTGCAGCAAGCTGGAGCACGAGATCAGAACCATGGTGAAGAACAGCACCTTCGACAGCAGCAGCATGCTGCTGGGCGGCCAGACCAGCGACGAGCTGAAGATCCAGATCGGCAAGGTGAACGGCGAGCTGAACGTGCTGAGAGCCGAGAACAGAGAGCTGAGAATCAGATGCGACCAGCTGACCGGCGGCGACGGCAACCTGAGCATCAGCCTGGGCCAGAGCAGACTGATGGCCGGCATCGCCACCAACGACGTGGACAGCATCGGCCAGGGCAACGAGACCGGCGGCACCAGCATGAGAATCCTGCCCAGAGAGAGCCAGCTGGACGACCTGGAGGAGAGCAAGCTGCCCCTGATGGACACCAGCAGCGCCGTGAGAAACCAGCAGCAGTTCGCCAGCATGTGGGAGGACTTCGAGAGCGTGAAGGACAGCCTGCAGAACAACCACAACGACACCCTGGAGGGCAGCTTCAACAGCAGCATGCCCCCCCCCGGCAGAGACGCCACCCAGAGCTTCCTGAGCCAGAAGAGCTTCAAGAACAGCCCCATCGTGATGCAGAAGCCCAAGAGCCTGCACCTGCACCTGAAGAGCCACCAGAGCGAGGGCGCCGGCGAGCAGATCCAGAACAACAGCTTCAGCACCAAGACCGCCAGCCCCCACGTGAGCCAGAGCCACATCCCCATCCTGCACGACATGCAGCAGATCCTGGACAGCAGCGCCATGTTCCTGGAGGGCCAGCACGACGTGGCCGTGAACGTGGAGCAGATGCAGGAGAAGATGAGCCAGATCAGAGAGGCCCTGGCCAGACTGTTCGAGAGACTGAAGAGCAGCGCCGCCCTGTTCGAGGAGATCCTGGAGAGAATGGGCAGCAGCGACCCCAACGCCGACAAGATCAAGAAGATGAAGCTGGCCTTCGAGACCAGCATCAACGACAAGCTGAACGTGAGCGCCATCCTGGAGGCCGCCGAGAAGGACCTGCACAACATGAGCCTGAACTTCAGCATCCTGGAGAAGAGCATCGTGAGCCAGGCCGCCGAGGCCAGCAGAAGATTCACCATCGCCCCCGACGCCGAGGACGTGGCCAGCAGCAGCCTGCTGAACGCCAGCTACAGCCCCCTGTTCAAGTTCACCAGCAACAGCGACATCGTGGAGAAGCTGCAGAACGAGGTGAGCGAGCTGAAGAACGAGCTGGAGATGGCCAGAACCAGAGACATGAGAAGCCCCCTGAACGGCAGCAGCGGCAGACTGAGCGACGTGCAGATCAACACCAACAGAATGTTCGAGGACCTGGAGGTGAGCGAGGCCACCCTGCAGAAGGCCAAGGAGGAGAACAGCACCCTGAAGAGCCAGTTCGCCGAGCTGGAGGCCAACCTGCACCAGGTGAACAGCAAGCTGGGCGAGGTGAGATGCGAGCTGAACGAGGCCCTGGCCAGAGTGGACGGCGAGCAGGAGACCAGAGTGAAGGCCGAGAACGCCCTGGAGGAGGCCAGACAGCTGATCAGCAGCCTGAAGCACGAGGAGAACGAGCTGAAGAAGACCATCACCGACATGGGCATGAGACTGAACGAGGCCAAGAAGAGCGACGAGTTCCTGAAGAGCGAGCTGAGCACCGCCCTGGAGGAGGAGAAGAAGAGCCAGAACCTGGCCGACGAGCTGAGCGAGGAGCTGAACGGCTGGAGAATGAGAACCAAGGAGGCCGAGAACAAGGTGGAGCACGCCAGCAGCGAGAAGAGCGAGATGCTGGAGAGAATCGTGCACCTGGAGACCGAGATGGAGAAGCTGAGCACCAGCGAGATCGCCGCCGACTACTGCAGCACCAAGATGACCGAGAGAAAGAAGGAGATCGAGCTGGCCAAGTACAGAGAGGACTTCGAGAACGCCGCCATCGTGGGCCTGGAGAGAATCAGCAAGGAGATCAGCGAGCTGACCAAGAAGACCCTGAAGGCCAAGATCATCCCCAGCAACATCAGCAGCATCCAGCTGGTGTGCGACGAGCTGTGCAGAAGACTGAGCAGAGAGAGAGAGCAGCAGCACGAGTACGCCAAGGTGATGAGAGACGTGAACGAGAAGATCGAGAAGCTGCAGCTGGAGAAGGACGCCCTGGAGCACGAGCTGAAGATGATGAGCAGCAACAACGAGAACGTGCCCCCCGTGGGCACCAGCGTGAGCGGCATGCCCACCAAGACCAGCAACCAGAAGTGCGCCCAGCCCCACTACACCAGCCCCACCAGACAGCTGCTGCACGAGAGCACCATGGCCGTGGACGCCATCGTGCAGAAGCTGAAGAAGACCCACAACATGAGCGGCATGGGCCCCGAGCTGAAGGAGACCATCGGCAACGTGATCAACGAGAGCAGAGTGCTGAGAGACTTCCTGCACCAGAAGCTGATCCTGTTCAAGGGCATCGACATGAGCAACTGGAAGAACGAGACCGTGGACCAGCTGATCACCGACCTGGGCCAGCTGCACCAGGACAACCTGATGCTGGAGGAGCAGATCAAGAAGTACAAGAAGGAGCTGAAGCTGACCAAGAGCGCCATCCCCACCCTGGGCGTGGAGTTCCAGGACAGAATCAAGACCGAGATCGGCAAGATCGCCACCGACATGGGCGGCGCCGTGAAGGAGATCAGAAAGAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:85)

蛋白:

MSDTKVKVAVRVRPMNRRELELNTKCVVEMEGNQTVLHPPPSNTKQGERKPPKVFAFDYCFWSMDESNTTKYAGQEVVFKCLGEGILEKAFQGYNACIFAYGQTGSGKSFSMMGHAEQLGLIPRLCCALFKRISLEQNESQTFKVEVSYMEIYNEKVRDLLDPKGSRQSLKVREHKVLGPYVDGLSQLAVTSFEDIESLMSEGNKSRTVAATNMNEESSRSHAVFNIIITQTLYDLQSGNSGEKVSKVSLVDLAGSERVSKTGAAGERLKEGSNINKSLTTLGLVISSLADQAAGKGKSKFVPYRDSVLTWLLKDNLGGNSQTSMIATISPAADNYEETLSTLRYADRAKRIVNHAVVNEDPNAKVIRELREEVEKLREQLSQAEAMKAELKEKLEESEKLIKELTVTWEMEDNSVLNEDSNLEHVEGQPRRSMSQPVLNVEGDKRTSSTSATQQQVLSGAFSSADVRSIPIIQTWEENKALKTKITILRGELQMYQRRYSEAKEASQKRVKEVMDDYVDLKLGQENVQEKMEQYKLMEEDLLAMQSRIETSEDNFARQMKEFEAQKHAMEERIKELELSATDANNTTVGSFRGTLDDILKKNDPDFTLTSGYEERKINDLEAKLLSEIDKVAELEDHIQQLRQELDDQSARLADSENVRAQLEAATGQGILGAAGNAMVPNSTFMIGNGRESQTRDQLNYIDDLETKLADAKKENDKARQALVEYMNKCSKLEHEIRTMVKNSTFDSSSMLLGGQTSDELKIQIGKVNGELNVLRAENRELRIRCDQLTGGDGNLSISLGQSRLMAGIATNDVDSIGQGNETGGTSMRILPRESQLDDLEESKLPLMDTSSAVRNQQQFASMWEDFESVKDSLQNNHNDTLEGSFNSSMPPPGRDATQSFLSQKSFKNSPIVMQKPKSLHLHLKSHQSEGAGEQIQNNSFSTKTASPHVSQSHIPILHDMQQILDSSAMFLEGQHDVAVNVEQMQEKMSQIREALARLFERLKSSAALFEEILERMGSSDPNADKIKKMKLAFETSINDKLNVSAILEAAEKDLHNMSLNFSILEKSIVSQAAEASRRFTIAPDAEDVASSSLLNASYSPLFKFTSNSDIVEKLQNEVSELKNELEMARTRDMRSPLNGSSGRLSDVQINTNRMFEDLEVSEATLQKAKEENSTLKSQFAELEANLHQVNSKLGEVRCELNEALARVDGEQETRVKAENALEEARQLISSLKHEENELKKTITDMGMRLNEAKKSDEFLKSELSTALEEEKKSQNLADELSEELNGWRMRTKEAENKVEHASSEKSEMLERIVHLETEMEKLSTSEIAADYCSTKMTERKKEIELAKYREDFENAAIVGLERISKEISELTKKTLKAKIIPSNISSIQLVCDELCRRLSREREQQHEYAKVMRDVNEKIEKLQLEKDALEHELKMMSSNNENVPPVGTSVSGMPTKTSNQKCAQPHYTSPTRQLLHESTMAVDAIVQKLKKTHNMSGMGPELKETIGNVINESRVLRDFLHQKLILFKGIDMSNWKNETVDQLITDLGQLHQDNLMLEEQIKKYKKELKLTKSAIPTLGVEFQDRIKTEIGKIATDMGGAVKEIRKKGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:86)

KIF13A-SPD5-MCP

DNA:

ATGTCGGATACCAAGGTAAAAGTTGCCGTCCGGGTCCGGCCCATGAACCGACGAGAACTGGAACTGAACACCAAGTGCGTGGTGGAGATGGAAGGGAATCAAACGGTCCTGCACCCTCCTCCTTCTAACACCAAACAGGGAGAAAGGAAACCTCCCAAGGTATTTGCCTTTGATTATTGCTTTTGGTCCATGGATGAATCTAACACTACAAAATACGCTGGTCAAGAAGTGGTTTTCAAGTGCCTTGGGGAAGGAATTCTTGAAAAAGCCTTTCAGGGGTATAATGCGTGTATTTTTGCATATGGACAGACAGGTTCGGGAAAATCCTTTTCCATGATGGGCCATGCTGAGCAGCTGGGCCTTATTCCAAGGCTCTGCTGTGCTTTATTTAAAAGGATCTCTTTGGAGCAAAATGAGTCACAGACCTTTAAAGTTGAAGTGTCCTATATGGAAATTTATAATGAGAAAGTTCGGGATCTTTTAGACCCCAAAGGGAGTAGACAGTCTCTTAAAGTTCGAGAACATAAAGTTTTGGGACCATATGTAGATGGTTTATCTCAACTAGCTGTCACTAGTTTTGAGGATATTGAGTCATTGATGTCTGAGGGAAATAAGTCTCGAACGGTAGCTGCTACCAACATGAACGAAGAAAGCAGCCGCTCCCATGCTGTGTTCAACATCATAATCACACAGACACTTTATGACCTGCAGTCTGGGAATTCCGGGGAGAAAGTCAGTAAGGTCAGCTTGGTAGACCTGGCGGGTAGCGAAAGAGTATCTAAAACAGGAGCTGCAGGAGAGCGACTGAAAGAAGGCAGCAACATTAACAAATCGCTTACAACCTTGGGGTTGGTTATATCATCACTGGCTGACCAGGCAGCTGGCAAGGGTAAAAGCAAATTTGTGCCTTATCGAGATTCAGTCCTCACTTGGCTGCTTAAGGACAACTTGGGGGGCAACAGCCAAACCTCTATGATAGCCACAATCAGCCCAGCCGCAGACAACTATGAAGAGACCCTCTCCACATTAAGATATGCAGACCGAGCCAAAAGGATTGTGAACCATGCTGTTGTGAATGAGGACCCCAACGCAAAAGTGATCCGAGAACTGCGGGAGGAAGTCGAGAAACTGAGAGAGCAGCTCTCTCAGGCAGAGGCCATGAAGGCCGAACTGAAGGAGAAGCTCGAAGAGTCTGAAAAGCTGATAAAAGAACTAACAGTGACTTGGGAAATGGAGGACAACAGCGTGCTGAACGAGGACAGCAACCTGGAGCACGTGGAGGGCCAGCCCAGAAGAAGCATGAGCCAGCCCGTGCTGAACGTGGAGGGCGACAAGAGAACCAGCAGCACCAGCGCCACCCAGCAGCAGGTGCTGAGCGGCGCCTTCAGCAGCGCCGACGTGAGAAGCATCCCCATCATCCAGACCTGGGAGGAGAACAAGGCCCTGAAGACCAAGATCACCATCCTGAGAGGCGAGCTGCAGATGTACCAGAGAAGATACAGCGAGGCCAAGGAGGCCAGCCAGAAGAGAGTGAAGGAGGTGATGGACGACTACGTGGACCTGAAGCTGGGCCAGGAGAACGTGCAGGAGAAGATGGAGCAGTACAAGCTGATGGAGGAGGACCTGCTGGCCATGCAGAGCAGAATCGAGACCAGCGAGGACAACTTCGCCAGACAGATGAAGGAGTTCGAGGCCCAGAAGCACGCCATGGAGGAGAGAATCAAGGAGCTGGAGCTGAGCGCCACCGACGCCAACAACACCACCGTGGGCAGCTTCAGAGGCACCCTGGACGACATCCTGAAGAAGAACGACCCCGACTTCACCCTGACCAGCGGCTACGAGGAGAGAAAGATCAACGACCTGGAGGCCAAGCTGCTGAGCGAGATCGACAAGGTGGCCGAGCTGGAGGACCACATCCAGCAGCTGAGACAGGAGCTGGACGACCAGAGCGCCAGACTGGCCGACAGCGAGAACGTGAGAGCCCAGCTGGAGGCCGCCACCGGCCAGGGCATCCTGGGCGCCGCCGGCAACGCCATGGTGCCCAACAGCACCTTCATGATCGGCAACGGCAGAGAGAGCCAGACCAGAGACCAGCTGAACTACATCGACGACCTGGAGACCAAGCTGGCCGACGCCAAGAAGGAGAACGACAAGGCCAGACAGGCCCTGGTGGAGTACATGAACAAGTGCAGCAAGCTGGAGCACGAGATCAGAACCATGGTGAAGAACAGCACCTTCGACAGCAGCAGCATGCTGCTGGGCGGCCAGACCAGCGACGAGCTGAAGATCCAGATCGGCAAGGTGAACGGCGAGCTGAACGTGCTGAGAGCCGAGAACAGAGAGCTGAGAATCAGATGCGACCAGCTGACCGGCGGCGACGGCAACCTGAGCATCAGCCTGGGCCAGAGCAGACTGATGGCCGGCATCGCCACCAACGACGTGGACAGCATCGGCCAGGGCAACGAGACCGGCGGCACCAGCATGAGAATCCTGCCCAGAGAGAGCCAGCTGGACGACCTGGAGGAGAGCAAGCTGCCCCTGATGGACACCAGCAGCGCCGTGAGAAACCAGCAGCAGTTCGCCAGCATGTGGGAGGACTTCGAGAGCGTGAAGGACAGCCTGCAGAACAACCACAACGACACCCTGGAGGGCAGCTTCAACAGCAGCATGCCCCCCCCCGGCAGAGACGCCACCCAGAGCTTCCTGAGCCAGAAGAGCTTCAAGAACAGCCCCATCGTGATGCAGAAGCCCAAGAGCCTGCACCTGCACCTGAAGAGCCACCAGAGCGAGGGCGCCGGCGAGCAGATCCAGAACAACAGCTTCAGCACCAAGACCGCCAGCCCCCACGTGAGCCAGAGCCACATCCCCATCCTGCACGACATGCAGCAGATCCTGGACAGCAGCGCCATGTTCCTGGAGGGCCAGCACGACGTGGCCGTGAACGTGGAGCAGATGCAGGAGAAGATGAGCCAGATCAGAGAGGCCCTGGCCAGACTGTTCGAGAGACTGAAGAGCAGCGCCGCCCTGTTCGAGGAGATCCTGGAGAGAATGGGCAGCAGCGACCCCAACGCCGACAAGATCAAGAAGATGAAGCTGGCCTTCGAGACCAGCATCAACGACAAGCTGAACGTGAGCGCCATCCTGGAGGCCGCCGAGAAGGACCTGCACAACATGAGCCTGAACTTCAGCATCCTGGAGAAGAGCATCGTGAGCCAGGCCGCCGAGGCCAGCAGAAGATTCACCATCGCCCCCGACGCCGAGGACGTGGCCAGCAGCAGCCTGCTGAACGCCAGCTACAGCCCCCTGTTCAAGTTCACCAGCAACAGCGACATCGTGGAGAAGCTGCAGAACGAGGTGAGCGAGCTGAAGAACGAGCTGGAGATGGCCAGAACCAGAGACATGAGAAGCCCCCTGAACGGCAGCAGCGGCAGACTGAGCGACGTGCAGATCAACACCAACAGAATGTTCGAGGACCTGGAGGTGAGCGAGGCCACCCTGCAGAAGGCCAAGGAGGAGAACAGCACCCTGAAGAGCCAGTTCGCCGAGCTGGAGGCCAACCTGCACCAGGTGAACAGCAAGCTGGGCGAGGTGAGATGCGAGCTGAACGAGGCCCTGGCCAGAGTGGACGGCGAGCAGGAGACCAGAGTGAAGGCCGAGAACGCCCTGGAGGAGGCCAGACAGCTGATCAGCAGCCTGAAGCACGAGGAGAACGAGCTGAAGAAGACCATCACCGACATGGGCATGAGACTGAACGAGGCCAAGAAGAGCGACGAGTTCCTGAAGAGCGAGCTGAGCACCGCCCTGGAGGAGGAGAAGAAGAGCCAGAACCTGGCCGACGAGCTGAGCGAGGAGCTGAACGGCTGGAGAATGAGAACCAAGGAGGCCGAGAACAAGGTGGAGCACGCCAGCAGCGAGAAGAGCGAGATGCTGGAGAGAATCGTGCACCTGGAGACCGAGATGGAGAAGCTGAGCACCAGCGAGATCGCCGCCGACTACTGCAGCACCAAGATGACCGAGAGAAAGAAGGAGATCGAGCTGGCCAAGTACAGAGAGGACTTCGAGAACGCCGCCATCGTGGGCCTGGAGAGAATCAGCAAGGAGATCAGCGAGCTGACCAAGAAGACCCTGAAGGCCAAGATCATCCCCAGCAACATCAGCAGCATCCAGCTGGTGTGCGACGAGCTGTGCAGAAGACTGAGCAGAGAGAGAGAGCAGCAGCACGAGTACGCCAAGGTGATGAGAGACGTGAACGAGAAGATCGAGAAGCTGCAGCTGGAGAAGGACGCCCTGGAGCACGAGCTGAAGATGATGAGCAGCAACAACGAGAACGTGCCCCCCGTGGGCACCAGCGTGAGCGGCATGCCCACCAAGACCAGCAACCAGAAGTGCGCCCAGCCCCACTACACCAGCCCCACCAGACAGCTGCTGCACGAGAGCACCATGGCCGTGGACGCCATCGTGCAGAAGCTGAAGAAGACCCACAACATGAGCGGCATGGGCCCCGAGCTGAAGGAGACCATCGGCAACGTGATCAACGAGAGCAGAGTGCTGAGAGACTTCCTGCACCAGAAGCTGATCCTGTTCAAGGGCATCGACATGAGCAACTGGAAGAACGAGACCGTGGACCAGCTGATCACCGACCTGGGCCAGCTGCACCAGGACAACCTGATGCTGGAGGAGCAGATCAAGAAGTACAAGAAGGAGCTGAAGCTGACCAAGAGCGCCATCCCCACCCTGGGCGTGGAGTTCCAGGACAGAATCAAGACCGAGATCGGCAAGATCGCCACCGACATGGGCGGCGCCGTGAAGGAGATCAGAAAGAAGGGTACCGAGCAGAAGCTGATCTCAGAGGAGGACCTGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:87)

蛋白:

MSDTKVKVAVRVRPMNRRELELNTKCVVEMEGNQTVLHPPPSNTKQGERKPPKVFAFDYCFWSMDESNTTKYAGQEVVFKCLGEGILEKAFQGYNACIFAYGQTGSGKSFSMMGHAEQLGLIPRLCCALFKRISLEQNESQTFKVEVSYMEIYNEKVRDLLDPKGSRQSLKVREHKVLGPYVDGLSQLAVTSFEDIESLMSEGNKSRTVAATNMNEESSRSHAVFNIIITQTLYDLQSGNSGEKVSKVSLVDLAGSERVSKTGAAGERLKEGSNINKSLTTLGLVISSLADQAAGKGKSKFVPYRDSVLTWLLKDNLGGNSQTSMIATISPAADNYEETLSTLRYADRAKRIVNHAVVNEDPNAKVIRELREEVEKLREQLSQAEAMKAELKEKLEESEKLIKELTVTWEMEDNSVLNEDSNLEHVEGQPRRSMSQPVLNVEGDKRTSSTSATQQQVLSGAFSSADVRSIPIIQTWEENKALKTKITILRGELQMYQRRYSEAKEASQKRVKEVMDDYVDLKLGQENVQEKMEQYKLMEEDLLAMQSRIETSEDNFARQMKEFEAQKHAMEERIKELELSATDANNTTVGSFRGTLDDILKKNDPDFTLTSGYEERKINDLEAKLLSEIDKVAELEDHIQQLRQELDDQSARLADSENVRAQLEAATGQGILGAAGNAMVPNSTFMIGNGRESQTRDQLNYIDDLETKLADAKKENDKARQALVEYMNKCSKLEHEIRTMVKNSTFDSSSMLLGGQTSDELKIQIGKVNGELNVLRAENRELRIRCDQLTGGDGNLSISLGQSRLMAGIATNDVDSIGQGNETGGTSMRILPRESQLDDLEESKLPLMDTSSAVRNQQQFASMWEDFESVKDSLQNNHNDTLEGSFNSSMPPPGRDATQSFLSQKSFKNSPIVMQKPKSLHLHLKSHQSEGAGEQIQNNSFSTKTASPHVSQSHIPILHDMQQILDSSAMFLEGQHDVAVNVEQMQEKMSQIREALARLFERLKSSAALFEEILERMGSSDPNADKIKKMKLAFETSINDKLNVSAILEAAEKDLHNMSLNFSILEKSIVSQAAEASRRFTIAPDAEDVASSSLLNASYSPLFKFTSNSDIVEKLQNEVSELKNELEMARTRDMRSPLNGSSGRLSDVQINTNRMFEDLEVSEATLQKAKEENSTLKSQFAELEANLHQVNSKLGEVRCELNEALARVDGEQETRVKAENALEEARQLISSLKHEENELKKTITDMGMRLNEAKKSDEFLKSELSTALEEEKKSQNLADELSEELNGWRMRTKEAENKVEHASSEKSEMLERIVHLETEMEKLSTSEIAADYCSTKMTERKKEIELAKYREDFENAAIVGLERISKEISELTKKTLKAKIIPSNISSIQLVCDELCRRLSREREQQHEYAKVMRDVNEKIEKLQLEKDALEHELKMMSSNNENVPPVGTSVSGMPTKTSNQKCAQPHYTSPTRQLLHESTMAVDAIVQKLKKTHNMSGMGPELKETIGNVINESRVLRDFLHQKLILFKGIDMSNWKNETVDQLITDLGQLHQDNLMLEEQIKKYKKELKLTKSAIPTLGVEFQDRIKTEIGKIATDMGGAVKEIRKKGTEQKLISEEDLGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(SEQ ID NO:88)

KIF13A-FUS-MCP-PylRS^AF

DNA:

ATGTCGGATACCAAGGTAAAAGTTGCCGTCCGGGTCCGGCCCATGAACCGACGAGAACTGGAACTGAACACCAAGTGCGTGGTGGAGATGGAAGGGAATCAAACGGTCCTGCACCCTCCTCCTTCTAACACCAAACAGGGAGAAAGGAAACCTCCCAAGGTATTTGCCTTTGATTATTGCTTTTGGTCCATGGATGAATCTAACACTACAAAATACGCTGGTCAAGAAGTGGTTTTCAAGTGCCTTGGGGAAGGAATTCTTGAAAAAGCCTTTCAGGGGTATAATGCGTGTATTTTTGCATATGGACAGACAGGTTCGGGAAAATCCTTTTCCATGATGGGCCATGCTGAGCAGCTGGGCCTTATTCCAAGGCTCTGCTGTGCTTTATTTAAAAGGATCTCTTTGGAGCAAAATGAGTCACAGACCTTTAAAGTTGAAGTGTCCTATATGGAAATTTATAATGAGAAAGTTCGGGATCTTTTAGACCCCAAAGGGAGTAGACAGTCTCTTAAAGTTCGAGAACATAAAGTTTTGGGACCATATGTAGATGGTTTATCTCAACTAGCTGTCACTAGTTTTGAGGATATTGAGTCATTGATGTCTGAGGGAAATAAGTCTCGAACGGTAGCTGCTACCAACATGAACGAAGAAAGCAGCCGCTCCCATGCTGTGTTCAACATCATAATCACACAGACACTTTATGACCTGCAGTCTGGGAATTCCGGGGAGAAAGTCAGTAAGGTCAGCTTGGTAGACCTGGCGGGTAGCGAAAGAGTATCTAAAACAGGAGCTGCAGGAGAGCGACTGAAAGAAGGCAGCAACATTAACAAATCGCTTACAACCTTGGGGTTGGTTATATCATCACTGGCTGACCAGGCAGCTGGCAAGGGTAAAAGCAAATTTGTGCCTTATCGAGATTCAGTCCTCACTTGGCTGCTTAAGGACAACTTGGGGGGCAACAGCCAAACCTCTATGATAGCCACAATCAGCCCAGCCGCAGACAACTATGAAGAGACCCTCTCCACATTAAGATATGCAGACCGAGCCAAAAGGATTGTGAACCATGCTGTTGTGAATGAGGACCCCAACGCAAAAGTGATCCGAGAACTGCGGGAGGAAGTCGAGAAACTGAGAGAGCAGCTCTCTCAGGCAGAGGCCATGAAGGCCGAACTGAAGGAGAAGCTCGAAGAGTCTGAAAAGCTGATAAAAGAACTAACAGTGACTTGGGAATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:89)

蛋白:

MSDTKVKVAVRVRPMNRRELELNTKCVVEMEGNQTVLHPPPSNTKQGERKPPKVFAFDYCFWSMDESNTTKYAGQEVVFKCLGEGILEKAFQGYNACIFAYGQTGSGKSFSMMGHAEQLGLIPRLCCALFKRISLEQNESQTFKVEVSYMEIYNEKVRDLLDPKGSRQSLKVREHKVLGPYVDGLSQLAVTSFEDIESLMSEGNKSRTVAATNMNEESSRSHAVFNIIITQTLYDLQSGNSGEKVSKVSLVDLAGSERVSKTGAAGERLKEGSNINKSLTTLGLVISSLADQAAGKGKSKFVPYRDSVLTWLLKDNLGGNSQTSMIATISPAADNYEETLSTLRYADRAKRIVNHAVVNEDPNAKVIRELREEVEKLREQLSQAEAMKAELKEKLEESEKLIKELTVTWEYTDIEMNRLGKGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:90)

KIF13A-PylRS^AF

DNA:

ATGTCGGATACCAAGGTAAAAGTTGCCGTCCGGGTCCGGCCCATGAACCGACGAGAACTGGAACTGAACACCAAGTGCGTGGTGGAGATGGAAGGGAATCAAACGGTCCTGCACCCTCCTCCTTCTAACACCAAACAGGGAGAAAGGAAACCTCCCAAGGTATTTGCCTTTGATTATTGCTTTTGGTCCATGGATGAATCTAACACTACAAAATACGCTGGTCAAGAAGTGGTTTTCAAGTGCCTTGGGGAAGGAATTCTTGAAAAAGCCTTTCAGGGGTATAATGCGTGTATTTTTGCATATGGACAGACAGGTTCGGGAAAATCCTTTTCCATGATGGGCCATGCTGAGCAGCTGGGCCTTATTCCAAGGCTCTGCTGTGCTTTATTTAAAAGGATCTCTTTGGAGCAAAATGAGTCACAGACCTTTAAAGTTGAAGTGTCCTATATGGAAATTTATAATGAGAAAGTTCGGGATCTTTTAGACCCCAAAGGGAGTAGACAGTCTCTTAAAGTTCGAGAACATAAAGTTTTGGGACCATATGTAGATGGTTTATCTCAACTAGCTGTCACTAGTTTTGAGGATATTGAGTCATTGATGTCTGAGGGAAATAAGTCTCGAACGGTAGCTGCTACCAACATGAACGAAGAAAGCAGCCGCTCCCATGCTGTGTTCAACATCATAATCACACAGACACTTTATGACCTGCAGTCTGGGAATTCCGGGGAGAAAGTCAGTAAGGTCAGCTTGGTAGACCTGGCGGGTAGCGAAAGAGTATCTAAAACAGGAGCTGCAGGAGAGCGACTGAAAGAAGGCAGCAACATTAACAAATCGCTTACAACCTTGGGGTTGGTTATATCATCACTGGCTGACCAGGCAGCTGGCAAGGGTAAAAGCAAATTTGTGCCTTATCGAGATTCAGTCCTCACTTGGCTGCTTAAGGACAACTTGGGGGGCAACAGCCAAACCTCTATGATAGCCACAATCAGCCCAGCCGCAGACAACTATGAAGAGACCCTCTCCACATTAAGATATGCAGACCGAGCCAAAAGGATTGTGAACCATGCTGTTGTGAATGAGGACCCCAACGCAAAAGTGATCCGAGAACTGCGGGAGGAAGTCGAGAAACTGAGAGAGCAGCTCTCTCAGGCAGAGGCCATGAAGGCCGAACTGAAGGAGAAGCTCGAAGAGTCTGAAAAGCTGATAAAAGAACTAACAGTGACTTGGGAATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:91)

蛋白:

MSDTKVKVAVRVRPMNRRELELNTKCVVEMEGNQTVLHPPPSNTKQGERKPPKVFAFDYCFWSMDESNTTKYAGQEVVFKCLGEGILEKAFQGYNACIFAYGQTGSGKSFSMMGHAEQLGLIPRLCCALFKRISLEQNESQTFKVEVSYMEIYNEKVRDLLDPKGSRQSLKVREHKVLGPYVDGLSQLAVTSFEDIESLMSEGNKSRTVAATNMNEESSRSHAVFNIIITQTLYDLQSGNSGEKVSKVSLVDLAGSERVSKTGAAGERLKEGSNINKSLTTLGLVISSLADQAAGKGKSKFVPYRDSVLTWLLKDNLGGNSQTSMIATISPAADNYEETLSTLRYADRAKRIVNHAVVNEDPNAKVIRELREEVEKLREQLSQAEAMKAELKEKLEESEKLIKELTVTWEYTDIEMNRLGKGAPGSAGSAAGSGMACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:92)

KIF13A-MCP

DNA:

ATGTCGGATACCAAGGTAAAAGTTGCCGTCCGGGTCCGGCCCATGAACCGACGAGAACTGGAACTGAACACCAAGTGCGTGGTGGAGATGGAAGGGAATCAAACGGTCCTGCACCCTCCTCCTTCTAACACCAAACAGGGAGAAAGGAAACCTCCCAAGGTATTTGCCTTTGATTATTGCTTTTGGTCCATGGATGAATCTAACACTACAAAATACGCTGGTCAAGAAGTGGTTTTCAAGTGCCTTGGGGAAGGAATTCTTGAAAAAGCCTTTCAGGGGTATAATGCGTGTATTTTTGCATATGGACAGACAGGTTCGGGAAAATCCTTTTCCATGATGGGCCATGCTGAGCAGCTGGGCCTTATTCCAAGGCTCTGCTGTGCTTTATTTAAAAGGATCTCTTTGGAGCAAAATGAGTCACAGACCTTTAAAGTTGAAGTGTCCTATATGGAAATTTATAATGAGAAAGTTCGGGATCTTTTAGACCCCAAAGGGAGTAGACAGTCTCTTAAAGTTCGAGAACATAAAGTTTTGGGACCATATGTAGATGGTTTATCTCAACTAGCTGTCACTAGTTTTGAGGATATTGAGTCATTGATGTCTGAGGGAAATAAGTCTCGAACGGTAGCTGCTACCAACATGAACGAAGAAAGCAGCCGCTCCCATGCTGTGTTCAACATCATAATCACACAGACACTTTATGACCTGCAGTCTGGGAATTCCGGGGAGAAAGTCAGTAAGGTCAGCTTGGTAGACCTGGCGGGTAGCGAAAGAGTATCTAAAACAGGAGCTGCAGGAGAGCGACTGAAAGAAGGCAGCAACATTAACAAATCGCTTACAACCTTGGGGTTGGTTATATCATCACTGGCTGACCAGGCAGCTGGCAAGGGTAAAAGCAAATTTGTGCCTTATCGAGATTCAGTCCTCACTTGGCTGCTTAAGGACAACTTGGGGGGCAACAGCCAAACCTCTATGATAGCCACAATCAGCCCAGCCGCAGACAACTATGAAGAGACCCTCTCCACATTAAGATATGCAGACCGAGCCAAAAGGATTGTGAACCATGCTGTTGTGAATGAGGACCCCAACGCAAAAGTGATCCGAGAACTGCGGGAGGAAGTCGAGAAACTGAGAGAGCAGCTCTCTCAGGCAGAGGCCATGAAGGCCGAACTGAAGGAGAAGCTCGAAGAGTCTGAAAAGCTGATAAAAGAACTAACAGTGACTTGGGAATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ IDNO:93)

蛋白:

MSDTKVKVAVRVRPMNRRELELNTKCVVEMEGNQTVLHPPPSNTKQGERKPPKVFAFDYCFWSMDESNTTKYAGQEVVFKCLGEGILEKAFQGYNACIFAYGQTGSGKSFSMMGHAEQLGLIPRLCCALFKRISLEQNESQTFKVEVSYMEIYNEKVRDLLDPKGSRQSLKVREHKVLGPYVDGLSQLAVTSFEDIESLMSEGNKSRTVAATNMNEESSRSHAVFNIIITQTLYDLQSGNSGEKVSKVSLVDLAGSERVSKTGAAGERLKEGSNINKSLTTLGLVISSLADQAAGKGKSKFVPYRDSVLTWLLKDNLGGNSQTSMIATISPAADNYEETLSTLRYADRAKRIVNHAVVNEDPNAKVIRELREEVEKLREQLSQAEAMKAELKEKLEESEKLIKELTVTWEYTDIEMNRLGKGAPGSAGSAAGSGMASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(SEQ ID NO:94)

TOMM20-EWSR1-MCP

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAGTTCTTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATTACAAGGATGACGACGATAAGGGTACCGAGCAGAAGCTGATCTCAGAGGAGGACCTGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:95)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDYKDDDDKGTEQKLISEEDLGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(SEQ ID NO:96)

TOMM20-EWSR1-HA-MCP

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAGTTCTTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:97)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(SEQ ID NO:98)

TOMM20-FUS-PylRS^AF

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAACACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:99)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSNTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:100)

TOMM20-FUS-V5-PylRS^AF

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAACACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:101)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSNTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ IDNO:102)

TOMM20-FUS-PylRS^AA

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAGTTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ IDNO:103)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGAPGSAGSAAGSGMACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:104)

TOMM20-FUS-V5-PylRS^AA

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAACACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:105)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSNTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESI ITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ IDNO:106)

TOMM20-FUS-PylRS^AAAF

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAACACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:107)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSNTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESI ITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:108)

TOMM20-FUS-V5-PylRS^AAAF

DNA:ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAACACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:109)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSNTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ IDNO:110)

TOMM20-EWSR1-λ_N22

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAGTTCTTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCAGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTTAA(SEQ ID NO:111)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAGAPGSAGSAAGSGEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPV(SEQ ID NO:112)

TOMM20-EWSR1-Myc-λ_N22

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAGTTCTTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCAGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTTAA(SEQ ID NO:113)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAGAPGSAGSAAGSGEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPV(SEQ ID NO:114)

TOMM20-3xMCP-PylRS^AF

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAGTTCTTCTATACAGATATTGAAATGAACAGATTGGGAAAGGAGCAGAAGCTGATCTCAGAGGAGGACCTGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTGCCCCAGGCTCCGCAGGAAGCGCAGCGGGGTCCGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCACCTGGTAGTGCTGGTTCTGCTGCTGGATCAGGTGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:115)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFYTDIEMNRLGKEQKLISEEDLGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:116)

TOMM20-FUS-3xMCP-PylRS^AF

DNA:ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAACACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGAGCAGAAGCTGATCTCAGAGGAGGACCTGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTGCCCCAGGCTCCGCAGGAAGCGCAGCGGGGTCCGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCACCTGGTAGTGCTGGTTCTGCTGCTGGATCAGGTGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:117)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSNTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGEQKLISEEDLGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ IDNO:118)

TOMM20-FUS-3xMCP-PylRS^AAAF

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAACACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGAGCAGAAGCTGATCTCAGAGGAGGACCTGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTGCCCCAGGCTCCGCAGGAAGCGCAGCGGGGTCCGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCACCTGGTAGTGCTGGTTCTGCTGCTGGATCAGGTGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:119)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSNTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGEQKLISEEDLGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ IDNO:120)

TOMM20-FUS-4xλ_N22-PylRS^AF

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAACACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:121)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSNTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDYKDDDDKGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:122)

TOMM20-FUS-4xλ_N22-PylRS^AAAF

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAACACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:123)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSNTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDYKDDDDKGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:124)

LcK-EWSR1-MCP

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCCACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATTACAAGGATGACGACGATAAGGGTACCGAGCAGAAGCTGATCTCAGAGGAGGACCTGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:125)

蛋白:

MGCVCSSNPEGTELASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDYKDDDDKGTEQKLISEEDLGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(SEQ ID NO:126)

LcK-EWSR1-4xλ_N22

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATTACAAGGATGACGACGATAAGGGTACCGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGA(SEQ ID NO:127)

蛋白:

MGCVCSSNPEGTELASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDYKDDDDKGTEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPVKPADQPRLCLLVASHLLFAPPPCLP(SEQ ID NO:128)

LcK-FUS-PylRS^AF

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAACACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:129)

蛋白:

MGCVCSSNPEGTELASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSNTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:130)

LcK-FUS-MCP-PylRS^AF

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:131)

蛋白:

MGCVCSSNPEGTELASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:132)

LCK-FUS-3xMCP-PylRS^AF

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAACACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGAGCAGAAGCTGATCTCAGAGGAGGACCTGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTGCCCCAGGCTCCGCAGGAAGCGCAGCGGGGTCCGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCACCTGGTAGTGCTGGTTCTGCTGCTGGATCAGGTGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:133)

蛋白:

MGCVCSSNPEGTELASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSNTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGEQKLISEEDLGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:134)

LcK-FUS-PylRS^AAAF

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAACACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:135)

蛋白:

MGCVCSSNPEGTELASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSNTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESI ITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:136)

LcK-PylRS^AF

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:137)

蛋白:

MGCVCSSNPEGTELACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:138)

LcK-PylRS^AAAF

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:139)

蛋白:

MGCVCSSNPEGTELACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:140)

LcK-MCP

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGAGCAGAAGCTGATCTCAGAGGAGGACCTGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:141)

蛋白:

MGCVCSSNPEGTELEQKLISEEDLGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(SEQ ID NO:142)

FRB-CD28-FUS-PylRS^AF

DNA:

ATGTGCCGAGCCATCTCTCTTAGGCGCTTGCTGCTGCTGCTGCTGCAGCTGTCACAACTCCTAGCTGTCACTCAAGGGATGCTCGAGATGTGGCATGAAGGCCTGGAAGAGGCATCTCGTTTGTACTTTGGGGAAAGGAACGTGAAAGGCATGTTTGAGGTGCTGGAGCCCTTGCATGCTATGATGGAACGGGGCCCCCAGACTCTGAAGGAAACATCCTTTAATCAGGCCTATGGTCGAGATTTAATGGAGGCCCAAGAGTGGTGCAGGAAGTACATGAAATCAGGGAATGTCAAGGACCTCCTCCAAGCCTGGGACCTCTATTATCATGTGTTCCGACGAATCTCAAAGACTAGAACCGGTAAGCTTTTTTGGGCACTGGTCGTGGTTGCTGGAGTCCTGTTTTGTTATGGCTTGCTAGTGACAGTGGCTCTTTGTGTTATCTGGGTAAGATCTGGTATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:143)

蛋白:

MCRAISLRRLLLLLLQLSQLLAVTQGMLEMWHEGLEEASRLYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFNQAYGRDLMEAQEWCRKYMKSGNVKDLLQAWDLYYHVFRRISKTRTGKLFWALVVVAGVLFCYGLLVTVALCVIWVRSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGAPGSAGSAAGSGMACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:144)

FRB-CD28-FUS-PylRS^AA

DNA:

ATGTGCCGAGCCATCTCTCTTAGGCGCTTGCTGCTGCTGCTGCTGCAGCTGTCACAACTCCTAGCTGTCACTCAAGGGATGCTCGAGATGTGGCATGAAGGCCTGGAAGAGGCATCTCGTTTGTACTTTGGGGAAAGGAACGTGAAAGGCATGTTTGAGGTGCTGGAGCCCTTGCATGCTATGATGGAACGGGGCCCCCAGACTCTGAAGGAAACATCCTTTAATCAGGCCTATGGTCGAGATTTAATGGAGGCCCAAGAGTGGTGCAGGAAGTACATGAAATCAGGGAATGTCAAGGACCTCCTCCAAGCCTGGGACCTCTATTATCATGTGTTCCGACGAATCTCAAAGACTAGAACCGGTAAGCTTTTTTGGGCACTGGTCGTGGTTGCTGGAGTCCTGTTTTGTTATGGCTTGCTAGTGACAGTGGCTCTTTGTGTTATCTGGGTAAGATCTGGTATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTTCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:145)

蛋白:

MCRAISLRRLLLLLLQLSQLLAVTQGMLEMWHEGLEEASRLYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFNQAYGRDLMEAQEWCRKYMKSGNVKDLLQAWDLYYHVFRRISKTRTGKLFWALVVVAGVLFCYGLLVTVALCVIWVRSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGAPGSAGSAAGSGMACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:146)

FRB-CD28-EWSR1-MCP

DNA:

ATGTGCCGAGCCATCTCTCTTAGGCGCTTGCTGCTGCTGCTGCTGCAGCTGTCACAACTCCTAGCTGTCACTCAAGGGATGCTCGAGATGTGGCATGAAGGCCTGGAAGAGGCATCTCGTTTGTACTTTGGGGAAAGGAACGTGAAAGGCATGTTTGAGGTGCTGGAGCCCTTGCATGCTATGATGGAACGGGGCCCCCAGACTCTGAAGGAAACATCCTTTAATCAGGCCTATGGTCGAGATTTAATGGAGGCCCAAGAGTGGTGCAGGAAGTACATGAAATCAGGGAATGTCAAGGACCTCCTCCAAGCCTGGGACCTCTATTATCATGTGTTCCGACGAATCTCAAAGACTAGAACCGGTAAGCTTTTTTGGGCACTGGTCGTGGTTGCTGGAGTCCTGTTTTGTTATGGCTTGCTAGTGACAGTGGCTCTTTGTGTTATCTGGGTAAGATCTATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATTACAAGGATGACGACGATAAGGGTACCGAGCAGAAGCTGATCTCAGAGGAGGACCTGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:147)

蛋白:

MCRAISLRRLLLLLLQLSQLLAVTQGMLEMWHEGLEEASRLYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFNQAYGRDLMEAQEWCRKYMKSGNVKDLLQAWDLYYHVFRRISKTRTGKLFWALVVVAGVLFCYGLLVTVALCVIWVRSMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDYKDDDDKGTEQKLISEEDLGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(SEQ ID NO:148)

FRB-CD28-EWSR1-4xλ_N22

DNA:

ATGTGCCGAGCCATCTCTCTTAGGCGCTTGCTGCTGCTGCTGCTGCAGCTGTCACAACTCCTAGCTGTCACTCAAGGGATGCTCGAGATGTGGCATGAAGGCCTGGAAGAGGCATCTCGTTTGTACTTTGGGGAAAGGAACGTGAAAGGCATGTTTGAGGTGCTGGAGCCCTTGCATGCTATGATGGAACGGGGCCCCCAGACTCTGAAGGAAACATCCTTTAATCAGGCCTATGGTCGAGATTTAATGGAGGCCCAAGAGTGGTGCAGGAAGTACATGAAATCAGGGAATGTCAAGGACCTCCTCCAAGCCTGGGACCTCTATTATCATGTGTTCCGACGAATCTCAAAGACTAGAACCGGTAAGCTTTTTTGGGCACTGGTCGTGGTTGCTGGAGTCCTGTTTTGTTATGGCTTGCTAGTGACAGTGGCTCTTTGTGTTATCTGGGTAAGATCTATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATTACAAGGATGACGACGATAAGGGTACCGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTTAA(SEQ ID NO:149)

蛋白:

MCRAISLRRLLLLLLQLSQLLAVTQGMLEMWHEGLEEASRLYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFNQAYGRDLMEAQEWCRKYMKSGNVKDLLQAWDLYYHVFRRISKTRTGKLFWALVVVAGVLFCYGLLVTVALCVIWVRSMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDYKDDDDKGTEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPV(SEQ ID NO:150)

FUS-CD28-FUS-PylRS^AF

DNA:

ATGTGCCGAGCCATCTCTCTTAGGCGCTTGCTGCTGCTGCTGCTGCAGCTGTCACAACTCCTAGCTGTCACTCAAGGGATGCTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCACCGGTAAGCTTTTTTGGGCACTGGTCGTGGTTGCTGGAGTCCTGTTTTGTTATGGCTTGCTAGTGACAGTGGCTCTTTGTGTTATCTGGGTAAGATCTGGTATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:151)

蛋白:

MCRAISLRRLLLLLLQLSQLLAVTQGMLMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGTGKLFWALVVVAGVLFCYGLLVTVALCVIWVRSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGAPGSAGSAAGSGMACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ IDNO:152)

FUS-CD28-FUS-PylRS^AA

DNA:

ATGTGCCGAGCCATCTCTCTTAGGCGCTTGCTGCTGCTGCTGCTGCAGCTGTCACAACTCCTAGCTGTCACTCAAGGGATGCTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCACCGGTAAGCTTTTTTGGGCACTGGTCGTGGTTGCTGGAGTCCTGTTTTGTTATGGCTTGCTAGTGACAGTGGCTCTTTGTGTTATCTGGGTAAGATCTGGTATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:153)

蛋白:

MCRAISLRRLLLLLLQLSQLLAVTQGMLMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGTGKLFWALVVVAGVLFCYGLLVTVALCVIWVRSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGAPGSAGSAAGSGMACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ IDNO:154)

FUS-CD28-FUS-MCP-PylRS^AF

DNA:

ATGTGCCGAGCCATCTCTCTTAGGCGCTTGCTGCTGCTGCTGCTGCAGCTGTCACAACTCCTAGCTGTCACTCAAGGGATGCTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCACCGGTAAGCTTTTTTGGGCACTGGTCGTGGTTGCTGGAGTCCTGTTTTGTTATGGCTTGCTAGTGACAGTGGCTCTTTGTGTTATCTGGGTAAGATCTGGTATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:155)

蛋白:

MCRAISLRRLLLLLLQLSQLLAVTQGMLMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGTGKLFWALVVVAGVLFCYGLLVTVALCVIWVRSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:156)

FUS-CD28-FUS-MCP-PylRS^AA

DNA:

ATGTGCCGAGCCATCTCTCTTAGGCGCTTGCTGCTGCTGCTGCTGCAGCTGTCACAACTCCTAGCTGTCACTCAAGGGATGCTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCACCGGTAAGCTTTTTTGGGCACTGGTCGTGGTTGCTGGAGTCCTGTTTTGTTATGGCTTGCTAGTGACAGTGGCTCTTTGTGTTATCTGGGTAAGATCTGGTATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:157)

蛋白:

MCRAISLRRLLLLLLQLSQLLAVTQGMLMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGTGKLFWALVVVAGVLFCYGLLVTVALCVIWVRSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGAPGSAGSAAGSGMACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ IDNO:158)

FUS-CD28-EWSR1-MCP

DNA:

ATGTGCCGAGCCATCTCTCTTAGGCGCTTGCTGCTGCTGCTGCTGCAGCTGTCACAACTCCTAGCTGTCACTCAAGGGATGCTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCACCGGTAAGCTTTTTTGGGCACTGGTCGTGGTTGCTGGAGTCCTGTTTTGTTATGGCTTGCTAGTGACAGTGGCTCTTTGTGTTATCTGGGTAAGATCTATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCCACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATTACAAGGATGACGACGATAAGGGTACCGAGCAGAAGCTGATCTCAGAGGAGGACCTGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:159)

蛋白:

MCRAISLRRLLLLLLQLSQLLAVTQGMLMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGTGKLFWALVVVAGVLFCYGLLVTVALCVIWVRSMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDYKDDDDKGTEQKLISEEDLGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(SEQ ID NO:160)

FUS-CD28-EWSR1-4xλ_N22

DNA:

ATGTGCCGAGCCATCTCTCTTAGGCGCTTGCTGCTGCTGCTGCTGCAGCTGTCACAACTCCTAGCTGTCACTCAAGGGATGCTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCACCGGTAAGCTTTTTTGGGCACTGGTCGTGGTTGCTGGAGTCCTGTTTTGTTATGGCTTGCTAGTGACAGTGGCTCTTTGTGTTATCTGGGTAAGATCTATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATTACAAGGATGACGACGATAAGGGTACCGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTTAA(SEQ ID NO:161)

蛋白:

MCRAISLRRLLLLLLQLSQLLAVTQGMLMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGTGKLFWALVVVAGVLFCYGLLVTVALCVIWVRSMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDYKDDDDKGTEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPV(SEQ IDNO:162)

FRB-CD28-FUS-MCP-PylRS^AA

DNA:

ATGTGCCGAGCCATCTCTCTTAGGCGCTTGCTGCTGCTGCTGCTGCAGCTGTCACAACTCCTAGCTGTCACTCAAGGGATGCTCGAGATGTGGCATGAAGGCCTGGAAGAGGCATCTCGTTTGTACTTTGGGGAAAGGAACGTGAAAGGCATGTTTGAGGTGCTGGAGCCCTTGCATGCTATGATGGAACGGGGCCCCCAGACTCTGAAGGAAACATCCTTTAATCAGGCCTATGGTCGAGATTTAATGGAGGCCCAAGAGTGGTGCAGGAAGTACATGAAATCAGGGAATGTCAAGGACCTCCTCCAAGCCTGGGACCTCTATTATCATGTGTTCCGACGAATCTCAAAGACTAGAACCGGTAAGCTTTTTTGGGCACTGGTCGTGGTTGCTGGAGTCCTGTTTTGTTATGGCTTGCTAGTGACAGTGGCTCTTTGTGTTATCTGGGTAAGATCTGGTATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:163)

蛋白:

MCRAISLRRLLLLLLQLSQLLAVTQGMLEMWHEGLEEASRLYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFNQAYGRDLMEAQEWCRKYMKSGNVKDLLQAWDLYYHVFRRISKTRTGKLFWALVVVAGVLFCYGLLVTVALCVIWVRSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:164)

FRB-CD28-FUS-MCP-PylRS^AF

DNA:

ATGTGCCGAGCCATCTCTCTTAGGCGCTTGCTGCTGCTGCTGCTGCAGCTGTCACAACTCCTAGCTGTCACTCAAGGGATGCTCGAGATGTGGCATGAAGGCCTGGAAGAGGCATCTCGTTTGTACTTTGGGGAAAGGAACGTGAAAGGCATGTTTGAGGTGCTGGAGCCCTTGCATGCTATGATGGAACGGGGCCCCCAGACTCTGAAGGAAACATCCTTTAATCAGGCCTATGGTCGAGATTTAATGGAGGCCCAAGAGTGGTGCAGGAAGTACATGAAATCAGGGAATGTCAAGGACCTCCTCCAAGCCTGGGACCTCTATTATCATGTGTTCCGACGAATCTCAAAGACTAGAACCGGTAAGCTTTTTTGGGCACTGGTCGTGGTTGCTGGAGTCCTGTTTTGTTATGGCTTGCTAGTGACAGTGGCTCTTTGTGTTATCTGGGTAAGATCTGGTATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:165)

蛋白:

MCRAISLRRLLLLLLQLSQLLAVTQGMLEMWHEGLEEASRLYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFN

QAYGRDLMEAQEWCRKYMKSGNVKDLLQAWDLYYHVFRRISKTRTGKLFWALVVVAGVLFCYGLLVTVALCVIWVRSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:166)

FUS-MCP-PylRS^AF

DNA:

ATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:167)

蛋白:

MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:168)

SPD5-MCP-PylRS^AF

DNA:

ATGGAGGACAACAGCGTGCTGAACGAGGACAGCAACCTGGAGCACGTGGAGGGCCAGCCCAGAAGAAGCATGAGCCAGCCCGTGCTGAACGTGGAGGGCGACAAGAGAACCAGCAGCACCAGCGCCACCCAGCAGCAGGTGCTGAGCGGCGCCTTCAGCAGCGCCGACGTGAGAAGCATCCCCATCATCCAGACCTGGGAGGAGAACAAGGCCCTGAAGACCAAGATCACCATCCTGAGAGGCGAGCTGCAGATGTACCAGAGAAGATACAGCGAGGCCAAGGAGGCCAGCCAGAAGAGAGTGAAGGAGGTGATGGACGACTACGTGGACCTGAAGCTGGGCCAGGAGAACGTGCAGGAGAAGATGGAGCAGTACAAGCTGATGGAGGAGGACCTGCTGGCCATGCAGAGCAGAATCGAGACCAGCGAGGACAACTTCGCCAGACAGATGAAGGAGTTCGAGGCCCAGAAGCACGCCATGGAGGAGAGAATCAAGGAGCTGGAGCTGAGCGCCACCGACGCCAACAACACCACCGTGGGCAGCTTCAGAGGCACCCTGGACGACATCCTGAAGAAGAACGACCCCGACTTCACCCTGACCAGCGGCTACGAGGAGAGAAAGATCAACGACCTGGAGGCCAAGCTGCTGAGCGAGATCGACAAGGTGGCCGAGCTGGAGGACCACATCCAGCAGCTGAGACAGGAGCTGGACGACCAGAGCGCCAGACTGGCCGACAGCGAGAACGTGAGAGCCCAGCTGGAGGCCGCCACCGGCCAGGGCATCCTGGGCGCCGCCGGCAACGCCATGGTGCCCAACAGCACCTTCATGATCGGCAACGGCAGAGAGAGCCAGACCAGAGACCAGCTGAACTACATCGACGACCTGGAGACCAAGCTGGCCGACGCCAAGAAGGAGAACGACAAGGCCAGACAGGCCCTGGTGGAGTACATGAACAAGTGCAGCAAGCTGGAGCACGAGATCAGAACCATGGTGAAGAACAGCACCTTCGACAGCAGCAGCATGCTGCTGGGCGGCCAGACCAGCGACGAGCTGAAGATCCAGATCGGCAAGGTGAACGGCGAGCTGAACGTGCTGAGAGCCGAGAACAGAGAGCTGAGAATCAGATGCGACCAGCTGACCGGCGGCGACGGCAACCTGAGCATCAGCCTGGGCCAGAGCAGACTGATGGCCGGCATCGCCACCAACGACGTGGACAGCATCGGCCAGGGCAACGAGACCGGCGGCACCAGCATGAGAATCCTGCCCAGAGAGAGCCAGCTGGACGACCTGGAGGAGAGCAAGCTGCCCCTGATGGACACCAGCAGCGCCGTGAGAAACCAGCAGCAGTTCGCCAGCATGTGGGAGGACTTCGAGAGCGTGAAGGACAGCCTGCAGAACAACCACAACGACACCCTGGAGGGCAGCTTCAACAGCAGCATGCCCCCCCCCGGCAGAGACGCCACCCAGAGCTTCCTGAGCCAGAAGAGCTTCAAGAACAGCCCCATCGTGATGCAGAAGCCCAAGAGCCTGCACCTGCACCTGAAGAGCCACCAGAGCGAGGGCGCCGGCGAGCAGATCCAGAACAACAGCTTCAGCACCAAGACCGCCAGCCCCCACGTGAGCCAGAGCCACATCCCCATCCTGCACGACATGCAGCAGATCCTGGACAGCAGCGCCATGTTCCTGGAGGGCCAGCACGACGTGGCCGTGAACGTGGAGCAGATGCAGGAGAAGATGAGCCAGATCAGAGAGGCCCTGGCCAGACTGTTCGAGAGACTGAAGAGCAGCGCCGCCCTGTTCGAGGAGATCCTGGAGAGAATGGGCAGCAGCGACCCCAACGCCGACAAGATCAAGAAGATGAAGCTGGCCTTCGAGACCAGCATCAACGACAAGCTGAACGTGAGCGCCATCCTGGAGGCCGCCGAGAAGGACCTGCACAACATGAGCCTGAACTTCAGCATCCTGGAGAAGAGCATCGTGAGCCAGGCCGCCGAGGCCAGCAGAAGATTCACCATCGCCCCCGACGCCGAGGACGTGGCCAGCAGCAGCCTGCTGAACGCCAGCTACAGCCCCCTGTTCAAGTTCACCAGCAACAGCGACATCGTGGAGAAGCTGCAGAACGAGGTGAGCGAGCTGAAGAACGAGCTGGAGATGGCCAGAACCAGAGACATGAGAAGCCCCCTGAACGGCAGCAGCGGCAGACTGAGCGACGTGCAGATCAACACCAACAGAATGTTCGAGGACCTGGAGGTGAGCGAGGCCACCCTGCAGAAGGCCAAGGAGGAGAACAGCACCCTGAAGAGCCAGTTCGCCGAGCTGGAGGCCAACCTGCACCAGGTGAACAGCAAGCTGGGCGAGGTGAGATGCGAGCTGAACGAGGCCCTGGCCAGAGTGGACGGCGAGCAGGAGACCAGAGTGAAGGCCGAGAACGCCCTGGAGGAGGCCAGACAGCTGATCAGCAGCCTGAAGCACGAGGAGAACGAGCTGAAGAAGACCATCACCGACATGGGCATGAGACTGAACGAGGCCAAGAAGAGCGACGAGTTCCTGAAGAGCGAGCTGAGCACCGCCCTGGAGGAGGAGAAGAAGAGCCAGAACCTGGCCGACGAGCTGAGCGAGGAGCTGAACGGCTGGAGAATGAGAACCAAGGAGGCCGAGAACAAGGTGGAGCACGCCAGCAGCGAGAAGAGCGAGATGCTGGAGAGAATCGTGCACCTGGAGACCGAGATGGAGAAGCTGAGCACCAGCGAGATCGCCGCCGACTACTGCAGCACCAAGATGACCGAGAGAAAGAAGGAGATCGAGCTGGCCAAGTACAGAGAGGACTTCGAGAACGCCGCCATCGTGGGCCTGGAGAGAATCAGCAAGGAGATCAGCGAGCTGACCAAGAAGACCCTGAAGGCCAAGATCATCCCCAGCAACATCAGCAGCATCCAGCTGGTGTGCGACGAGCTGTGCAGAAGACTGAGCAGAGAGAGAGAGCAGCAGCACGAGTACGCCAAGGTGATGAGAGACGTGAACGAGAAGATCGAGAAGCTGCAGCTGGAGAAGGACGCCCTGGAGCACGAGCTGAAGATGATGAGCAGCAACAACGAGAACGTGCCCCCCGTGGGCACCAGCGTGAGCGGCATGCCCACCAAGACCAGCAACCAGAAGTGCGCCCAGCCCCACTACACCAGCCCCACCAGACAGCTGCTGCACGAGAGCACCATGGCCGTGGACGCCATCGTGCAGAAGCTGAAGAAGACCCACAACATGAGCGGCATGGGCCCCGAGCTGAAGGAGACCATCGGCAACGTGATCAACGAGAGCAGAGTGCTGAGAGACTTCCTGCACCAGAAGCTGATCCTGTTCAAGGGCATCGACATGAGCAACTGGAAGAACGAGACCGTGGACCAGCTGATCACCGACCTGGGCCAGCTGCACCAGGACAACCTGATGCTGGAGGAGCAGATCAAGAAGTACAAGAAGGAGCTGAAGCTGACCAAGAGCGCCATCCCCACCCTGGGCGTGGAGTTCCAGGACAGAATCAAGACCGAGATCGGCAAGATCGCCACCGACATGGGCGGCGCCGTGAAGGAGATCAGAAAGAAGGGTACCGAGCAGAAGCTGATCTCAGAGGAGGACCTGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:169)

蛋白:

MEDNSVLNEDSNLEHVEGQPRRSMSQPVLNVEGDKRTSSTSATQQQVLSGAFSSADVRSIPI IQTWEENKALKTKITILRGELQMYQRRYSEAKEASQKRVKEVMDDYVDLKLGQENVQEKMEQYKLMEEDLLAMQSRIETSEDNFARQMKEFEAQKHAMEERIKELELSATDANNTTVGSFRGTLDDILKKNDPDFTLTSGYEERKINDLEAKLLSEIDKVAELEDHIQQLRQELDDQSARLADSENVRAQLEAATGQGILGAAGNAMVPNSTFMIGNGRESQTRDQLNYIDDLETKLADAKKENDKARQALVEYMNKCSKLEHEIRTMVKNSTFDSSSMLLGGQTSDELKIQIGKVNGELNVLRAENRELRIRCDQLTGGDGNLSISLGQSRLMAGIATNDVDSIGQGNETGGTSMRILPRESQLDDLEESKLPLMDTSSAVRNQQQFASMWEDFESVKDSLQNNHNDTLEGSFNSSMPPPGRDATQSFLSQKSFKNSPIVMQKPKSLHLHLKSHQSEGAGEQIQNNSFSTKTASPHVSQSHIPILHDMQQILDSSAMFLEGQHDVAVNVEQMQEKMSQIREALARLFERLKSSAALFEEILERMGSSDPNADKIKKMKLAFETSINDKLNVSAILEAAEKDLHNMSLNFSILEKSIVSQAAEASRRFTIAPDAEDVASSSLLNASYSPLFKFTSNSDIVEKLQNEVSELKNELEMARTRDMRSPLNGSSGRLSDVQINTNRMFEDLEVSEATLQKAKEENSTLKSQFAELEANLHQVNSKLGEVRCELNEALARVDGEQETRVKAENALEEARQLISSLKHEENELKKTITDMGMRLNEAKKSDEFLKSELSTALEEEKKSQNLADELSEELNGWRMRTKEAENKVEHASSEKSEMLERIVHLETEMEKLSTSEIAADYCSTKMTERKKEIELAKYREDFENAAIVGLERISKEISELTKKTLKAKIIPSNISSIQLVCDELCRRLSREREQQHEYAKVMRDVNEKIEKLQLEKDALEHELKMMSSNNENVPPVGTSVSGMPTKTSNQKCAQPHYTSPTRQLLHESTMAVDAIVQKLKKTHNMSGMGPELKETIGNVINESRVLRDFLHQKLILFKGIDMSNWKNETVDQLITDLGQLHQDNLMLEEQIKKYKKELKLTKSAIPTLGVEFQDRIKTEIGKIATDMGGAVKEIRKKGTEQKLISEEDLGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:170)

9.POI(报告基因)和对照

GFP^39TAG(具有琥珀密码子编码的氨基酸39位的GFP)

DNA:(下划线示出琥珀密码子)

ATGGGCCGCCTGGAAAGCACCCCGCCGAAAAAAAAACGCAAAGTGGAAGATAGCGCGAGCGATTACAAAGATGATGATGATAAAGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTAGGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGCCAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGCATCACCATCACCATCACTAA(SEQ IDNO:171)

蛋白:(X表示非典型氨基酸)

MGRLESTPPKKKRKVEDSASDYKDDDDKVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATXGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKANFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYKHHHHHH(SEQ ID NO:172)

GFP^39TAG-2xMS2(具有2个MS2茎环的GFP^39TAG)

DNA:(下划线示出MS2茎环和琥珀密码子)

ATGGGCCGCCTGGAAAGCACCCCGCCGAAAAAAAAACGCAAAGTGGAAGATAGCGCGAGCGATTACAAAGATGATGATGATAAAGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTAGGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGCCAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGCATCACCATCACCATCACTAAGGATCCTAAGGTACCTAATTGCCTAGAAAACATGAGGATCACCCATGTCTGCAGGTCGACTCTAGAAAACATGAGGATCACCCAT GT(SEQ ID NO:173)

蛋白:(X表示非典型氨基酸)

MGRLESTPPKKKRKVEDSASDYKDDDDKVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATXGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKANFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYKHHHHHH(SEQ ID NO:174)

mOrange

DNA:

ATGGTGAGCAAGGGCGAGGAGAATAATATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCGCATGGAGGGCACCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCTTTCAGACCGCTAAGCTGAAGGTGACCAAGGGCGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCTCTTCACCTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTCAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTACGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCACTGCAGGACGGCGAGTTCATCTACAAGGTGAAGATGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTGATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAGGATGAGGCTGAAGCTGAAGGACGGCGGCCACTACACCTCCGAGGTCAAGACCACCTACAAGGCCAAGAAGTCCGTGCAGCTGCCCGGCGCCTACATCGTCGGCATCAAGCTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAA(SEQ ID NO:175)

蛋白:

MVSKGEENNMAIIKEFMRFKVRMEGTVNGHEFEIEGEGEGRPYEGFQTAKLKVTKGGPLPFAWDILSPLFTYGSKAYVKHPADIPDYFKLSFPEGFKWERVMNYEDGGVVTVTQDSSLQDGEFIYKVKMRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIRMRLKLKDGGHYTSEVKTTYKAKKSVQLPGAYIVGIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYK(SEQ ID NO:176)

iRFP(近红外荧光蛋白)

DNA:

GAAGGATCCGTCGCCAGGCAGCCTGACCTCTTGACCTGCGACGATGAGCCGATCCATATCCCCGGTGCCATCCAACCGCATGGACTGCTGCTCGCCCTCGCCGCCGACATGACGATCGTTGCCGGCAGCGACAACCTTCCCGAACTCACCGGACTGGCGATCGGCGCCCTGATCGGCCGCTCTGCGGCCGATGTCTTCGACTCGGAGACGCACAACCGTCTGACGATCGCCTTGGCCGAGCCCGGGGCGGCCGTCGGAGCACCGATCACTGTCGGCTTCACGATGCGAAAGGACGCAGGCTTCATCGGCTCCTGGCATCGCCATGATCAGCTCATCTTCCTCGAGCTCGAGCCTCCCCAGCGGGACGTCGCCGAGCCGCAGGCGTTCTTCCGCCGCACCAACAGCGCCATCCGCCGCCTGCAGGCCGCCGAAACCTTGGAAAGCGCCTGCGCCGCCGCGGCGCAAGAGGTGCGGAAGATTACCGGCTTCGATCGGGTGATGATCTATCGCTTCGCCTCCGACTTCAGCGGCGAAGTGATCGCAGAGGATCGGTGCGCCGAGGTCGAGTCAAAACTAGGCCTGCACTATCCTGCCTCAACCGTGCCGGCGCAGGCCCGTCGGCTCTATACCATCAACCCGGTACGGATCATTCCCGATATCAATTATCGGCCGGTGCCGGTCACCCCAGACCTCAATCCGGTCACCGGGCGGCCGATTGATCTTAGCTTCGCCATCCTGCGCAGCGTCTCGCCCGTCCATCTGGAATTCATGCGCAACATAGGCATGCACGGCACGATGTCGATCTCGATTTTGCGCGGCGAGCGACTGTGGGGATTGATCGTTTGCCATCACCGAACGCCGTACTACGTCGATCTCGATGGCCGCCAAGCCTGCGAGCTAGTCGCCCAGGTTCTGGCCTGGCAGATCGGCGTGATGGAAGAG(SEQ ID NO:177)

蛋白:

EGSVARQPDLLTCDDEPIHIPGAIQPHGLLLALAADMTIVAGSDNLPELTGLAIGALIGRSAADVFDSETHNRLTIALAEPGAAVGAPITVGFTMRKDAGFIGSWHRHDQLIFLELEPPQRDVAEPQAFFRRTNSAIRRLQAAETLESACAAAAQEVRKITGFDRVMIYRFASDFSGEVIAEDRCAEVESKLGLHYPASTVPAQARRLYTINPVRIIPDINYRPVPVTPDLNPVTGRPIDLSFAILRSVSPVHLEFMRNIGMHGTMSISILRGERLWGLIVCHHRTPYYVDLDGRQACELVAQVLAWQIGVMEE(SEQ ID NO:178)

mCherry^185TAG(具有琥珀密码子编码的氨基酸185位的mCherry)

DNA:(下划线示出琥珀密码子)

ATGGGCCGCCTGGAAAGCACCCCGCCGAAAAAAAAACGCAAAGTGGAAGATAGCGCGAGCGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACGATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGTAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGCATCATCATCATCATCATTAA(SEQ ID NO:179)

蛋白:(X是非典型氨基酸)

MGRLESTPPKKKRKVEDSASVSKGEEDNMAIIKEFMRFKVHMEGSVNGHEFEIEGEGEGRPYEGTQTAKLKVTKGGPLPFAWDILSPQFMYGSKAYVKHPADIPDYLKLSFPEGFKWERVMNFEDGGVVTVTQDSSLQDGEFIYKVKLRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIKQRLKLKDGGHYDAEVKTTYKAKXPVQLPGAYNVNIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYKHHHHHH(SEQ ID NO:180)

mCherry^185TAG-2xMS2(具有2个MS2 RNA茎环的mCherry^185TAG)

DNA:(下划线示出MS2茎环和琥珀密码子)

ATGGGCCGCCTGGAAAGCACCCCGCCGAAAAAAAAACGCAAAGTGGAAGATAGCGCGAGCGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACGATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGTAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGCATCATCATCATCATCATTAAAGATCCTAAGGTACCTAATTGCCTAGAAAACATGAGGATCAC CCATGTCTGCAGGTCGACTCTAGAAAACATGAGGATCACCCATGT(SEQ ID NO:181)

蛋白:(X表示非典型氨基酸)

MGRLESTPPKKKRKVEDSASVSKGEEDNMAIIKEFMRFKVHMEGSVNGHEFEIEGEGEGRPYEGTQTAKLKVTKGGPLPFAWDILSPQFMYGSKAYVKHPADIPDYLKLSFPEGFKWERVMNFEDGGVVTVTQDSSLQDGEFIYKVKLRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIKQRLKLKDGGHYDAEVKTTYKAKXPVQLPGAYNVNIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYKHHHHHH(SEQ ID NO:182)

mCherry^185TAG-4xBoxB(具有4个BoxB环的mCherry^185TAG)

DNA:(下划线示出BoxB茎环和琥珀密码子)

ATGGGCCGCCTGGAAAGCACCCCGCCGAAAAAAAAACGCAAAGTGGAAGATAGCGCGAGCGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACGATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGTAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGCATCATCATCATCATCATTAAAGATCCTAAGGTACCGCCCTGAAAAAGGGCTCGAGCCCTGAA AAAGGGCAATTGCCCTGAAAAAGGGCGTCGACGCCCTGAAAAAGGGC(SEQ ID NO:183)

蛋白:(X表示非典型氨基酸)

MGRLESTPPKKKRKVEDSASVSKGEEDNMAIIKEFMRFKVHMEGSVNGHEFEIEGEGEGRPYEGTQTAKLKVTKGGPLPFAWDILSPQFMYGSKAYVKHPADIPDYLKLSFPEGFKWERVMNFEDGGVVTVTQDSSLQDGEFIYKVKLRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIKQRLKLKDGGHYDAEVKTTYKAKXPVQLPGAYNVNIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYKHHHHHH(SEQ ID NO:184)

GFP^39TAA-2xMS2(具有赭石密码子编码的氨基酸39位和2个MS2 RNA茎环的GFP)

DNA:(下划线示出MS2茎环和赭石密码子)

ATGGGCCGCCTGGAAAGCACCCCGCCGAAAAAAAAACGCAAAGTGGAAGATAGCGCGAGCGATTACAAAGATGATGATGATAAAGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTAAGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGCCAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGCATCACCATCACCATCACTGAGGATCCTAAGGTACCTAATTGCCTAGAAAACATGAGGATCACCCATGTCTGCAGGTCGACTCTAGAAAACATGAGGATCACCCAT GT(SEQ ID NO:185)

蛋白:(X表示非典型氨基酸)

MGRLESTPPKKKRKVEDSASDYKDDDDKVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATXGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKANFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYKHHHHHH(SEQ ID NO:186)

mCherry^185TAA-2xMS2(具有赭石密码子编码的氨基酸185位和2个MS2 RNA茎环的mCherry)

DNA:(下划线示出MS2茎环和赭石密码子)

ATGGGCCGCCTGGAAAGCACCCCGCCGAAAAAAAAACGCAAAGTGGAAGATAGCGCGAGCGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACGATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGTAACCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGCATCATCATCATCATCATTGAAGATCCTAAGGTACCTAATTGCCTAGAAAACATGAGGATCAC CCATGTCTGCAGGTCGACTCTAGAAAACATGAGGATCACCCATGT(SEQ ID NO:187)

蛋白:(X表示非典型氨基酸)

MGRLESTPPKKKRKVEDSASVSKGEEDNMAIIKEFMRFKVHMEGSVNGHEFEIEGEGEGRPYEGTQTAKLKVTKGGPLPFAWDILSPQFMYGSKAYVKHPADIPDYLKLSFPEGFKWERVMNFEDGGVVTVTQDSSLQDGEFIYKVKLRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIKQRLKLKDGGHYDAEVKTTYKAKXPVQLPGAYNVNIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYKHHHHHH(SEQ ID NO:188)

GFP^39TGA-2xMS2(具有乳白密码子编码的氨基酸39位和2个MS2 RNA茎环的GFP)

DNA:(下划线示出MS2茎环和乳白密码子)

ATGGGCCGCCTGGAAAGCACCCCGCCGAAAAAAAAACGCAAAGTGGAAGATAGCGCGAGCGATTACAAAGATGATGATGATAAAGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTGAGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGCCAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGCATCACCATCACCATCACTAAGGATCCTAAGGTACCTAATTGCCTAGAAAACATGAGGATCACCCATGTCTGCAGGTCGACTCTAGAAAACATGAGGATCACCCAT GT(SEQ ID NO:189)

蛋白:(X表示非典型氨基酸)

MGRLESTPPKKKRKVEDSASDYKDDDDKVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATXGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKANFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYKHHHHHH(SEQ ID NO:190)

mCherry^185TGA-2xMS2(具有乳白密码子编码的氨基酸185位和2个MS2 RNA茎环的mCherry)

DNA:(下划线示出MS2茎环和乳白密码子)

ATGGGCCGCCTGGAAAGCACCCCGCCGAAAAAAAAACGCAAAGTGGAAGATAGCGCGAGCGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACGATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGTGACCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGCATCATCATCATCATCATTAAAGATCCTAAGGTACCTAATTGCCTAGAAAACATGAGGATCAC CCATGTCTGCAGGTCGACTCTAGAAAACATGAGGATCACCCATGT(SEQ ID NO:191)

蛋白:(X表示非典型氨基酸)

MGRLESTPPKKKRKVEDSASVSKGEEDNMAIIKEFMRFKVHMEGSVNGHEFEIEGEGEGRPYEGTQTAKLKVTKGGPLPFAWDILSPQFMYGSKAYVKHPADIPDYLKLSFPEGFKWERVMNFEDGGVVTVTQDSSLQDGEFIYKVKLRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIKQRLKLKDGGHYDAEVKTTYKAKXPVQLPGAYNVNIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYKHHHHHH(SEQ ID NO:192)

Nup153(智人核孔蛋白153；Uniprot:P49790)

DNA:

ATGGCGTCTGGTGCTGGCGGTGTTGGTGGAGGAGGTGGGGGTAAAATTCGTACTCGTCGCTGTCATCAAGGTCCGATTAAACCGTATCAGCAGGGACGTCAGCAACATCAGGGTATTCTGAGCCGTGTGACCGAAAGCGTGAAAAACATTGTGCCGGGTTGGCTGCAACGTTATTTCAACAAAAATGAGGATGTGTGTTCGTGTTCTACCGATACCAGTGAAGTTCCTCGTTGGCCGGAAAACAAAGAAGATCACCTGGTGTATGCCGATGAAGAATCGAGCAATATCACCGATGGCCGTATTACTCCTGAACCGGCGGTTAGTAACACTGAAGAACCGTCAACCACAAGCACAGCATCGAACTATCCAGATGTCCTGACTCGCCCTTCTCTGCACCGTTCTCACCTGAACTTTAGCATGCTGGAATCACCAGCTCTGCATTGTCAGCCGTCTACCAGTAGTGCCTTCCCGATTGGCTCTAGTGGCTTTTCGCTGGTCAAAGAGATCAAAGACTCGACCTCTCAACATGACGATGATAACATTAGCACGACCTCGGGTTTTAGTAGCCGTGCCTCCGATAAAGACATTACCGTGAGCAAAAACACCTCTCTGCCGCCTCTGTGGAGTCCTGAAGCCGAACGCTCTCATAGTCTGTCTCAGCACACAGCCACCAGTTCCAAAAAACCAGCCTTCAACCTGAGCGCCTTTGGTACACTGTCACCGAGCCTGGGAAATTCCTCTATCCTGAAAACATCACAGCTGGGCGATAGTCCGTTTTATCCGGGCAAAACGACGTATGGTGGTGCCGCTGCTGCTGTTCGCCAGTCTAAACTGCGTAACACTCCGTATCAAGCTCCAGTCCGTCGCCAAATGAAAGCAAAACAACTGTCGGCCCAGTCTTATGGTGTGACAAGCTCTACAGCTCGTCGTATCCTGCAAAGTCTGGAGAAAATGTCATCTCCGCTGGCAGATGCCAAACGTATTCCGTCCATTGTGAGCAGTCCGCTGAATAGCCCGCTGGACCGTAGTGGGATCGATATCACCGACTTCCAAGCCAAACGTGAGAAAGTGGATAGCCAGTATCCGCCTGTACAACGTCTGATGACCCCGAAACCGGTTTCAATTGCCACGAATCGTAGCGTGTATTTCAAACCGTCACTGACCCCTAGTGGTGAGTTTCGTAAAACAAATCAGCGTATCGACAACAAATGCTCTACCGGGTATGAAAAAAACATGACGCCGGGACAGAATCGTGAACAACGTGAATCTGGCTTCTCTTATCCGAACTTTAGTCTGCCGGCAGCAAATGGTCTGAGTAGCGGTGTAGGAGGTGGTGGGGGCAAAATGCGCCGTGAACGTCACGCCTTTGTGGCCTCTAAACCTCTGGAAGAAGAAGAGATGGAGGTTCCTGTACTGCCGAAAATCAGTCTGCCTATCACCTCTTCAAGTCTGCCGACCTTCAACTTTTCTAGTCCGGAAATCACAACCTCTAGCCCGTCACCGATTAATAGCAGTCAAGCACTGACGAATAAAGTCCAAATGACCTCACCGAGTTCTACGGGTTCTCCGATGTTCAAATTCTCTAGTCCTATCGTGAAATCAACCGAAGCGAACGTCCTGCCTCCTTCTAGTATTGGGTTCACCTTTAGCGTCCCAGTGGCCAAAACAGCTGAACTGAGCGGTAGCAGTAGTACTCTGGAACCGATTATCAGCTCAAGCGCCCATCATGTCACTACCGTGAATAGCACAAACTGTAAAAAAACGCCGCCTGAGGACTGTGAAGGACCGTTTCGTCCTGCCGAAATCCTGAAAGAAGGTTCCGTCCTGGACATTCTGAAATCTCCGGGATTTGCCTCTCCTAAAATCGACTCTGTTGCCGCTCAACCAACTGCCACATCACCGGTGGTTTATACTCGTCCGGCGATTAGCAGTTTTAGCAGTAGTGGCATCGGTTTTGGTGAATCCCTGAAAGCTGGCTCATCTTGGCAGTGTGACACCTGCCTGCTGCAAAACAAAGTGACCGATAACAAATGTATTGCCTGTCAGGCCGCCAAACTGTCTCCTCGTGATACAGCCAAACAGACCGGCATCGAAACCCCTAATAAAAGCGGGAAAACGACCCTGTCAGCAAGTGGTACGGGATTTGGGGACAAATTCAAACCTGTGATCGGCACATGGGACTGTGACACTTGTCTGGTACAGAACAAACCAGAAGCGATCAAATGTGTGGCCTGTGAAACGCCTAAACCTGGAACATGTGTGAAACGTGCCCTGACTCTGACTGTTGTGTCAGAAAGCGCCGAAACCATGACGGCAAGCAGCTCATCCTGTACTGTGACTACCGGGACTCTGGGATTTGGTGACAAATTCAAACGCCCGATTGGTTCCTGGGAATGCTCCGTGTGTTGTGTGAGCAATAATGCCGAGGACAACAAATGTGTGTCCTGTATGAGCGAGAAACCTGGCAGCTCTGTTCCTGCTAGCAGCTCTAGCACAGTTCCTGTTAGTCTGCCTAGTGGTGGTTCTCTGGGTCTGGAAAAATTCAAAAAACCTGAAGGAAGCTGGGATTGTGAGCTGTGCCTGGTACAGAATAAAGCGGATAGCACGAAATGTCTGGCCTGTGAGTCAGCCAAACCAGGGACTAAAAGCGGCTTTAAAGGCTTCGACACGTCGAGCAGTTCTAGTAACAGCGCCGCCTCATCATCTTTCAAATTTGGGGTGAGCAGCTCCTCTAGTGGTCCTAGTCAAACACTGACCTCTACCGGAAACTTCAAATTCGGCGATCAGGGTGGCTTCAAAATTGGTGTCTCCTCTGATTCGGGTAGCATTAACCCGATGAGTGAGGGGTTCAAATTCAGCAAACCAATTGGCGATTTCAAATTCGGTGTGTCGTCTGAATCCAAACCTGAAGAAGTCAAAAAAGACAGCAAAAACGACAATTTCAAATTCGGCCTGTCTAGTGGTCTGTCTAATCCGGTTAGCCTGACCCCGTTTCAGTTCGGGGTGTCTAATCTGGGTCAGGAAGAGAAAAAAGAGGAGCTGCCTAAAAGTTCATCTGCCGGGTTCAGTTTTGGTACAGGCGTGATCAATAGCACTCCAGCACCAGCCAATACAATCGTGACGAGCGAGAACAAATCGAGCTTCAACCTGGGGACAATCGAAACGAAAAGCGCCAGTGTAGCGCCATTCACGTGTAAAACCTCCGAGGCAAAAAAAGAAGAGATGCCGGCCACAAAAGGTGGATTCTCATTCGGCAACGTGGAACCGGCTAGCCTGCCATCAGCAAGCGTGTTTGTACTGGGCCGTACCGAGGAGAAACAGCAGGAACCTGTTACTAGCACCAGTCTGGTCTTTGGTAAAAAAGCCGACAACGAAGAACCGAAATGTCAGCCAGTGTTCAGCTTCGGCAATAGCGAACAGACGAAAGACGAAAACAGCAGCAAATCGACGTTCAGCTTCAGTATGACGAAACCGAGCGAAAAAGAAAGTGAGCAGCCAGCAAAAGCAACGTTCGCCTTTGGAGCACAGACATCAACCACAGCCGATCAAGGAGCAGCGAAACCAGTTTTCAGTTTTCTGAATAACAGCTCAAGCAGCAGTTCTACACCAGCAACCTCAGCAGGTGGTGGGATCTTTGGATCAAGCACCTCATCCAGCAATCCGCCAGTGGCAACATTCGTGTTTGGCCAGAGCAGTAATCCGGTGTCATCTTCAGCATTTGGGAATACCGCCGAGAGTAGCACATCACAGTCTCTGCTGTTCTCACAGGACTCTAAACTGGCAACCACCTCTTCTACTGGTACAGCGGTTACCCCGTTTGTGTTCGGTCCGGGAGCATCATCCAATAATACCACGACGTCGGGCTTTGGGTTTGGTGCCACGACAACAAGCAGTAGCGCTGGTAGCAGCTTTGTCTTTGGCACAGGTCCTTCAGCACCTTCTGCTTCACCAGCTTTCGGAGCCAATCAGACTCCGACATTCGGACAGTCACAGGGTGCCTCTCAACCAAATCCTCCGGGTTTTGGCAGTATTAGCAGTAGTACCGCCCTGTTCCCGACCGGTAGTCAACCGGCACCGCCAACATTTGGAACGGTTAGCAGTAGTAGTCAGCCTCCGGTGTTTGGACAACAACCGAGCCAGAGCGCCTTCGGATCAGGAACGACCCCTAATAGTAGCAGTGCCTTCCAGTTCGGTAGCAGTACCACCAACTTCAACTTCACGAACAATAGCCCGTCAGGTGTGTTCACGTTTGGCGCCAATTCTTCTACCCCAGCGGCAAGTGCTCAACCTTCAGGCTCAGGTGGATTTCCTTTCAACCAGTCACCAGCAGCGTTTACTGTTGGTTCTAACGGGAAAAACGTTTTCAGTAGCAGCGGCACCTCGTTTTCTGGTCGTAAAATCAAAACGGCCGTTCGTCGCCGTAAA(SEQ ID NO:193)

蛋白:

MASGAGGVGGGGGGKIRTRRCHQGPIKPYQQGRQQHQGILSRVTESVKNIVPGWLQRYFNKNEDVCSCSTDTSEVPRWPENKEDHLVYADEESSNITDGRITPEPAVSNTEEPSTTSTASNYPDVLTRPSLHRSHLNFSMLESPALHCQPSTSSAFPIGSSGFSLVKEIKDSTSQHDDDNISTTSGFSSRASDKDITVSKNTSLPPLWSPEAERSHSLSQHTATSSKKPAFNLSAFGTLSPSLGNSSILKTSQLGDSPFYPGKTTYGGAAAAVRQSKLRNTPYQAPVRRQMKAKQLSAQSYGVTSSTARRILQSLEKMSSPLADAKRIPSIVSSPLNSPLDRSGIDITDFQAKREKVDSQYPPVQRLMTPKPVSIATNRSVYFKPSLTPSGEFRKTNQRIDNKCSTGYEKNMTPGQNREQRESGFSYPNFSLPAANGLSSGVGGGGGKMRRERHAFVASKPLEEEEMEVPVLPKISLPITSSSLPTFNFSSPEITTSSPSPINSSQALTNKVQMTSPSSTGSPMFKFSSPIVKSTEANVLPPSSIGFTFSVPVAKTAELSGSSSTLEPIISSSAHHVTTVNSTNCKKTPPEDCEGPFRPAEILKEGSVLDILKSPGFASPKIDSVAAQPTATSPVVYTRPAISSFSSSGIGFGESLKAGSSWQCDTCLLQNKVTDNKCIACQAAKLSPRDTAKQTGIETPNKSGKTTLSASGTGFGDKFKPVIGTWDCDTCLVQNKPEAIKCVACETPKPGTCVKRALTLTVVSESAETMTASSSSCTVTTGTLGFGDKFKRPIGSWECSVCCVSNNAEDNKCVSCMSEKPGSSVPASSSSTVPVSLPSGGSLGLEKFKKPEGSWDCELCLVQNKADSTKCLACESAKPGTKSGFKGFDTSSSSSNSAASSSFKFGVSSSSSGPSQTLTSTGNFKFGDQGGFKIGVSSDSGSINPMSEGFKFSKPIGDFKFGVSSESKPEEVKKDSKNDNFKFGLSSGLSNPVSLTPFQFGVSNLGQEEKKEELPKSSSAGFSFGTGVINSTPAPANTIVTSENKSSFNLGTIETKSASVAPFTCKTSEAKKEEMPATKGGFSFGNVEPASLPSASVFVLGRTEEKQQEPVTSTSLVFGKKADNEEPKCQPVFSFGNSEQTKDENSSKSTFSFSMTKPSEKESEQPAKATFAFGAQTSTTADQGAAKPVFSFLNNSSSSSSTPATSAGGGIFGSSTSSSNPPVATFVFGQSSNPVSSSAFGNTAESSTSQSLLFSQDSKLATTSSTGTAVTPFVFGPGASSNNTTTSGFGFGATTTSSSAGSSFVFGTGPSAPSASPAFGANQTPTFGQSQGASQPNPPGFGSISSSTALFPTGSQPAPPTFGTVSSSSQPPVFGQQPSQSAFGSGTTPNSSSAFQFGSSTTNFNFTNNSPSGVFTFGANSSTPAASAQPSGSGGFPFNQSPAAFTVGSNGKNVFSSSGTSFSGRKIKTAVRRRK(SEQ ID NO:194)

Vim^116TAG(智人波形蛋白，具有琥珀密码子编码的氨基酸116位；Uniprot:P08670)

DNA:(下划线示出琥珀密码子)

ATGTCCACCAGGTCCGTGTCCTCGTCCTCCTACCGCAGGATGTTCGGCGGCCCGGGCACCGCGAGCCGGCCGAGCTCCAGCCGGAGCTACGTGACTACGTCCACCCGCACCTACAGCCTGGGCAGCGCGCTGCGCCCCAGCACCAGCCGCAGCCTCTACGCCTCGTCCCCGGGCGGCGTGTATGCCACGCGCTCCTCTGCCGTGCGCCTGCGGAGCAGCGTGCCCGGGGTGCGGCTCCTGCAGGACTCGGTGGACTTCTCGCTGGCCGACGCCATCAACACCGAGTTCAAGAACACCCGCACCAACGAGAAGGTGGAGCTGCAGGAGCTGAATGACCGCTTCGCCTAGTACATCGACAAGGTGCGCTTCCTGGAGCAGCAGAATAAGATCCTGCTGGCCGAGCTCGAGCAGCTCAAGGGCCAAGGCAAGTCGCGCCTGGGGGACCTCTACGAGGAGGAGATGCGGGAGCTGCGCCGGCAGGTGGACCAGCTAACCAACGACAAAGCCCGCGTCGAGGTGGAGCGCGACAACCTGGCCGAGGACATCATGCGCCTCCGGGAGAAATTGCAGGAGGAGATGCTTCAGAGAGAGGAAGCCGAAAACACCCTGCAATCTTTCAGACAGGATGTTGACAATGCGTCTCTGGCACGTCTTGACCTTGAACGCAAAGTGGAATCTTTGCAAGAAGAGATTGCCTTTTTGAAGAAACTCCACGAAGAGGAAATCCAGGAGCTGCAGGCTCAGATTCAGGAACAGCATGTCCAAATCGATGTGGATGTTTCCAAGCCTGACCTCACGGCTGCCCTGCGTGACGTACGTCAGCAATATGAAAGTGTGGCTGCCAAGAACCTGCAGGAGGCAGAAGAATGGTACAAATCCAAGTTTGCTGACCTCTCTGAGGCTGCCAACCGGAACAATGACGCCCTGCGCCAGGCAAAGCAGGAGTCCACTGAGTACCGGAGACAGGTGCAGTCCCTCACCTGTGAAGTGGATGCCCTTAAAGGAACCAATGAGTCCCTGGAACGCCAGATGCGTGAAATGGAAGAGAACTTTGCCGTTGAAGCTGCTAACTACCAAGACACTATTGGCCGCCTGCAGGATGAGATTCAGAATATGAAGGAGGAAATGGCTCGTCACCTTCGTGAATACCAAGACCTGCTCAATGTTAAGATGGCCCTTGACATTGAGATTGCCACCTACAGGAAGCTGCTGGAAGGCGAGGAGAGCAGGATTTCTCTGCCTCTTCCAAACTTTTCCTCCCTGAACCTGAGGGAAACTAATCTGGATTCACTCCCTCTGGTTGATACCCACTCAAAAAGGACACTTCTGATTAAGACGGTTGAAACTAGAGATGGACAGGTTATCAACGAAACTTCTCAGCATCACGATGACCTTGAA(SEQ ID NO:195)

蛋白:(X表示非典型氨基酸)

MSTRSVSSSSYRRMFGGPGTASRPSSSRSYVTTSTRTYSLGSALRPSTSRSLYASSPGGVYATRSSAVRLRSSVPGVRLLQDSVDFSLADAINTEFKNTRTNEKVELQELNDRFAXYIDKVRFLEQQNKILLAELEQLKGQGKSRLGDLYEEEMRELRRQVDQLTNDKARVEVERDNLAEDIMRLREKLQEEMLQREEAENTLQSFRQDVDNASLARLDLERKVESLQEEIAFLKKLHEEEIQELQAQIQEQHVQIDVDVSKPDLTAALRDVRQQYESVAAKNLQEAEEWYKSKFADLSEAANRNNDALRQAKQESTEYRRQVQSLTCEVDALKGTNESLERQMREMEENFAVEAANYQDTIGRLQDEIQNMKEEMARHLREYQDLLNVKMALDIEIATYRKLLEGEESRISLPLPNFSSLNLRETNLDSLPLVDTHSKRTLLIKTVETRDGQVINETSQHHDDLE(SEQ ID NO:196)

INSR^676TAG(智人胰岛素受体；Uniprot:P06213)

DNA:(下划线示出琥珀密码子)

ATGGGCACCGGGGGCCGGCGGGGGGCGGCGGCCGCGCCGCTGCTGGTGGCGGTGGCCGCGCTGCTACTGGGCGCCGCGGGCCACCTGTACCCCGGAGAGGTGTGTCCCGGCATGGATATCCGGAACAACCTCACTAGGTTGCATGAGCTGGAGAATTGCTCTGTCATCGAAGGACACTTGCAGATACTCTTGATGTTCAAAACGAGGCCCGAAGATTTCCGAGACCTCAGTTTCCCCAAACTCATCATGATCACTGATTACTTGCTGCTCTTCCGGGTCTATGGGCTCGAGAGCCTGAAGGACCTGTTCCCCAACCTCACGGTCATCCGGGGATCACGACTGTTCTTTAACTACGCGCTGGTCATCTTCGAGATGGTTCACCTCAAGGAACTCGGCCTCTACAACCTGATGAACATCACCCGGGGTTCTGTCCGCATCGAGAAGAACAATGAGCTCTGTTACTTGGCCACTATCGACTGGTCCCGTATCCTGGATTCCGTGGAGGATAATTACATCGTGTTGAACAAAGATGACAACGAGGAGTGTGGAGACATCTGTCCGGGTACCGCGAAGGGCAAGACCAACTGCCCCGCCACCGTCATCAACGGGCAGTTTGTCGAACGATGTTGGACTCATAGTCACTGCCAGAAAGTTTGCCCGACCATCTGTAAGTCACACGGCTGCACCGCCGAAGGCCTCTGTTGCCACAGCGAGTGCCTGGGCAACTGTTCTCAGCCCGACGACCCCACCAAGTGCGTGGCCTGCCGCAACTTCTACCTGGATGGCAGGTGTGTGGAGACCTGCCCGCCCCCGTACTACCACTTCCAGGACTGGCGCTGTGTGAACTTCAGCTTCTGCCAGGACCTGCACCACAAATGCAAGAACTCGCGGAGGCAGGGCTGCCACCAGTACGTCATTCACAACAACAAGTGCATCCCTGAGTGTCCCTCCGGGTACACGATGAATTCCAGCAACTTGCTGTGCACCCCATGCCTGGGTCCCTGTCCCAAGGTGTGCCACCTCCTAGAAGGCGAGAAGACCATCGACTCGGTGACGTCTGCCCAGGAGCTCCGAGGATGCACCGTCATCAACGGGAGTCTGATCATCAACATTCGAGGAGGCAACAATCTGGCAGCTGAGCTAGAAGCCAACCTCGGCCTCATTGAAGAAATTTCAGGGTATCTAAAAATCCGCCGATCCTACGCTCTGGTGTCACTTTCCTTCTTCCGGAAGTTACGTCTGATTCGAGGAGAGACCTTGGAAATTGGGAACTACTCCTTCTATGCCTTGGACAACCAGAACCTAAGGCAGCTCTGGGACTGGAGCAAACACAACCTCACCATCACTCAGGGGAAACTCTTCTTCCACTATAACCCCAAACTCTGCTTGTCAGAAATCCACAAGATGGAAGAAGTTTCAGGAACCAAGGGGCGCCAGGAGAGAAACGACATTGCCCTGAAGACCAATGGGGACCAGGCATCCTGTGAAAATGAGTTACTTAAATTTTCTTACATTCGGACATCTTTTGACAAGATCTTGCTGAGATGGGAGCCGTACTGGCCCCCCGACTTCCGAGACCTCTTGGGGTTCATGCTGTTCTACAAAGAGGCCCCTTATCAGAATGTGACGGAGTTCGACGGGCAGGATGCATGTGGTTCCAACAGTTGGACGGTGGTAGACATTGACCCACCCCTGAGGTCCAACGACCCCAAATCACAGAACCACCCAGGGTGGCTGATGCGGGGTCTCAAGCCCTGGACCCAGTATGCCATCTTTGTGAAGACCCTGGTCACCTTTTCGGATGAACGCCGGACCTATGGGGCCAAGAGTGACATCATTTATGTCCAGACAGATGCCACCAACCCCTCTGTGCCCCTGGATCCAATCTCAGTGTCTAACTCATCATCCCAGATTATTCTGAAGTGGAAACCACCCTCCGACCCCAATGGCAACATCACCCACTACCTGGTTTTCTGGGAGAGGCAGGCGGAAGACAGTGAGCTGTTCGAGCTGGATTATTGCCTCTAGGGGCTGAAGCTGCCCTCGAGGACCTGGTCTCCACCATTCGAGTCTGAAGATTCTCAGAAGCACAACCAGAGTGAGTATGAGGATTCGGCCGGCGAATGCTGCTCCTGTCCAAAGACAGACTCTCAGATCCTGAAGGAGCTGGAGGAGTCCTCGTTTAGGAAGACGTTTGAGGATTACCTGCACAACGTGGTTTTCGTCCCCAGGCCATCTCGGAAACGCAGGTCCCTTGGCGATGTTGGGAATGTGACGGTGGCCGTGCCCACGGTGGCAGCTTTCCCCAACACTTCCTCGACCAGCGTGCCCACGAGTCCGGAGGAGCACAGGCCTTTTGAGAAGGTGGTGAACAAGGAGTCGCTGGTCATCTCCGGCTTGCGACACTTCACGGGCTATCGCATCGAGCTGCAGGCTTGCAACCAGGACACCCCTGAGGAACGGTGCAGTGTGGCAGCCTACGTCAGTGCGAGGACCATGCCTGAAGCCAAGGCTGATGACATTGTTGGCCCTGTGACGCATGAAATCTTTGAGAACAACGTCGTCCACTTGATGTGGCAGGAGCCGAAGGAGCCCAATGGTCTGATCGTGCTGTATGAAGTGAGTTATCGGCGATATGGTGATGAGGAGCTGCATCTCTGCGTCTCCCGCAAGCACTTCGCTCTGGAACGGGGCTGCAGGCTGCGTGGGCTGTCACCGGGGAACTACAGCGTGCGAATCCGGGCCACCTCCCTTGCGGGCAACGGCTCTTGGACGGAACCCACCTATTTCTACGTGACAGACTATTTAGACGTCCCGTCAAATATTGCAAAAATTATCATCGGCCCCCTCATCTTTGTCTTTCTCTTCAGTGTTGTGATTGGAAGTATTTATCTATTCCTGAGAAAGAGGCAGCCAGATGGGCCGCTGGGACCGCTTTACGCTTCTTCAAACCCTGAGTATCTCAGTGCCAGTGATGTGTTTCCATGCTCTGTGTACGTGCCGGACGAGTGGGAGGTGTCTCGAGAGAAGATCACCCTCCTTCGAGAGCTGGGGCAGGGCTCCTTCGGCATGGTGTATGAGGGCAATGCCAGGGACATCATCAAGGGTGAGGCAGAGACCCGCGTGGCGGTGAAGACGGTCAACGAGTCAGCCAGTCTCCGAGAGCGGATTGAGTTCCTCAATGAGGCCTCGGTCATGAAGGGCTTCACCTGCCATCACGTGGTGCGCCTCCTGGGAGTGGTGTCCAAGGGCCAGCCCACGCTGGTGGTGATGGAGCTGATGGCTCACGGAGACCTGAAGAGCTACCTCCGTTCTCTGCGGCCAGAGGCTGAGAATAATCCTGGCCGCCCTCCCCCTACCCTTCAAGAGATGATTCAGATGGCGGCAGAGATTGCTGACGGGATGGCCTACCTGAACGCCAAGAAGTTTGTGCATCGGGACCTGGCAGCGAGAAACTGCATGGTCGCCCATGATTTTACTGTCAAAATTGGAGACTTTGGAATGACCAGAGACATCTATGAAACGGATTACTACCGGAAAGGGGGCAAGGGTCTGCTCCCTGTACGGTGGATGGCACCGGAGTCCCTGAAGGATGGGGTCTTCACCACTTCTTCTGACATGTGGTCCTTTGGCGTGGTCCTTTGGGAAATCACCAGCTTGGCAGAACAGCCTTACCAAGGCCTGTCTAATGAACAGGTGTTGAAATTTGTCATGGATGGAGGGTATCTGGATCAACCCGACAACTGTCCAGAGAGAGTCACTGACCTCATGCGCATGTGCTGGCAATTCAACCCCAACATGAGGCCAACCTTCCTGGAGATTGTCAACCTGCTCAAGGACGACCTGCACCCCAGCTTTCCAGAGGTGTCGTTCTTCCACAGCGAGGAGAACAAGGCTCCCGAGAGTGAGGAGCTGGAGATGGAGTTTGAGGACATGGAGAATGTGCCCCTGGACCGTTCCTCGCACTGTCAGAGGGAGGAGGCGGGGGGCCGGGATGGAGGGTCCTCGCTGGGTTTCAAGCGGAGCTACGAGGAACACATCCCTTACACACACATGAACGGAGGCAAGAAAAACGGGCGGATTCTGACCTTGCCTCGGTCCAATCCTTCCT(SEQ ID NO:197)

蛋白:(X表示非典型氨基酸)

MGTGGRRGAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIRNNLTRLHELENCSVIEGHLQILLMFKTRPEDFRDLSFPKLIMITDYLLLFRVYGLESLKDLFPNLTVIRGSRLFFNYALVIFEMVHLKELGLYNLMNITRGSVRIEKNNELCYLATIDWSRILDSVEDNYIVLNKDDNEECGDICPGTAKGKTNCPATVINGQFVERCWTHSHCQKVCPTICKSHGCTAEGLCCHSECLGNCSQPDDPTKCVACRNFYLDGRCVETCPPPYYHFQDWRCVNFSFCQDLHHKCKNSRRQGCHQYVIHNNKCIPECPSGYTMNSSNLLCTPCLGPCPKVCHLLEGEKTIDSVTSAQELRGCTVINGSLIINIRGGNNLAAELEANLGLIEEISGYLKIRRSYALVSLSFFRKLRLIRGETLEIGNYSFYALDNQNLRQLWDWSKHNLTITQGKLFFHYNPKLCLSEIHKMEEVSGTKGRQERNDIALKTNGDQASCENELLKFSYIRTSFDKILLRWEPYWPPDFRDLLGFMLFYKEAPYQNVTEFDGQDACGSNSWTVVDIDPPLRSNDPKSQNHPGWLMRGLKPWTQYAIFVKTLVTFSDERRTYGAKSDIIYVQTDATNPSVPLDPISVSNSSSQIILKWKPPSDPNGNITHYLVFWERQAEDSELFELDYCLXGLKLPSRTWSPPFESEDSQKHNQSEYEDSAGECCSCPKTDSQILKELEESSFRKTFEDYLHNVVFVPRPSRKRRSLGDVGNVTVAVPTVAAFPNTSSTSVPTSPEEHRPFEKVVNKESLVISGLRHFTGYRIELQACNQDTPEERCSVAAYVSARTMPEAKADDIVGPVTHEIFENNVVHLMWQEPKEPNGLIVLYEVSYRRYGDEELHLCVSRKHFALERGCRLRGLSPGNYSVRIRATSLAGNGSWTEPTYFYVTDYLDVPSNIAKIIIGPLIFVFLFSVVIGSIYLFLRKRQPDGPLGPLYASSNPEYLSASDVFPCSVYVPDEWEVSREKITLLRELGQGSFGMVYEGNARDIIKGEAETRVAVKTVNESASLRERIEFLNEASVMKGFTCHHVVRLLGVVSKGQPTLVVMELMAHGDLKSYLRSLRPEAENNPGRPPPTLQEMIQMAAEIADGMAYLNAKKFVHRDLAARNCMVAHDFTVKIGDFGMTRDIYETDYYRKGGKGLLPVRWMAPESLKDGVFTTSSDMWSFGVVLWEITSLAEQPYQGLSNEQVLKFVMDGGYLDQPDNCPERVTDLMRMCWQFNPNMRPTFLEIVNLLKDDLHPSFPEVSFFHSEENKAPESEELEMEFEDMENVPLDRSSHCQREEAGGRDGGSSLGFKRSYEEHIPYTHMNGGKKNGRILTLPRSNPS(SEQ ID NO:198)

Nup153-EGFP^149TAG

DNA:(下划线示出琥珀密码子)

ATGGCGTCTGGTGCTGGCGGTGTTGGTGGAGGAGGTGGGGGTAAAATTCGTACTCGTCGCTGTCATCAAGGTCCGATTAAACCGTATCAGCAGGGACGTCAGCAACATCAGGGTATTCTGAGCCGTGTGACCGAAAGCGTGAAAAACATTGTGCCGGGTTGGCTGCAACGTTATTTCAACAAAAATGAGGATGTGTGTTCGTGTTCTACCGATACCAGTGAAGTTCCTCGTTGGCCGGAAAACAAAGAAGATCACCTGGTGTATGCCGATGAAGAATCGAGCAATATCACCGATGGCCGTATTACTCCTGAACCGGCGGTTAGTAACACTGAAGAACCGTCAACCACAAGCACAGCATCGAACTATCCAGATGTCCTGACTCGCCCTTCTCTGCACCGTTCTCACCTGAACTTTAGCATGCTGGAATCACCAGCTCTGCATTGTCAGCCGTCTACCAGTAGTGCCTTCCCGATTGGCTCTAGTGGCTTTTCGCTGGTCAAAGAGATCAAAGACTCGACCTCTCAACATGACGATGATAACATTAGCACGACCTCGGGTTTTAGTAGCCGTGCCTCCGATAAAGACATTACCGTGAGCAAAAACACCTCTCTGCCGCCTCTGTGGAGTCCTGAAGCCGAACGCTCTCATAGTCTGTCTCAGCACACAGCCACCAGTTCCAAAAAACCAGCCTTCAACCTGAGCGCCTTTGGTACACTGTCACCGAGCCTGGGAAATTCCTCTATCCTGAAAACATCACAGCTGGGCGATAGTCCGTTTTATCCGGGCAAAACGACGTATGGTGGTGCCGCTGCTGCTGTTCGCCAGTCTAAACTGCGTAACACTCCGTATCAAGCTCCAGTCCGTCGCCAAATGAAAGCAAAACAACTGTCGGCCCAGTCTTATGGTGTGACAAGCTCTACAGCTCGTCGTATCCTGCAAAGTCTGGAGAAAATGTCATCTCCGCTGGCAGATGCCAAACGTATTCCGTCCATTGTGAGCAGTCCGCTGAATAGCCCGCTGGACCGTAGTGGGATCGATATCACCGACTTCCAAGCCAAACGTGAGAAAGTGGATAGCCAGTATCCGCCTGTACAACGTCTGATGACCCCGAAACCGGTTTCAATTGCCACGAATCGTAGCGTGTATTTCAAACCGTCACTGACCCCTAGTGGTGAGTTTCGTAAAACAAATCAGCGTATCGACAACAAATGCTCTACCGGGTATGAAAAAAACATGACGCCGGGACAGAATCGTGAACAACGTGAATCTGGCTTCTCTTATCCGAACTTTAGTCTGCCGGCAGCAAATGGTCTGAGTAGCGGTGTAGGAGGTGGTGGGGGCAAAATGCGCCGTGAACGTCACGCCTTTGTGGCCTCTAAACCTCTGGAAGAAGAAGAGATGGAGGTTCCTGTACTGCCGAAAATCAGTCTGCCTATCACCTCTTCAAGTCTGCCGACCTTCAACTTTTCTAGTCCGGAAATCACAACCTCTAGCCCGTCACCGATTAATAGCAGTCAAGCACTGACGAATAAAGTCCAAATGACCTCACCGAGTTCTACGGGTTCTCCGATGTTCAAATTCTCTAGTCCTATCGTGAAATCAACCGAAGCGAACGTCCTGCCTCCTTCTAGTATTGGGTTCACCTTTAGCGTCCCAGTGGCCAAAACAGCTGAACTGAGCGGTAGCAGTAGTACTCTGGAACCGATTATCAGCTCAAGCGCCCATCATGTCACTACCGTGAATAGCACAAACTGTAAAAAAACGCCGCCTGAGGACTGTGAAGGACCGTTTCGTCCTGCCGAAATCCTGAAAGAAGGTTCCGTCCTGGACATTCTGAAATCTCCGGGATTTGCCTCTCCTAAAATCGACTCTGTTGCCGCTCAACCAACTGCCACATCACCGGTGGTTTATACTCGTCCGGCGATTAGCAGTTTTAGCAGTAGTGGCATCGGTTTTGGTGAATCCCTGAAAGCTGGCTCATCTTGGCAGTGTGACACCTGCCTGCTGCAAAACAAAGTGACCGATAACAAATGTATTGCCTGTCAGGCCGCCAAACTGTCTCCTCGTGATACAGCCAAACAGACCGGCATCGAAACCCCTAATAAAAGCGGGAAAACGACCCTGTCAGCAAGTGGTACGGGATTTGGGGACAAATTCAAACCTGTGATCGGCACATGGGACTGTGACACTTGTCTGGTACAGAACAAACCAGAAGCGATCAAATGTGTGGCCTGTGAAACGCCTAAACCTGGAACATGTGTGAAACGTGCCCTGACTCTGACTGTTGTGTCAGAAAGCGCCGAAACCATGACGGCAAGCAGCTCATCCTGTACTGTGACTACCGGGACTCTGGGATTTGGTGACAAATTCAAACGCCCGATTGGTTCCTGGGAATGCTCCGTGTGTTGTGTGAGCAATAATGCCGAGGACAACAAATGTGTGTCCTGTATGAGCGAGAAACCTGGCAGCTCTGTTCCTGCTAGCAGCTCTAGCACAGTTCCTGTTAGTCTGCCTAGTGGTGGTTCTCTGGGTCTGGAAAAATTCAAAAAACCTGAAGGAAGCTGGGATTGTGAGCTGTGCCTGGTACAGAATAAAGCGGATAGCACGAAATGTCTGGCCTGTGAGTCAGCCAAACCAGGGACTAAAAGCGGCTTTAAAGGCTTCGACACGTCGAGCAGTTCTAGTAACAGCGCCGCCTCATCATCTTTCAAATTTGGGGTGAGCAGCTCCTCTAGTGGTCCTAGTCAAACACTGACCTCTACCGGAAACTTCAAATTCGGCGATCAGGGTGGCTTCAAAATTGGTGTCTCCTCTGATTCGGGTAGCATTAACCCGATGAGTGAGGGGTTCAAATTCAGCAAACCAATTGGCGATTTCAAATTCGGTGTGTCGTCTGAATCCAAACCTGAAGAAGTCAAAAAAGACAGCAAAAACGACAATTTCAAATTCGGCCTGTCTAGTGGTCTGTCTAATCCGGTTAGCCTGACCCCGTTTCAGTTCGGGGTGTCTAATCTGGGTCAGGAAGAGAAAAAAGAGGAGCTGCCTAAAAGTTCATCTGCCGGGTTCAGTTTTGGTACAGGCGTGATCAATAGCACTCCAGCACCAGCCAATACAATCGTGACGAGCGAGAACAAATCGAGCTTCAACCTGGGGACAATCGAAACGAAAAGCGCCAGTGTAGCGCCATTCACGTGTAAAACCTCCGAGGCAAAAAAAGAAGAGATGCCGGCCACAAAAGGTGGATTCTCATTCGGCAACGTGGAACCGGCTAGCCTGCCATCAGCAAGCGTGTTTGTACTGGGCCGTACCGAGGAGAAACAGCAGGAACCTGTTACTAGCACCAGTCTGGTCTTTGGTAAAAAAGCCGACAACGAAGAACCGAAATGTCAGCCAGTGTTCAGCTTCGGCAATAGCGAACAGACGAAAGACGAAAACAGCAGCAAATCGACGTTCAGCTTCAGTATGACGAAACCGAGCGAAAAAGAAAGTGAGCAGCCAGCAAAAGCAACGTTCGCCTTTGGAGCACAGACATCAACCACAGCCGATCAAGGAGCAGCGAAACCAGTTTTCAGTTTTCTGAATAACAGCTCAAGCAGCAGTTCTACACCAGCAACCTCAGCAGGTGGTGGGATCTTTGGATCAAGCACCTCATCCAGCAATCCGCCAGTGGCAACATTCGTGTTTGGCCAGAGCAGTAATCCGGTGTCATCTTCAGCATTTGGGAATACCGCCGAGAGTAGCACATCACAGTCTCTGCTGTTCTCACAGGACTCTAAACTGGCAACCACCTCTTCTACTGGTACAGCGGTTACCCCGTTTGTGTTCGGTCCGGGAGCATCATCCAATAATACCACGACGTCGGGCTTTGGGTTTGGTGCCACGACAACAAGCAGTAGCGCTGGTAGCAGCTTTGTCTTTGGCACAGGTCCTTCAGCACCTTCTGCTTCACCAGCTTTCGGAGCCAATCAGACTCCGACATTCGGACAGTCACAGGGTGCCTCTCAACCAAATCCTCCGGGTTTTGGCAGTATTAGCAGTAGTACCGCCCTGTTCCCGACCGGTAGTCAACCGGCACCGCCAACATTTGGAACGGTTAGCAGTAGTAGTCAGCCTCCGGTGTTTGGACAACAACCGAGCCAGAGCGCCTTCGGATCAGGAACGACCCCTAATAGTAGCAGTGCCTTCCAGTTCGGTAGCAGTACCACCAACTTCAACTTCACGAACAATAGCCCGTCAGGTGTGTTCACGTTTGGCGCCAATTCTTCTACCCCAGCGGCAAGTGCTCAACCTTCAGGCTCAGGTGGATTTCCTTTCAACCAGTCACCAGCAGCGTTTACTGTTGGTTCTAACGGGAAAAACGTTTTCAGTAGCAGCGGCACCTCGTTTTCTGGTCGTAAAATCAAAACGGCCGTTCGTCGCCGTAAAGCGGATCCACCGGTCGCCACGAGAGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACTAGGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAA(SEQ ID NO:199)

蛋白:(X表示非典型氨基酸)

MASGAGGVGGGGGGKIRTRRCHQGPIKPYQQGRQQHQGILSRVTESVKNIVPGWLQRYFNKNEDVCSCSTDTSEVPRWPENKEDHLVYADEESSNITDGRITPEPAVSNTEEPSTTSTASNYPDVLTRPSLHRSHLNFSMLESPALHCQPSTSSAFPIGSSGFSLVKEIKDSTSQHDDDNISTTSGFSSRASDKDITVSKNTSLPPLWSPEAERSHSLSQHTATSSKKPAFNLSAFGTLSPSLGNSSILKTSQLGDSPFYPGKTTYGGAAAAVRQSKLRNTPYQAPVRRQMKAKQLSAQSYGVTSSTARRILQSLEKMSSPLADAKRIPSIVSSPLNSPLDRSGIDITDFQAKREKVDSQYPPVQRLMTPKPVSIATNRSVYFKPSLTPSGEFRKTNQRIDNKCSTGYEKNMTPGQNREQRESGFSYPNFSLPAANGLSSGVGGGGGKMRRERHAFVASKPLEEEEMEVPVLPKISLPITSSSLPTFNFSSPEITTSSPSPINSSQALTNKVQMTSPSSTGSPMFKFSSPIVKSTEANVLPPSSIGFTFSVPVAKTAELSGSSSTLEPIISSSAHHVTTVNSTNCKKTPPEDCEGPFRPAEILKEGSVLDILKSPGFASPKIDSVAAQPTATSPVVYTRPAISSFSSSGIGFGESLKAGSSWQCDTCLLQNKVTDNKCIACQAAKLSPRDTAKQTGIETPNKSGKTTLSASGTGFGDKFKPVIGTWDCDTCLVQNKPEAIKCVACETPKPGTCVKRALTLTVVSESAETMTASSSSCTVTTGTLGFGDKFKRPIGSWECSVCCVSNNAEDNKCVSCMSEKPGSSVPASSSSTVPVSLPSGGSLGLEKFKKPEGSWDCELCLVQNKADSTKCLACESAKPGTKSGFKGFDTSSSSSNSAASSSFKFGVSSSSSGPSQTLTSTGNFKFGDQGGFKIGVSSDSGSINPMSEGFKFSKPIGDFKFGVSSESKPEEVKKDSKNDNFKFGLSSGLSNPVSLTPFQFGVSNLGQEEKKEELPKSSSAGFSFGTGVINSTPAPANTIVTSENKSSFNLGTIETKSASVAPFTCKTSEAKKEEMPATKGGFSFGNVEPASLPSASVFVLGRTEEKQQEPVTSTSLVFGKKADNEEPKCQPVFSFGNSEQTKDENSSKSTFSFSMTKPSEKESEQPAKATFAFGAQTSTTADQGAAKPVFSFLNNSSSSSSTPATSAGGGIFGSSTSSSNPPVATFVFGQSSNPVSSSAFGNTAESSTSQSLLFSQDSKLATTSSTGTAVTPFVFGPGASSNNTTTSGFGFGATTTSSSAGSSFVFGTGPSAPSASPAFGANQTPTFGQSQGASQPNPPGFGSISSSTALFPTGSQPAPPTFGTVSSSSQPPVFGQQPSQSAFGSGTTPNSSSAFQFGSSTTNFNFTNNSPSGVFTFGANSSTPAASAQPSGSGGFPFNQSPAAFTVGSNGKNVFSSSGTSFSGRKIKTAVRRRKADPPVATRVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHXVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYK(SEQ ID NO:200)

Nup153-EGFP^149TAG-MS2

DNA:(下划线示出MS2茎环和琥珀密码子)

ATGGCGTCTGGTGCTGGCGGTGTTGGTGGAGGAGGTGGGGGTAAAATTCGTACTCGTCGCTGTCATCAAGGTCCGATTAAACCGTATCAGCAGGGACGTCAGCAACATCAGGGTATTCTGAGCCGTGTGACCGAAAGCGTGAAAAACATTGTGCCGGGTTGGCTGCAACGTTATTTCAACAAAAATGAGGATGTGTGTTCGTGTTCTACCGATACCAGTGAAGTTCCTCGTTGGCCGGAAAACAAAGAAGATCACCTGGTGTATGCCGATGAAGAATCGAGCAATATCACCGATGGCCGTATTACTCCTGAACCGGCGGTTAGTAACACTGAAGAACCGTCAACCACAAGCACAGCATCGAACTATCCAGATGTCCTGACTCGCCCTTCTCTGCACCGTTCTCACCTGAACTTTAGCATGCTGGAATCACCAGCTCTGCATTGTCAGCCGTCTACCAGTAGTGCCTTCCCGATTGGCTCTAGTGGCTTTTCGCTGGTCAAAGAGATCAAAGACTCGACCTCTCAACATGACGATGATAACATTAGCACGACCTCGGGTTTTAGTAGCCGTGCCTCCGATAAAGACATTACCGTGAGCAAAAACACCTCTCTGCCGCCTCTGTGGAGTCCTGAAGCCGAACGCTCTCATAGTCTGTCTCAGCACACAGCCACCAGTTCCAAAAAACCAGCCTTCAACCTGAGCGCCTTTGGTACACTGTCACCGAGCCTGGGAAATTCCTCTATCCTGAAAACATCACAGCTGGGCGATAGTCCGTTTTATCCGGGCAAAACGACGTATGGTGGTGCCGCTGCTGCTGTTCGCCAGTCTAAACTGCGTAACACTCCGTATCAAGCTCCAGTCCGTCGCCAAATGAAAGCAAAACAACTGTCGGCCCAGTCTTATGGTGTGACAAGCTCTACAGCTCGTCGTATCCTGCAAAGTCTGGAGAAAATGTCATCTCCGCTGGCAGATGCCAAACGTATTCCGTCCATTGTGAGCAGTCCGCTGAATAGCCCGCTGGACCGTAGTGGGATCGATATCACCGACTTCCAAGCCAAACGTGAGAAAGTGGATAGCCAGTATCCGCCTGTACAACGTCTGATGACCCCGAAACCGGTTTCAATTGCCACGAATCGTAGCGTGTATTTCAAACCGTCACTGACCCCTAGTGGTGAGTTTCGTAAAACAAATCAGCGTATCGACAACAAATGCTCTACCGGGTATGAAAAAAACATGACGCCGGGACAGAATCGTGAACAACGTGAATCTGGCTTCTCTTATCCGAACTTTAGTCTGCCGGCAGCAAATGGTCTGAGTAGCGGTGTAGGAGGTGGTGGGGGCAAAATGCGCCGTGAACGTCACGCCTTTGTGGCCTCTAAACCTCTGGAAGAAGAAGAGATGGAGGTTCCTGTACTGCCGAAAATCAGTCTGCCTATCACCTCTTCAAGTCTGCCGACCTTCAACTTTTCTAGTCCGGAAATCACAACCTCTAGCCCGTCACCGATTAATAGCAGTCAAGCACTGACGAATAAAGTCCAAATGACCTCACCGAGTTCTACGGGTTCTCCGATGTTCAAATTCTCTAGTCCTATCGTGAAATCAACCGAAGCGAACGTCCTGCCTCCTTCTAGTATTGGGTTCACCTTTAGCGTCCCAGTGGCCAAAACAGCTGAACTGAGCGGTAGCAGTAGTACTCTGGAACCGATTATCAGCTCAAGCGCCCATCATGTCACTACCGTGAATAGCACAAACTGTAAAAAAACGCCGCCTGAGGACTGTGAAGGACCGTTTCGTCCTGCCGAAATCCTGAAAGAAGGTTCCGTCCTGGACATTCTGAAATCTCCGGGATTTGCCTCTCCTAAAATCGACTCTGTTGCCGCTCAACCAACTGCCACATCACCGGTGGTTTATACTCGTCCGGCGATTAGCAGTTTTAGCAGTAGTGGCATCGGTTTTGGTGAATCCCTGAAAGCTGGCTCATCTTGGCAGTGTGACACCTGCCTGCTGCAAAACAAAGTGACCGATAACAAATGTATTGCCTGTCAGGCCGCCAAACTGTCTCCTCGTGATACAGCCAAACAGACCGGCATCGAAACCCCTAATAAAAGCGGGAAAACGACCCTGTCAGCAAGTGGTACGGGATTTGGGGACAAATTCAAACCTGTGATCGGCACATGGGACTGTGACACTTGTCTGGTACAGAACAAACCAGAAGCGATCAAATGTGTGGCCTGTGAAACGCCTAAACCTGGAACATGTGTGAAACGTGCCCTGACTCTGACTGTTGTGTCAGAAAGCGCCGAAACCATGACGGCAAGCAGCTCATCCTGTACTGTGACTACCGGGACTCTGGGATTTGGTGACAAATTCAAACGCCCGATTGGTTCCTGGGAATGCTCCGTGTGTTGTGTGAGCAATAATGCCGAGGACAACAAATGTGTGTCCTGTATGAGCGAGAAACCTGGCAGCTCTGTTCCTGCTAGCAGCTCTAGCACAGTTCCTGTTAGTCTGCCTAGTGGTGGTTCTCTGGGTCTGGAAAAATTCAAAAAACCTGAAGGAAGCTGGGATTGTGAGCTGTGCCTGGTACAGAATAAAGCGGATAGCACGAAATGTCTGGCCTGTGAGTCAGCCAAACCAGGGACTAAAAGCGGCTTTAAAGGCTTCGACACGTCGAGCAGTTCTAGTAACAGCGCCGCCTCATCATCTTTCAAATTTGGGGTGAGCAGCTCCTCTAGTGGTCCTAGTCAAACACTGACCTCTACCGGAAACTTCAAATTCGGCGATCAGGGTGGCTTCAAAATTGGTGTCTCCTCTGATTCGGGTAGCATTAACCCGATGAGTGAGGGGTTCAAATTCAGCAAACCAATTGGCGATTTCAAATTCGGTGTGTCGTCTGAATCCAAACCTGAAGAAGTCAAAAAAGACAGCAAAAACGACAATTTCAAATTCGGCCTGTCTAGTGGTCTGTCTAATCCGGTTAGCCTGACCCCGTTTCAGTTCGGGGTGTCTAATCTGGGTCAGGAAGAGAAAAAAGAGGAGCTGCCTAAAAGTTCATCTGCCGGGTTCAGTTTTGGTACAGGCGTGATCAATAGCACTCCAGCACCAGCCAATACAATCGTGACGAGCGAGAACAAATCGAGCTTCAACCTGGGGACAATCGAAACGAAAAGCGCCAGTGTAGCGCCATTCACGTGTAAAACCTCCGAGGCAAAAAAAGAAGAGATGCCGGCCACAAAAGGTGGATTCTCATTCGGCAACGTGGAACCGGCTAGCCTGCCATCAGCAAGCGTGTTTGTACTGGGCCGTACCGAGGAGAAACAGCAGGAACCTGTTACTAGCACCAGTCTGGTCTTTGGTAAAAAAGCCGACAACGAAGAACCGAAATGTCAGCCAGTGTTCAGCTTCGGCAATAGCGAACAGACGAAAGACGAAAACAGCAGCAAATCGACGTTCAGCTTCAGTATGACGAAACCGAGCGAAAAAGAAAGTGAGCAGCCAGCAAAAGCAACGTTCGCCTTTGGAGCACAGACATCAACCACAGCCGATCAAGGAGCAGCGAAACCAGTTTTCAGTTTTCTGAATAACAGCTCAAGCAGCAGTTCTACACCAGCAACCTCAGCAGGTGGTGGGATCTTTGGATCAAGCACCTCATCCAGCAATCCGCCAGTGGCAACATTCGTGTTTGGCCAGAGCAGTAATCCGGTGTCATCTTCAGCATTTGGGAATACCGCCGAGAGTAGCACATCACAGTCTCTGCTGTTCTCACAGGACTCTAAACTGGCAACCACCTCTTCTACTGGTACAGCGGTTACCCCGTTTGTGTTCGGTCCGGGAGCATCATCCAATAATACCACGACGTCGGGCTTTGGGTTTGGTGCCACGACAACAAGCAGTAGCGCTGGTAGCAGCTTTGTCTTTGGCACAGGTCCTTCAGCACCTTCTGCTTCACCAGCTTTCGGAGCCAATCAGACTCCGACATTCGGACAGTCACAGGGTGCCTCTCAACCAAATCCTCCGGGTTTTGGCAGTATTAGCAGTAGTACCGCCCTGTTCCCGACCGGTAGTCAACCGGCACCGCCAACATTTGGAACGGTTAGCAGTAGTAGTCAGCCTCCGGTGTTTGGACAACAACCGAGCCAGAGCGCCTTCGGATCAGGAACGACCCCTAATAGTAGCAGTGCCTTCCAGTTCGGTAGCAGTACCACCAACTTCAACTTCACGAACAATAGCCCGTCAGGTGTGTTCACGTTTGGCGCCAATTCTTCTACCCCAGCGGCAAGTGCTCAACCTTCAGGCTCAGGTGGATTTCCTTTCAACCAGTCACCAGCAGCGTTTACTGTTGGTTCTAACGGGAAAAACGTTTTCAGTAGCAGCGGCACCTCGTTTTCTGGTCGTAAAATCAAAACGGCCGTTCGTCGCCGTAAAGCGGATCCACCGGTCGCCACGAGAGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACTAGGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAAAGCGGCCGCGACTCTAGATCATAATCAGCACATGAGGATCACCCATGTCTGCAGGTCGACTCTAGAAAAC ATGAGGATCACCCATGT(SEQ ID NO:201)

蛋白:(X表示非典型氨基酸)

MASGAGGVGGGGGGKIRTRRCHQGPIKPYQQGRQQHQGILSRVTESVKNIVPGWLQRYFNKNEDVCSCSTDTSEVPRWPENKEDHLVYADEESSNITDGRITPEPAVSNTEEPSTTSTASNYPDVLTRPSLHRSHLNFSMLESPALHCQPSTSSAFPIGSSGFSLVKEIKDSTSQHDDDNISTTSGFSSRASDKDITVSKNTSLPPLWSPEAERSHSLSQHTATSSKKPAFNLSAFGTLSPSLGNSSILKTSQLGDSPFYPGKTTYGGAAAAVRQSKLRNTPYQAPVRRQMKAKQLSAQSYGVTSSTARRILQSLEKMSSPLADAKRIPSIVSSPLNSPLDRSGIDITDFQAKREKVDSQYPPVQRLMTPKPVSIATNRSVYFKPSLTPSGEFRKTNQRIDNKCSTGYEKNMTPGQNREQRESGFSYPNFSLPAANGLSSGVGGGGGKMRRERHAFVASKPLEEEEMEVPVLPKISLPITSSSLPTFNFSSPEITTSSPSPINSSQALTNKVQMTSPSSTGSPMFKFSSPIVKSTEANVLPPSSIGFTFSVPVAKTAELSGSSSTLEPIISSSAHHVTTVNSTNCKKTPPEDCEGPFRPAEILKEGSVLDILKSPGFASPKIDSVAAQPTATSPVVYTRPAISSFSSSGIGFGESLKAGSSWQCDTCLLQNKVTDNKCIACQAAKLSPRDTAKQTGIETPNKSGKTTLSASGTGFGDKFKPVIGTWDCDTCLVQNKPEAIKCVACETPKPGTCVKRALTLTVVSESAETMTASSSSCTVTTGTLGFGDKFKRPIGSWECSVCCVSNNAEDNKCVSCMSEKPGSSVPASSSSTVPVSLPSGGSLGLEKFKKPEGSWDCELCLVQNKADSTKCLACESAKPGTKSGFKGFDTSSSSSNSAASSSFKFGVSSSSSGPSQTLTSTGNFKFGDQGGFKIGVSSDSGSINPMSEGFKFSKPIGDFKFGVSSESKPEEVKKDSKNDNFKFGLSSGLSNPVSLTPFQFGVSNLGQEEKKEELPKSSSAGFSFGTGVINSTPAPANTIVTSENKSSFNLGTIETKSASVAPFTCKTSEAKKEEMPATKGGFSFGNVEPASLPSASVFVLGRTEEKQQEPVTSTSLVFGKKADNEEPKCQPVFSFGNSEQTKDENSSKSTFSFSMTKPSEKESEQPAKATFAFGAQTSTTADQGAAKPVFSFLNNSSSSSSTPATSAGGGIFGSSTSSSNPPVATFVFGQSSNPVSSSAFGNTAESSTSQSLLFSQDSKLATTSSTGTAVTPFVFGPGASSNNTTTSGFGFGATTTSSSAGSSFVFGTGPSAPSASPAFGANQTPTFGQSQGASQPNPPGFGSISSSTALFPTGSQPAPPTFGTVSSSSQPPVFGQQPSQSAFGSGTTPNSSSAFQFGSSTTNFNFTNNSPSGVFTFGANSSTPAASAQPSGSGGFPFNQSPAAFTVGSNGKNVFSSSGTSFSGRKIKTAVRRRKADPPVATRVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHXVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYK(SEQ ID NO:202)

Vim^116TAG-mOrange

DNA:(下划线示出琥珀密码子)

ATGTCCACCAGGTCCGTGTCCTCGTCCTCCTACCGCAGGATGTTCGGCGGCCCGGGCACCGCGAGCCGGCCGAGCTCCAGCCGGAGCTACGTGACTACGTCCACCCGCACCTACAGCCTGGGCAGCGCGCTGCGCCCCAGCACCAGCCGCAGCCTCTACGCCTCGTCCCCGGGCGGCGTGTATGCCACGCGCTCCTCTGCCGTGCGCCTGCGGAGCAGCGTGCCCGGGGTGCGGCTCCTGCAGGACTCGGTGGACTTCTCGCTGGCCGACGCCATCAACACCGAGTTCAAGAACACCCGCACCAACGAGAAGGTGGAGCTGCAGGAGCTGAATGACCGCTTCGCCTAGTACATCGACAAGGTGCGCTTCCTGGAGCAGCAGAATAAGATCCTGCTGGCCGAGCTCGAGCAGCTCAAGGGCCAAGGCAAGTCGCGCCTGGGGGACCTCTACGAGGAGGAGATGCGGGAGCTGCGCCGGCAGGTGGACCAGCTAACCAACGACAAAGCCCGCGTCGAGGTGGAGCGCGACAACCTGGCCGAGGACATCATGCGCCTCCGGGAGAAATTGCAGGAGGAGATGCTTCAGAGAGAGGAAGCCGAAAACACCCTGCAATCTTTCAGACAGGATGTTGACAATGCGTCTCTGGCACGTCTTGACCTTGAACGCAAAGTGGAATCTTTGCAAGAAGAGATTGCCTTTTTGAAGAAACTCCACGAAGAGGAAATCCAGGAGCTGCAGGCTCAGATTCAGGAACAGCATGTCCAAATCGATGTGGATGTTTCCAAGCCTGACCTCACGGCTGCCCTGCGTGACGTACGTCAGCAATATGAAAGTGTGGCTGCCAAGAACCTGCAGGAGGCAGAAGAATGGTACAAATCCAAGTTTGCTGACCTCTCTGAGGCTGCCAACCGGAACAATGACGCCCTGCGCCAGGCAAAGCAGGAGTCCACTGAGTACCGGAGACAGGTGCAGTCCCTCACCTGTGAAGTGGATGCCCTTAAAGGAACCAATGAGTCCCTGGAACGCCAGATGCGTGAAATGGAAGAGAACTTTGCCGTTGAAGCTGCTAACTACCAAGACACTATTGGCCGCCTGCAGGATGAGATTCAGAATATGAAGGAGGAAATGGCTCGTCACCTTCGTGAATACCAAGACCTGCTCAATGTTAAGATGGCCCTTGACATTGAGATTGCCACCTACAGGAAGCTGCTGGAAGGCGAGGAGAGCAGGATTTCTCTGCCTCTTCCAAACTTTTCCTCCCTGAACCTGAGGGAAACTAATCTGGATTCACTCCCTCTGGTTGATACCCACTCAAAAAGGACACTTCTGATTAAGACGGTTGAAACTAGAGATGGACAGGTTATCAACGAAACTTCTCAGCATCACGATGACCTTGAAGGGGATCCACCGGTCGCCACCATGGTGAGCAAGGGCGAGGAGAATAATATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCGCATGGAGGGCACCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCTTTCAGACCGCTAAGCTGAAGGTGACCAAGGGCGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCTCTTCACCTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTCAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTACGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCACTGCAGGACGGCGAGTTCATCTACAAGGTGAAGATGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTGATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAGGATGAGGCTGAAGCTGAAGGACGGCGGCCACTACACCTCCGAGGTCAAGACCACCTACAAGGCCAAGAAGTCCGTGCAGCTGCCCGGCGCCTACATCGTCGGCATCAAGCTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAA(SEQ ID NO:203)

蛋白:(X表示非典型氨基酸)

MSTRSVSSSSYRRMFGGPGTASRPSSSRSYVTTSTRTYSLGSALRPSTSRSLYASSPGGVYATRSSAVRLRSSVPGVRLLQDSVDFSLADAINTEFKNTRTNEKVELQELNDRFAXYIDKVRFLEQQNKILLAELEQLKGQGKSRLGDLYEEEMRELRRQVDQLTNDKARVEVERDNLAEDIMRLREKLQEEMLQREEAENTLQSFRQDVDNASLARLDLERKVESLQEEIAFLKKLHEEEIQELQAQIQEQHVQIDVDVSKPDLTAALRDVRQQYESVAAKNLQEAEEWYKSKFADLSEAANRNNDALRQAKQESTEYRRQVQSLTCEVDALKGTNESLERQMREMEENFAVEAANYQDTIGRLQDEIQNMKEEMARHLREYQDLLNVKMALDIEIATYRKLLEGEESRISLPLPNFSSLNLRETNLDSLPLVDTHSKRTLLIKTVETRDGQVINETSQHHDDLEGDPPVATMVSKGEENNMAIIKEFMRFKVRMEGTVNGHEFEIEGEGEGRPYEGFQTAKLKVTKGGPLPFAWDILSPLFTYGSKAYVKHPADIPDYFKLSFPEGFKWERVMNYEDGGVVTVTQDSSLQDGEFIYKVKMRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIRMRLKLKDGGHYTSEVKTTYKAKKSVQLPGAYIVGIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYK(SEQ ID NO:204)

Vim^116TAG-mOrange-MS2

DNA:(下划线示出MS2茎环和琥珀密码子)

ATGTCCACCAGGTCCGTGTCCTCGTCCTCCTACCGCAGGATGTTCGGCGGCCCGGGCACCGCGAGCCGGCCGAGCTCCAGCCGGAGCTACGTGACTACGTCCACCCGCACCTACAGCCTGGGCAGCGCGCTGCGCCCCAGCACCAGCCGCAGCCTCTACGCCTCGTCCCCGGGCGGCGTGTATGCCACGCGCTCCTCTGCCGTGCGCCTGCGGAGCAGCGTGCCCGGGGTGCGGCTCCTGCAGGACTCGGTGGACTTCTCGCTGGCCGACGCCATCAACACCGAGTTCAAGAACACCCGCACCAACGAGAAGGTGGAGCTGCAGGAGCTGAATGACCGCTTCGCCTAGTACATCGACAAGGTGCGCTTCCTGGAGCAGCAGAATAAGATCCTGCTGGCCGAGCTCGAGCAGCTCAAGGGCCAAGGCAAGTCGCGCCTGGGGGACCTCTACGAGGAGGAGATGCGGGAGCTGCGCCGGCAGGTGGACCAGCTAACCAACGACAAAGCCCGCGTCGAGGTGGAGCGCGACAACCTGGCCGAGGACATCATGCGCCTCCGGGAGAAATTGCAGGAGGAGATGCTTCAGAGAGAGGAAGCCGAAAACACCCTGCAATCTTTCAGACAGGATGTTGACAATGCGTCTCTGGCACGTCTTGACCTTGAACGCAAAGTGGAATCTTTGCAAGAAGAGATTGCCTTTTTGAAGAAACTCCACGAAGAGGAAATCCAGGAGCTGCAGGCTCAGATTCAGGAACAGCATGTCCAAATCGATGTGGATGTTTCCAAGCCTGACCTCACGGCTGCCCTGCGTGACGTACGTCAGCAATATGAAAGTGTGGCTGCCAAGAACCTGCAGGAGGCAGAAGAATGGTACAAATCCAAGTTTGCTGACCTCTCTGAGGCTGCCAACCGGAACAATGACGCCCTGCGCCAGGCAAAGCAGGAGTCCACTGAGTACCGGAGACAGGTGCAGTCCCTCACCTGTGAAGTGGATGCCCTTAAAGGAACCAATGAGTCCCTGGAACGCCAGATGCGTGAAATGGAAGAGAACTTTGCCGTTGAAGCTGCTAACTACCAAGACACTATTGGCCGCCTGCAGGATGAGATTCAGAATATGAAGGAGGAAATGGCTCGTCACCTTCGTGAATACCAAGACCTGCTCAATGTTAAGATGGCCCTTGACATTGAGATTGCCACCTACAGGAAGCTGCTGGAAGGCGAGGAGAGCAGGATTTCTCTGCCTCTTCCAAACTTTTCCTCCCTGAACCTGAGGGAAACTAATCTGGATTCACTCCCTCTGGTTGATACCCACTCAAAAAGGACACTTCTGATTAAGACGGTTGAAACTAGAGATGGACAGGTTATCAACGAAACTTCTCAGCATCACGATGACCTTGAAGGGGATCCACCGGTCGCCACCATGGTGAGCAAGGGCGAGGAGAATAATATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCGCATGGAGGGCACCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCTTTCAGACCGCTAAGCTGAAGGTGACCAAGGGCGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCTCTTCACCTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTCAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTACGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCACTGCAGGACGGCGAGTTCATCTACAAGGTGAAGATGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTGATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAGGATGAGGCTGAAGCTGAAGGACGGCGGCCACTACACCTCCGAGGTCAAGACCACCTACAAGGCCAAGAAGTCCGTGCAGCTGCCCGGCGCCTACATCGTCGGCATCAAGCTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAAAGCGGCCGCGACTCTAGATCATAATCAGCACATGAGGATCACCCATGTCTGCAGGTCGACTCTAGAAAACATGAGGATCACCCATGT(SEQ ID NO:205)

蛋白:(X表示非典型氨基酸)

MSTRSVSSSSYRRMFGGPGTASRPSSSRSYVTTSTRTYSLGSALRPSTSRSLYASSPGGVYATRSSAVRLRSSVPGVRLLQDSVDFSLADAINTEFKNTRTNEKVELQELNDRFAXYIDKVRFLEQQNKILLAELEQLKGQGKSRLGDLYEEEMRELRRQVDQLTNDKARVEVERDNLAEDIMRLREKLQEEMLQREEAENTLQSFRQDVDNASLARLDLERKVESLQEEIAFLKKLHEEEIQELQAQIQEQHVQIDVDVSKPDLTAALRDVRQQYESVAAKNLQEAEEWYKSKFADLSEAANRNNDALRQAKQESTEYRRQVQSLTCEVDALKGTNESLERQMREMEENFAVEAANYQDTIGRLQDEIQNMKEEMARHLREYQDLLNVKMALDIEIATYRKLLEGEESRISLPLPNFSSLNLRETNLDSLPLVDTHSKRTLLIKTVETRDGQVINETSQHHDDLEGDPPVATMVSKGEENNMAIIKEFMRFKVRMEGTVNGHEFEIEGEGEGRPYEGFQTAKLKVTKGGPLPFAWDILSPLFTYGSKAYVKHPADIPDYFKLSFPEGFKWERVMNYEDGGVVTVTQDSSLQDGEFIYKVKMRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIRMRLKLKDGGHYTSEVKTTYKAKKSVQLPGAYIVGIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYK(SEQ ID NO:206)

INSR^676TAG-EGFP

DNA:(下划线示出琥珀密码子)

ATGGGCACCGGGGGCCGGCGGGGGGCGGCGGCCGCGCCGCTGCTGGTGGCGGTGGCCGCGCTGCTACTGGGCGCCGCGGGCCACCTGTACCCCGGAGAGGTGTGTCCCGGCATGGATATCCGGAACAACCTCACTAGGTTGCATGAGCTGGAGAATTGCTCTGTCATCGAAGGACACTTGCAGATACTCTTGATGTTCAAAACGAGGCCCGAAGATTTCCGAGACCTCAGTTTCCCCAAACTCATCATGATCACTGATTACTTGCTGCTCTTCCGGGTCTATGGGCTCGAGAGCCTGAAGGACCTGTTCCCCAACCTCACGGTCATCCGGGGATCACGACTGTTCTTTAACTACGCGCTGGTCATCTTCGAGATGGTTCACCTCAAGGAACTCGGCCTCTACAACCTGATGAACATCACCCGGGGTTCTGTCCGCATCGAGAAGAACAATGAGCTCTGTTACTTGGCCACTATCGACTGGTCCCGTATCCTGGATTCCGTGGAGGATAATTACATCGTGTTGAACAAAGATGACAACGAGGAGTGTGGAGACATCTGTCCGGGTACCGCGAAGGGCAAGACCAACTGCCCCGCCACCGTCATCAACGGGCAGTTTGTCGAACGATGTTGGACTCATAGTCACTGCCAGAAAGTTTGCCCGACCATCTGTAAGTCACACGGCTGCACCGCCGAAGGCCTCTGTTGCCACAGCGAGTGCCTGGGCAACTGTTCTCAGCCCGACGACCCCACCAAGTGCGTGGCCTGCCGCAACTTCTACCTGGATGGCAGGTGTGTGGAGACCTGCCCGCCCCCGTACTACCACTTCCAGGACTGGCGCTGTGTGAACTTCAGCTTCTGCCAGGACCTGCACCACAAATGCAAGAACTCGCGGAGGCAGGGCTGCCACCAGTACGTCATTCACAACAACAAGTGCATCCCTGAGTGTCCCTCCGGGTACACGATGAATTCCAGCAACTTGCTGTGCACCCCATGCCTGGGTCCCTGTCCCAAGGTGTGCCACCTCCTAGAAGGCGAGAAGACCATCGACTCGGTGACGTCTGCCCAGGAGCTCCGAGGATGCACCGTCATCAACGGGAGTCTGATCATCAACATTCGAGGAGGCAACAATCTGGCAGCTGAGCTAGAAGCCAACCTCGGCCTCATTGAAGAAATTTCAGGGTATCTAAAAATCCGCCGATCCTACGCTCTGGTGTCACTTTCCTTCTTCCGGAAGTTACGTCTGATTCGAGGAGAGACCTTGGAAATTGGGAACTACTCCTTCTATGCCTTGGACAACCAGAACCTAAGGCAGCTCTGGGACTGGAGCAAACACAACCTCACCATCACTCAGGGGAAACTCTTCTTCCACTATAACCCCAAACTCTGCTTGTCAGAAATCCACAAGATGGAAGAAGTTTCAGGAACCAAGGGGCGCCAGGAGAGAAACGACATTGCCCTGAAGACCAATGGGGACCAGGCATCCTGTGAAAATGAGTTACTTAAATTTTCTTACATTCGGACATCTTTTGACAAGATCTTGCTGAGATGGGAGCCGTACTGGCCCCCCGACTTCCGAGACCTCTTGGGGTTCATGCTGTTCTACAAAGAGGCCCCTTATCAGAATGTGACGGAGTTCGACGGGCAGGATGCATGTGGTTCCAACAGTTGGACGGTGGTAGACATTGACCCACCCCTGAGGTCCAACGACCCCAAATCACAGAACCACCCAGGGTGGCTGATGCGGGGTCTCAAGCCCTGGACCCAGTATGCCATCTTTGTGAAGACCCTGGTCACCTTTTCGGATGAACGCCGGACCTATGGGGCCAAGAGTGACATCATTTATGTCCAGACAGATGCCACCAACCCCTCTGTGCCCCTGGATCCAATCTCAGTGTCTAACTCATCATCCCAGATTATTCTGAAGTGGAAACCACCCTCCGACCCCAATGGCAACATCACCCACTACCTGGTTTTCTGGGAGAGGCAGGCGGAAGACAGTGAGCTGTTCGAGCTGGATTATTGCCTCTAGGGGCTGAAGCTGCCCTCGAGGACCTGGTCTCCACCATTCGAGTCTGAAGATTCTCAGAAGCACAACCAGAGTGAGTATGAGGATTCGGCCGGCGAATGCTGCTCCTGTCCAAAGACAGACTCTCAGATCCTGAAGGAGCTGGAGGAGTCCTCGTTTAGGAAGACGTTTGAGGATTACCTGCACAACGTGGTTTTCGTCCCCAGAAAAACCTCTTCAGGCACTGGTGCCGAGGACCCTAGGCCATCTCGGAAACGCAGGTCCCTTGGCGATGTTGGGAATGTGACGGTGGCCGTGCCCACGGTGGCAGCTTTCCCCAACACTTCCTCGACCAGCGTGCCCACGAGTCCGGAGGAGCACAGGCCTTTTGAGAAGGTGGTGAACAAGGAGTCGCTGGTCATCTCCGGCTTGCGACACTTCACGGGCTATCGCATCGAGCTGCAGGCTTGCAACCAGGACACCCCTGAGGAACGGTGCAGTGTGGCAGCCTACGTCAGTGCGAGGACCATGCCTGAAGCCAAGGCTGATGACATTGTTGGCCCTGTGACGCATGAAATCTTTGAGAACAACGTCGTCCACTTGATGTGGCAGGAGCCGAAGGAGCCCAATGGTCTGATCGTGCTGTATGAAGTGAGTTATCGGCGATATGGTGATGAGGAGCTGCATCTCTGCGTCTCCCGCAAGCACTTCGCTCTGGAACGGGGCTGCAGGCTGCGTGGGCTGTCACCGGGGAACTACAGCGTGCGAATCCGGGCCACCTCCCTTGCGGGCAACGGCTCTTGGACGGAACCCACCTATTTCTACGTGACAGACTATTTAGACGTCCCGTCAAATATTGCAAAAATTATCATCGGCCCCCTCATCTTTGTCTTTCTCTTCAGTGTTGTGATTGGAAGTATTTATCTATTCCTGAGAAAGAGGCAGCCAGATGGGCCGCTGGGACCGCTTTACGCTTCTTCAAACCCTGAGTATCTCAGTGCCAGTGATGTGTTTCCATGCTCTGTGTACGTGCCGGACGAGTGGGAGGTGTCTCGAGAGAAGATCACCCTCCTTCGAGAGCTGGGGCAGGGCTCCTTCGGCATGGTGTATGAGGGCAATGCCAGGGACATCATCAAGGGTGAGGCAGAGACCCGCGTGGCGGTGAAGACGGTCAACGAGTCAGCCAGTCTCCGAGAGCGGATTGAGTTCCTCAATGAGGCCTCGGTCATGAAGGGCTTCACCTGCCATCACGTGGTGCGCCTCCTGGGAGTGGTGTCCAAGGGCCAGCCCACGCTGGTGGTGATGGAGCTGATGGCTCACGGAGACCTGAAGAGCTACCTCCGTTCTCTGCGGCCAGAGGCTGAGAATAATCCTGGCCGCCCTCCCCCTACCCTTCAAGAGATGATTCAGATGGCGGCAGAGATTGCTGACGGGATGGCCTACCTGAACGCCAAGAAGTTTGTGCATCGGGACCTGGCAGCGAGAAACTGCATGGTCGCCCATGATTTTACTGTCAAAATTGGAGACTTTGGAATGACCAGAGACATCTATGAAACGGATTACTACCGGAAAGGGGGCAAGGGTCTGCTCCCTGTACGGTGGATGGCACCGGAGTCCCTGAAGGATGGGGTCTTCACCACTTCTTCTGACATGTGGTCCTTTGGCGTGGTCCTTTGGGAAATCACCAGCTTGGCAGAACAGCCTTACCAAGGCCTGTCTAATGAACAGGTGTTGAAATTTGTCATGGATGGAGGGTATCTGGATCAACCCGACAACTGTCCAGAGAGAGTCACTGACCTCATGCGCATGTGCTGGCAATTCAACCCCAACATGAGGCCAACCTTCCTGGAGATTGTCAACCTGCTCAAGGACGACCTGCACCCCAGCTTTCCAGAGGTGTCGTTCTTCCACAGCGAGGAGAACAAGGCTCCCGAGAGTGAGGAGCTGGAGATGGAGTTTGAGGACATGGAGAATGTGCCCCTGGACCGTTCCTCGCACTGTCAGAGGGAGGAGGCGGGGGGCCGGGATGGAGGGTCCTCGCTGGGTTTCAAGCGGAGCTACGAGGAACACATCCCTTACACACACATGAACGGAGGCAAGAAAAACGGGCGGATTCTGACCTTGCCTCGGTCCAATCCTTCCTGGGCCCGGGATCCACCGGTCGCCACCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATG

GACGAGCTGTACAAGTAA(SEQ ID NO:207)

蛋白:(X表示非典型氨基酸)

MGTGGRRGAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIRNNLTRLHELENCSVIEGHLQILLMFKTRPEDFRDLSFPKLIMITDYLLLFRVYGLESLKDLFPNLTVIRGSRLFFNYALVIFEMVHLKELGLYNLMNITRGSVRIEKNNELCYLATIDWSRILDSVEDNYIVLNKDDNEECGDICPGTAKGKTNCPATVINGQFVERCWTHSHCQKVCPTICKSHGCTAEGLCCHSECLGNCSQPDDPTKCVACRNFYLDGRCVETCPPPYYHFQDWRCVNFSFCQDLHHKCKNSRRQGCHQYVIHNNKCIPECPSGYTMNSSNLLCTPCLGPCPKVCHLLEGEKTIDSVTSAQELRGCTVINGSLIINIRGGNNLAAELEANLGLIEEISGYLKIRRSYALVSLSFFRKLRLIRGETLEIGNYSFYALDNQNLRQLWDWSKHNLTITQGKLFFHYNPKLCLSEIHKMEEVSGTKGRQERNDIALKTNGDQASCENELLKFSYIRTSFDKILLRWEPYWPPDFRDLLGFMLFYKEAPYQNVTEFDGQDACGSNSWTVVDIDPPLRSNDPKSQNHPGWLMRGLKPWTQYAIFVKTLVTFSDERRTYGAKSDIIYVQTDATNPSVPLDPISVSNSSSQIILKWKPPSDPNGNITHYLVFWERQAEDSELFELDYCLXGLKLPSRTWSPPFESEDSQKHNQSEYEDSAGECCSCPKTDSQILKELEESSFRKTFEDYLHNVVFVPRKTSSGTGAEDPRPSRKRRSLGDVGNVTVAVPTVAAFPNTSSTSVPTSPEEHRPFEKVVNKESLVISGLRHFTGYRIELQACNQDTPEERCSVAAYVSARTMPEAKADDIVGPVTHEIFENNVVHLMWQEPKEPNGLIVLYEVSYRRYGDEELHLCVSRKHFALERGCRLRGLSPGNYSVRIRATSLAGNGSWTEPTYFYVTDYLDVPSNIAKIIIGPLIFVFLFSVVIGSIYLFLRKRQPDGPLGPLYASSNPEYLSASDVFPCSVYVPDEWEVSREKITLLRELGQGSFGMVYEGNARDIIKGEAETRVAVKTVNESASLRERIEFLNEASVMKGFTCHHVVRLLGVVSKGQPTLVVMELMAHGDLKSYLRSLRPEAENNPGRPPPTLQEMIQMAAEIADGMAYLNAKKFVHRDLAARNCMVAHDFTVKIGDFGMTRDIYETDYYRKGGKGLLPVRWMAPESLKDGVFTTSSDMWSFGVVLWEITSLAEQPYQGLSNEQVLKFVMDGGYLDQPDNCPERVTDLMRMCWQFNPNMRPTFLEIVNLLKDDLHPSFPEVSFFHSEENKAPESEELEMEFEDMENVPLDRSSHCQREEAGGRDGGSSLGFKRSYEEHIPYTHMNGGKKNGRILTLPRSNPSWARDPPVATMVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYK(SEQ ID NO:208)

INSR^676TAG-EGFP-MS2

DNA:(下划线示出MS2茎环和琥珀密码子)

ATGGGCACCGGGGGCCGGCGGGGGGCGGCGGCCGCGCCGCTGCTGGTGGCGGTGGCCGCGCTGCTACTGGGCGCCGCGGGCCACCTGTACCCCGGAGAGGTGTGTCCCGGCATGGATATCCGGAACAACCTCACTAGGTTGCATGAGCTGGAGAATTGCTCTGTCATCGAAGGACACTTGCAGATACTCTTGATGTTCAAAACGAGGCCCGAAGATTTCCGAGACCTCAGTTTCCCCAAACTCATCATGATCACTGATTACTTGCTGCTCTTCCGGGTCTATGGGCTCGAGAGCCTGAAGGACCTGTTCCCCAACCTCACGGTCATCCGGGGATCACGACTGTTCTTTAACTACGCGCTGGTCATCTTCGAGATGGTTCACCTCAAGGAACTCGGCCTCTACAACCTGATGAACATCACCCGGGGTTCTGTCCGCATCGAGAAGAACAATGAGCTCTGTTACTTGGCCACTATCGACTGGTCCCGTATCCTGGATTCCGTGGAGGATAATTACATCGTGTTGAACAAAGATGACAACGAGGAGTGTGGAGACATCTGTCCGGGTACCGCGAAGGGCAAGACCAACTGCCCCGCCACCGTCATCAACGGGCAGTTTGTCGAACGATGTTGGACTCATAGTCACTGCCAGAAAGTTTGCCCGACCATCTGTAAGTCACACGGCTGCACCGCCGAAGGCCTCTGTTGCCACAGCGAGTGCCTGGGCAACTGTTCTCAGCCCGACGACCCCACCAAGTGCGTGGCCTGCCGCAACTTCTACCTGGATGGCAGGTGTGTGGAGACCTGCCCGCCCCCGTACTACCACTTCCAGGACTGGCGCTGTGTGAACTTCAGCTTCTGCCAGGACCTGCACCACAAATGCAAGAACTCGCGGAGGCAGGGCTGCCACCAGTACGTCATTCACAACAACAAGTGCATCCCTGAGTGTCCCTCCGGGTACACGATGAATTCCAGCAACTTGCTGTGCACCCCATGCCTGGGTCCCTGTCCCAAGGTGTGCCACCTCCTAGAAGGCGAGAAGACCATCGACTCGGTGACGTCTGCCCAGGAGCTCCGAGGATGCACCGTCATCAACGGGAGTCTGATCATCAACATTCGAGGAGGCAACAATCTGGCAGCTGAGCTAGAAGCCAACCTCGGCCTCATTGAAGAAATTTCAGGGTATCTAAAAATCCGCCGATCCTACGCTCTGGTGTCACTTTCCTTCTTCCGGAAGTTACGTCTGATTCGAGGAGAGACCTTGGAAATTGGGAACTACTCCTTCTATGCCTTGGACAACCAGAACCTAAGGCAGCTCTGGGACTGGAGCAAACACAACCTCACCATCACTCAGGGGAAACTCTTCTTCCACTATAACCCCAAACTCTGCTTGTCAGAAATCCACAAGATGGAAGAAGTTTCAGGAACCAAGGGGCGCCAGGAGAGAAACGACATTGCCCTGAAGACCAATGGGGACCAGGCATCCTGTGAAAATGAGTTACTTAAATTTTCTTACATTCGGACATCTTTTGACAAGATCTTGCTGAGATGGGAGCCGTACTGGCCCCCCGACTTCCGAGACCTCTTGGGGTTCATGCTGTTCTACAAAGAGGCCCCTTATCAGAATGTGACGGAGTTCGACGGGCAGGATGCATGTGGTTCCAACAGTTGGACGGTGGTAGACATTGACCCACCCCTGAGGTCCAACGACCCCAAATCACAGAACCACCCAGGGTGGCTGATGCGGGGTCTCAAGCCCTGGACCCAGTATGCCATCTTTGTGAAGACCCTGGTCACCTTTTCGGATGAACGCCGGACCTATGGGGCCAAGAGTGACATCATTTATGTCCAGACAGATGCCACCAACCCCTCTGTGCCCCTGGATCCAATCTCAGTGTCTAACTCATCATCCCAGATTATTCTGAAGTGGAAACCACCCTCCGACCCCAATGGCAACATCACCCACTACCTGGTTTTCTGGGAGAGGCAGGCGGAAGACAGTGAGCTGTTCGAGCTGGATTATTGCCTCTAGGGGCTGAAGCTGCCCTCGAGGACCTGGTCTCCACCATTCGAGTCTGAAGATTCTCAGAAGCACAACCAGAGTGAGTATGAGGATTCGGCCGGCGAATGCTGCTCCTGTCCAAAGACAGACTCTCAGATCCTGAAGGAGCTGGAGGAGTCCTCGTTTAGGAAGACGTTTGAGGATTACCTGCACAACGTGGTTTTCGTCCCCAGAAAAACCTCTTCAGGCACTGGTGCCGAGGACCCTAGGCCATCTCGGAAACGCAGGTCCCTTGGCGATGTTGGGAATGTGACGGTGGCCGTGCCCACGGTGGCAGCTTTCCCCAACACTTCCTCGACCAGCGTGCCCACGAGTCCGGAGGAGCACAGGCCTTTTGAGAAGGTGGTGAACAAGGAGTCGCTGGTCATCTCCGGCTTGCGACACTTCACGGGCTATCGCATCGAGCTGCAGGCTTGCAACCAGGACACCCCTGAGGAACGGTGCAGTGTGGCAGCCTACGTCAGTGCGAGGACCATGCCTGAAGCCAAGGCTGATGACATTGTTGGCCCTGTGACGCATGAAATCTTTGAGAACAACGTCGTCCACTTGATGTGGCAGGAGCCGAAGGAGCCCAATGGTCTGATCGTGCTGTATGAAGTGAGTTATCGGCGATATGGTGATGAGGAGCTGCATCTCTGCGTCTCCCGCAAGCACTTCGCTCTGGAACGGGGCTGCAGGCTGCGTGGGCTGTCACCGGGGAACTACAGCGTGCGAATCCGGGCCACCTCCCTTGCGGGCAACGGCTCTTGGACGGAACCCACCTATTTCTACGTGACAGACTATTTAGACGTCCCGTCAAATATTGCAAAAATTATCATCGGCCCCCTCATCTTTGTCTTTCTCTTCAGTGTTGTGATTGGAAGTATTTATCTATTCCTGAGAAAGAGGCAGCCAGATGGGCCGCTGGGACCGCTTTACGCTTCTTCAAACCCTGAGTATCTCAGTGCCAGTGATGTGTTTCCATGCTCTGTGTACGTGCCGGACGAGTGGGAGGTGTCTCGAGAGAAGATCACCCTCCTTCGAGAGCTGGGGCAGGGCTCCTTCGGCATGGTGTATGAGGGCAATGCCAGGGACATCATCAAGGGTGAGGCAGAGACCCGCGTGGCGGTGAAGACGGTCAACGAGTCAGCCAGTCTCCGAGAGCGGATTGAGTTCCTCAATGAGGCCTCGGTCATGAAGGGCTTCACCTGCCATCACGTGGTGCGCCTCCTGGGAGTGGTGTCCAAGGGCCAGCCCACGCTGGTGGTGATGGAGCTGATGGCTCACGGAGACCTGAAGAGCTACCTCCGTTCTCTGCGGCCAGAGGCTGAGAATAATCCTGGCCGCCCTCCCCCTACCCTTCAAGAGATGATTCAGATGGCGGCAGAGATTGCTGACGGGATGGCCTACCTGAACGCCAAGAAGTTTGTGCATCGGGACCTGGCAGCGAGAAACTGCATGGTCGCCCATGATTTTACTGTCAAAATTGGAGACTTTGGAATGACCAGAGACATCTATGAAACGGATTACTACCGGAAAGGGGGCAAGGGTCTGCTCCCTGTACGGTGGATGGCACCGGAGTCCCTGAAGGATGGGGTCTTCACCACTTCTTCTGACATGTGGTCCTTTGGCGTGGTCCTTTGGGAAATCACCAGCTTGGCAGAACAGCCTTACCAAGGCCTGTCTAATGAACAGGTGTTGAAATTTGTCATGGATGGAGGGTATCTGGATCAACCCGACAACTGTCCAGAGAGAGTCACTGACCTCATGCGCATGTGCTGGCAATTCAACCCCAACATGAGGCCAACCTTCCTGGAGATTGTCAACCTGCTCAAGGACGACCTGCACCCCAGCTTTCCAGAGGTGTCGTTCTTCCACAGCGAGGAGAACAAGGCTCCCGAGAGTGAGGAGCTGGAGATGGAGTTTGAGGACATGGAGAATGTGCCCCTGGACCGTTCCTCGCACTGTCAGAGGGAGGAGGCGGGGGGCCGGGATGGAGGGTCCTCGCTGGGTTTCAAGCGGAGCTACGAGGAACACATCCCTTACACACACATGAACGGAGGCAAGAAAAACGGGCGGATTCTGACCTTGCCTCGGTCCAATCCTTCCTGGGCCCGGGATCCACCGGTCGCCACCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAAAGCGGCCGCGCGGCCGCGACTCTAGATCATAATCAGCAC ATGAGGATCACCCATGTCTGCAGGTCGACTCTAGAAAACATGAGGATCACCCATGT(SEQ ID NO:209)

蛋白:(X表示非典型氨基酸)

MGTGGRRGAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIRNNLTRLHELENCSVIEGHLQILLMFKTRPEDFRDLSFPKLIMITDYLLLFRVYGLESLKDLFPNLTVIRGSRLFFNYALVIFEMVHLKELGLYNLMNITRGSVRIEKNNELCYLATIDWSRILDSVEDNYIVLNKDDNEECGDICPGTAKGKTNCPATVINGQFVERCWTHSHCQKVCPTICKSHGCTAEGLCCHSECLGNCSQPDDPTKCVACRNFYLDGRCVETCPPPYYHFQDWRCVNFSFCQDLHHKCKNSRRQGCHQYVIHNNKCIPECPSGYTMNSSNLLCTPCLGPCPKVCHLLEGEKTIDSVTSAQELRGCTVINGSLIINIRGGNNLAAELEANLGLIEEISGYLKIRRSYALVSLSFFRKLRLIRGETLEIGNYSFYALDNQNLRQLWDWSKHNLTITQGKLFFHYNPKLCLSEIHKMEEVSGTKGRQERNDIALKTNGDQASCENELLKFSYIRTSFDKILLRWEPYWPPDFRDLLGFMLFYKEAPYQNVTEFDGQDACGSNSWTVVDIDPPLRSNDPKSQNHPGWLMRGLKPWTQYAIFVKTLVTFSDERRTYGAKSDIIYVQTDATNPSVPLDPISVSNSSSQIILKWKPPSDPNGNITHYLVFWERQAEDSELFELDYCLXGLKLPSRTWSPPFESEDSQKHNQSEYEDSAGECCSCPKTDSQILKELEESSFRKTFEDYLHNVVFVPRKTSSGTGAEDPRPSRKRRSLGDVGNVTVAVPTVAAFPNTSSTSVPTSPEEHRPFEKVVNKESLVISGLRHFTGYRIELQACNQDTPEERCSVAAYVSARTMPEAKADDIVGPVTHEIFENNVVHLMWQEPKEPNGLIVLYEVSYRRYGDEELHLCVSRKHFALERGCRLRGLSPGNYSVRIRATSLAGNGSWTEPTYFYVTDYLDVPSNIAKIIIGPLIFVFLFSVVIGSIYLFLRKRQPDGPLGPLYASSNPEYLSASDVFPCSVYVPDEWEVSREKITLLRELGQGSFGMVYEGNARDIIKGEAETRVAVKTVNESASLRERIEFLNEASVMKGFTCHHVVRLLGVVSKGQPTLVVMELMAHGDLKSYLRSLRPEAENNPGRPPPTLQEMIQMAAEIADGMAYLNAKKFVHRDLAARNCMVAHDFTVKIGDFGMTRDIYETDYYRKGGKGLLPVRWMAPESLKDGVFTTSSDMWSFGVVLWEITSLAEQPYQGLSNEQVLKFVMDGGYLDQPDNCPERVTDLMRMCWQFNPNMRPTFLEIVNLLKDDLHPSFPEVSFFHSEENKAPESEELEMEFEDMENVPLDRSSHCQREEAGGRDGGSSLGFKRSYEEHIPYTHMNGGKKNGRILTLPRSNPSWARDPPVATMVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYK(SEQ ID NO:210)

INSR^676TAG-mOrange-MS2

DNA:(下划线示出MS2茎环和琥珀密码子)

ATGGGCACCGGGGGCCGGCGGGGGGCGGCGGCCGCGCCGCTGCTGGTGGCGGTGGCCGCGCTGCTACTGGGCGCCGCGGGCCACCTGTACCCCGGAGAGGTGTGTCCCGGCATGGATATCCGGAACAACCTCACTAGGTTGCATGAGCTGGAGAATTGCTCTGTCATCGAAGGACACTTGCAGATACTCTTGATGTTCAAAACGAGGCCCGAAGATTTCCGAGACCTCAGTTTCCCCAAACTCATCATGATCACTGATTACTTGCTGCTCTTCCGGGTCTATGGGCTCGAGAGCCTGAAGGACCTGTTCCCCAACCTCACGGTCATCCGGGGATCACGACTGTTCTTTAACTACGCGCTGGTCATCTTCGAGATGGTTCACCTCAAGGAACTCGGCCTCTACAACCTGATGAACATCACCCGGGGTTCTGTCCGCATCGAGAAGAACAATGAGCTCTGTTACTTGGCCACTATCGACTGGTCCCGTATCCTGGATTCCGTGGAGGATAATTACATCGTGTTGAACAAAGATGACAACGAGGAGTGTGGAGACATCTGTCCGGGTACCGCGAAGGGCAAGACCAACTGCCCCGCCACCGTCATCAACGGGCAGTTTGTCGAACGATGTTGGACTCATAGTCACTGCCAGAAAGTTTGCCCGACCATCTGTAAGTCACACGGCTGCACCGCCGAAGGCCTCTGTTGCCACAGCGAGTGCCTGGGCAACTGTTCTCAGCCCGACGACCCCACCAAGTGCGTGGCCTGCCGCAACTTCTACCTGGATGGCAGGTGTGTGGAGACCTGCCCGCCCCCGTACTACCACTTCCAGGACTGGCGCTGTGTGAACTTCAGCTTCTGCCAGGACCTGCACCACAAATGCAAGAACTCGCGGAGGCAGGGCTGCCACCAGTACGTCATTCACAACAACAAGTGCATCCCTGAGTGTCCCTCCGGGTACACGATGAATTCCAGCAACTTGCTGTGCACCCCATGCCTGGGTCCCTGTCCCAAGGTGTGCCACCTCCTAGAAGGCGAGAAGACCATCGACTCGGTGACGTCTGCCCAGGAGCTCCGAGGATGCACCGTCATCAACGGGAGTCTGATCATCAACATTCGAGGAGGCAACAATCTGGCAGCTGAGCTAGAAGCCAACCTCGGCCTCATTGAAGAAATTTCAGGGTATCTAAAAATCCGCCGATCCTACGCTCTGGTGTCACTTTCCTTCTTCCGGAAGTTACGTCTGATTCGAGGAGAGACCTTGGAAATTGGGAACTACTCCTTCTATGCCTTGGACAACCAGAACCTAAGGCAGCTCTGGGACTGGAGCAAACACAACCTCACCATCACTCAGGGGAAACTCTTCTTCCACTATAACCCCAAACTCTGCTTGTCAGAAATCCACAAGATGGAAGAAGTTTCAGGAACCAAGGGGCGCCAGGAGAGAAACGACATTGCCCTGAAGACCAATGGGGACCAGGCATCCTGTGAAAATGAGTTACTTAAATTTTCTTACATTCGGACATCTTTTGACAAGATCTTGCTGAGATGGGAGCCGTACTGGCCCCCCGACTTCCGAGACCTCTTGGGGTTCATGCTGTTCTACAAAGAGGCCCCTTATCAGAATGTGACGGAGTTCGACGGGCAGGATGCATGTGGTTCCAACAGTTGGACGGTGGTAGACATTGACCCACCCCTGAGGTCCAACGACCCCAAATCACAGAACCACCCAGGGTGGCTGATGCGGGGTCTCAAGCCCTGGACCCAGTATGCCATCTTTGTGAAGACCCTGGTCACCTTTTCGGATGAACGCCGGACCTATGGGGCCAAGAGTGACATCATTTATGTCCAGACAGATGCCACCAACCCCTCTGTGCCCCTGGATCCAATCTCAGTGTCTAACTCATCATCCCAGATTATTCTGAAGTGGAAACCACCCTCCGACCCCAATGGCAACATCACCCACTACCTGGTTTTCTGGGAGAGGCAGGCGGAAGACAGTGAGCTGTTCGAGCTGGATTATTGCCTCTAGGGGCTGAAGCTGCCCTCGAGGACCTGGTCTCCACCATTCGAGTCTGAAGATTCTCAGAAGCACAACCAGAGTGAGTATGAGGATTCGGCCGGCGAATGCTGCTCCTGTCCAAAGACAGACTCTCAGATCCTGAAGGAGCTGGAGGAGTCCTCGTTTAGGAAGACGTTTGAGGATTACCTGCACAACGTGGTTTTCGTCCCCAGGCCATCTCGGAAACGCAGGTCCCTTGGCGATGTTGGGAATGTGACGGTGGCCGTGCCCACGGTGGCAGCTTTCCCCAACACTTCCTCGACCAGCGTGCCCACGAGTCCGGAGGAGCACAGGCCTTTTGAGAAGGTGGTGAACAAGGAGTCGCTGGTCATCTCCGGCTTGCGACACTTCACGGGCTATCGCATCGAGCTGCAGGCTTGCAACCAGGACACCCCTGAGGAACGGTGCAGTGTGGCAGCCTACGTCAGTGCGAGGACCATGCCTGAAGCCAAGGCTGATGACATTGTTGGCCCTGTGACGCATGAAATCTTTGAGAACAACGTCGTCCACTTGATGTGGCAGGAGCCGAAGGAGCCCAATGGTCTGATCGTGCTGTATGAAGTGAGTTATCGGCGATATGGTGATGAGGAGCTGCATCTCTGCGTCTCCCGCAAGCACTTCGCTCTGGAACGGGGCTGCAGGCTGCGTGGGCTGTCACCGGGGAACTACAGCGTGCGAATCCGGGCCACCTCCCTTGCGGGCAACGGCTCTTGGACGGAACCCACCTATTTCTACGTGACAGACTATTTAGACGTCCCGTCAAATATTGCAAAAATTATCATCGGCCCCCTCATCTTTGTCTTTCTCTTCAGTGTTGTGATTGGAAGTATTTATCTATTCCTGAGAAAGAGGCAGCCAGATGGGCCGCTGGGACCGCTTTACGCTTCTTCAAACCCTGAGTATCTCAGTGCCAGTGATGTGTTTCCATGCTCTGTGTACGTGCCGGACGAGTGGGAGGTGTCTCGAGAGAAGATCACCCTCCTTCGAGAGCTGGGGCAGGGCTCCTTCGGCATGGTGTATGAGGGCAATGCCAGGGACATCATCAAGGGTGAGGCAGAGACCCGCGTGGCGGTGAAGACGGTCAACGAGTCAGCCAGTCTCCGAGAGCGGATTGAGTTCCTCAATGAGGCCTCGGTCATGAAGGGCTTCACCTGCCATCACGTGGTGCGCCTCCTGGGAGTGGTGTCCAAGGGCCAGCCCACGCTGGTGGTGATGGAGCTGATGGCTCACGGAGACCTGAAGAGCTACCTCCGTTCTCTGCGGCCAGAGGCTGAGAATAATCCTGGCCGCCCTCCCCCTACCCTTCAAGAGATGATTCAGATGGCGGCAGAGATTGCTGACGGGATGGCCTACCTGAACGCCAAGAAGTTTGTGCATCGGGACCTGGCAGCGAGAAACTGCATGGTCGCCCATGATTTTACTGTCAAAATTGGAGACTTTGGAATGACCAGAGACATCTATGAAACGGATTACTACCGGAAAGGGGGCAAGGGTCTGCTCCCTGTACGGTGGATGGCACCGGAGTCCCTGAAGGATGGGGTCTTCACCACTTCTTCTGACATGTGGTCCTTTGGCGTGGTCCTTTGGGAAATCACCAGCTTGGCAGAACAGCCTTACCAAGGCCTGTCTAATGAACAGGTGTTGAAATTTGTCATGGATGGAGGGTATCTGGATCAACCCGACAACTGTCCAGAGAGAGTCACTGACCTCATGCGCATGTGCTGGCAATTCAACCCCAACATGAGGCCAACCTTCCTGGAGATTGTCAACCTGCTCAAGGACGACCTGCACCCCAGCTTTCCAGAGGTGTCGTTCTTCCACAGCGAGGAGAACAAGGCTCCCGAGAGTGAGGAGCTGGAGATGGAGTTTGAGGACATGGAGAATGTGCCCCTGGACCGTTCCTCGCACTGTCAGAGGGAGGAGGCGGGGGGCCGGGATGGAGGGTCCTCGCTGGGTTTCAAGCGGAGCTACGAGGAACACATCCCTTACACACACATGAACGGAGGCAAGAAAAACGGGCGGATTCTGACCTTGCCTCGGTCCAATCCTTCCTGGGCCCGGGATCCACCGGTCGCCACCGTGAGCAAGGGCGAGGAGAATAATATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCGCATGGAGGGCACCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCTTTCAGACCGCTAAGCTGAAGGTGACCAAGGGCGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCTCTTCACCTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTCAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTACGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCACTGCAGGACGGCGAGTTCATCTACAAGGTGAAGATGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTGATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAGGATGAGGCTGAAGCTGAAGGACGGCGGCCACTACACCTCCGAGGTCAAGACCACCTACAAGGCCAAGAAGTCCGTGCAGCTGCCCGGCGCCTACATCGTCGGCATCAAGCTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAAAGCGGCCGCGACTCTAGATCATAATCAGCACATGAGGATCACCCATGTCTGCAGGTCGACTCTAGAAAACATGAGGATCACCCATGT(SEQ ID NO:211)

蛋白:(X表示非典型氨基酸)

MGTGGRRGAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIRNNLTRLHELENCSVIEGHLQILLMFKTRPEDFRDLSFPKLIMITDYLLLFRVYGLESLKDLFPNLTVIRGSRLFFNYALVIFEMVHLKELGLYNLMNITRGSVRIEKNNELCYLATIDWSRILDSVEDNYIVLNKDDNEECGDICPGTAKGKTNCPATVINGQFVERCWTHSHCQKVCPTICKSHGCTAEGLCCHSECLGNCSQPDDPTKCVACRNFYLDGRCVETCPPPYYHFQDWRCVNFSFCQDLHHKCKNSRRQGCHQYVIHNNKCIPECPSGYTMNSSNLLCTPCLGPCPKVCHLLEGEKTIDSVTSAQELRGCTVINGSLIINIRGGNNLAAELEANLGLIEEISGYLKIRRSYALVSLSFFRKLRLIRGETLEIGNYSFYALDNQNLRQLWDWSKHNLTITQGKLFFHYNPKLCLSEIHKMEEVSGTKGRQERNDIALKTNGDQASCENELLKFSYIRTSFDKILLRWEPYWPPDFRDLLGFMLFYKEAPYQNVTEFDGQDACGSNSWTVVDIDPPLRSNDPKSQNHPGWLMRGLKPWTQYAIFVKTLVTFSDERRTYGAKSDIIYVQTDATNPSVPLDPISVSNSSSQIILKWKPPSDPNGNITHYLVFWERQAEDSELFELDYCLXGLKLPSRTWSPPFESEDSQKHNQSEYEDSAGECCSCPKTDSQILKELEESSFRKTFEDYLHNVVFVPRPSRKRRSLGDVGNVTVAVPTVAAFPNTSSTSVPTSPEEHRPFEKVVNKESLVISGLRHFTGYRIELQACNQDTPEERCSVAAYVSARTMPEAKADDIVGPVTHEIFENNVVHLMWQEPKEPNGLIVLYEVSYRRYGDEELHLCVSRKHFALERGCRLRGLSPGNYSVRIRATSLAGNGSWTEPTYFYVTDYLDVPSNIAKIIIGPLIFVFLFSVVIGSIYLFLRKRQPDGPLGPLYASSNPEYLSASDVFPCSVYVPDEWEVSREKITLLRELGQGSFGMVYEGNARDIIKGEAETRVAVKTVNESASLRERIEFLNEASVMKGFTCHHVVRLLGVVSKGQPTLVVMELMAHGDLKSYLRSLRPEAENNPGRPPPTLQEMIQMAAEIADGMAYLNAKKFVHRDLAARNCMVAHDFTVKIGDFGMTRDIYETDYYRKGGKGLLPVRWMAPESLKDGVFTTSSDMWSFGVVLWEITSLAEQPYQGLSNEQVLKFVMDGGYLDQPDNCPERVTDLMRMCWQFNPNMRPTFLEIVNLLKDDLHPSFPEVSFFHSEENKAPESEELEMEFEDMENVPLDRSSHCQREEAGGRDGGSSLGFKRSYEEHIPYTHMNGGKKNGRILTLPRSNPSWARDPPVATVSKGEENNMAIIKEFMRFKVRMEGTVNGHEFEIEGEGEGRPYEGFQTAKLKVTKGGPLPFAWDILSPLFTYGSKAYVKHPADIPDYFKLSFPEGFKWERVMNYEDGGVVTVTQDSSLQDGEFIYKVKMRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIRMRLKLKDGGHYTSEVKTTYKAKKSVQLPGAYIVGIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYK(SEQ ID NO:212)

INSR^676TAG-iRFP-MS2

DNA:(下划线示出MS2茎环和琥珀密码子)

ATGGGCACCGGGGGCCGGCGGGGGGCGGCGGCCGCGCCGCTGCTGGTGGCGGTGGCCGCGCTGCTACTGGGCGCCGCGGGCCACCTGTACCCCGGAGAGGTGTGTCCCGGCATGGATATCCGGAACAACCTCACTAGGTTGCATGAGCTGGAGAATTGCTCTGTCATCGAAGGACACTTGCAGATACTCTTGATGTTCAAAACGAGGCCCGAAGATTTCCGAGACCTCAGTTTCCCCAAACTCATCATGATCACTGATTACTTGCTGCTCTTCCGGGTCTATGGGCTCGAGAGCCTGAAGGACCTGTTCCCCAACCTCACGGTCATCCGGGGATCACGACTGTTCTTTAACTACGCGCTGGTCATCTTCGAGATGGTTCACCTCAAGGAACTCGGCCTCTACAACCTGATGAACATCACCCGGGGTTCTGTCCGCATCGAGAAGAACAATGAGCTCTGTTACTTGGCCACTATCGACTGGTCCCGTATCCTGGATTCCGTGGAGGATAATTACATCGTGTTGAACAAAGATGACAACGAGGAGTGTGGAGACATCTGTCCGGGTACCGCGAAGGGCAAGACCAACTGCCCCGCCACCGTCATCAACGGGCAGTTTGTCGAACGATGTTGGACTCATAGTCACTGCCAGAAAGTTTGCCCGACCATCTGTAAGTCACACGGCTGCACCGCCGAAGGCCTCTGTTGCCACAGCGAGTGCCTGGGCAACTGTTCTCAGCCCGACGACCCCACCAAGTGCGTGGCCTGCCGCAACTTCTACCTGGATGGCAGGTGTGTGGAGACCTGCCCGCCCCCGTACTACCACTTCCAGGACTGGCGCTGTGTGAACTTCAGCTTCTGCCAGGACCTGCACCACAAATGCAAGAACTCGCGGAGGCAGGGCTGCCACCAGTACGTCATTCACAACAACAAGTGCATCCCTGAGTGTCCCTCCGGGTACACGATGAATTCCAGCAACTTGCTGTGCACCCCATGCCTGGGTCCCTGTCCCAAGGTGTGCCACCTCCTAGAAGGCGAGAAGACCATCGACTCGGTGACGTCTGCCCAGGAGCTCCGAGGATGCACCGTCATCAACGGGAGTCTGATCATCAACATTCGAGGAGGCAACAATCTGGCAGCTGAGCTAGAAGCCAACCTCGGCCTCATTGAAGAAATTTCAGGGTATCTAAAAATCCGCCGATCCTACGCTCTGGTGTCACTTTCCTTCTTCCGGAAGTTACGTCTGATTCGAGGAGAGACCTTGGAAATTGGGAACTACTCCTTCTATGCCTTGGACAACCAGAACCTAAGGCAGCTCTGGGACTGGAGCAAACACAACCTCACCATCACTCAGGGGAAACTCTTCTTCCACTATAACCCCAAACTCTGCTTGTCAGAAATCCACAAGATGGAAGAAGTTTCAGGAACCAAGGGGCGCCAGGAGAGAAACGACATTGCCCTGAAGACCAATGGGGACCAGGCATCCTGTGAAAATGAGTTACTTAAATTTTCTTACATTCGGACATCTTTTGACAAGATCTTGCTGAGATGGGAGCCGTACTGGCCCCCCGACTTCCGAGACCTCTTGGGGTTCATGCTGTTCTACAAAGAGGCCCCTTATCAGAATGTGACGGAGTTCGACGGGCAGGATGCATGTGGTTCCAACAGTTGGACGGTGGTAGACATTGACCCACCCCTGAGGTCCAACGACCCCAAATCACAGAACCACCCAGGGTGGCTGATGCGGGGTCTCAAGCCCTGGACCCAGTATGCCATCTTTGTGAAGACCCTGGTCACCTTTTCGGATGAACGCCGGACCTATGGGGCCAAGAGTGACATCATTTATGTCCAGACAGATGCCACCAACCCCTCTGTGCCCCTGGATCCAATCTCAGTGTCTAACTCATCATCCCAGATTATTCTGAAGTGGAAACCACCCTCCGACCCCAATGGCAACATCACCCACTACCTGGTTTTCTGGGAGAGGCAGGCGGAAGACAGTGAGCTGTTCGAGCTGGATTATTGCCTCTAGGGGCTGAAGCTGCCCTCGAGGACCTGGTCTCCACCATTCGAGTCTGAAGATTCTCAGAAGCACAACCAGAGTGAGTATGAGGATTCGGCCGGCGAATGCTGCTCCTGTCCAAAGACAGACTCTCAGATCCTGAAGGAGCTGGAGGAGTCCTCGTTTAGGAAGACGTTTGAGGATTACCTGCACAACGTGGTTTTCGTCCCCAGGCCATCTCGGAAACGCAGGTCCCTTGGCGATGTTGGGAATGTGACGGTGGCCGTGCCCACGGTGGCAGCTTTCCCCAACACTTCCTCGACCAGCGTGCCCACGAGTCCGGAGGAGCACAGGCCTTTTGAGAAGGTGGTGAACAAGGAGTCGCTGGTCATCTCCGGCTTGCGACACTTCACGGGCTATCGCATCGAGCTGCAGGCTTGCAACCAGGACACCCCTGAGGAACGGTGCAGTGTGGCAGCCTACGTCAGTGCGAGGACCATGCCTGAAGCCAAGGCTGATGACATTGTTGGCCCTGTGACGCATGAAATCTTTGAGAACAACGTCGTCCACTTGATGTGGCAGGAGCCGAAGGAGCCCAATGGTCTGATCGTGCTGTATGAAGTGAGTTATCGGCGATATGGTGATGAGGAGCTGCATCTCTGCGTCTCCCGCAAGCACTTCGCTCTGGAACGGGGCTGCAGGCTGCGTGGGCTGTCACCGGGGAACTACAGCGTGCGAATCCGGGCCACCTCCCTTGCGGGCAACGGCTCTTGGACGGAACCCACCTATTTCTACGTGACAGACTATTTAGACGTCCCGTCAAATATTGCAAAAATTATCATCGGCCCCCTCATCTTTGTCTTTCTCTTCAGTGTTGTGATTGGAAGTATTTATCTATTCCTGAGAAAGAGGCAGCCAGATGGGCCGCTGGGACCGCTTTACGCTTCTTCAAACCCTGAGTATCTCAGTGCCAGTGATGTGTTTCCATGCTCTGTGTACGTGCCGGACGAGTGGGAGGTGTCTCGAGAGAAGATCACCCTCCTTCGAGAGCTGGGGCAGGGCTCCTTCGGCATGGTGTATGAGGGCAATGCCAGGGACATCATCAAGGGTGAGGCAGAGACCCGCGTGGCGGTGAAGACGGTCAACGAGTCAGCCAGTCTCCGAGAGCGGATTGAGTTCCTCAATGAGGCCTCGGTCATGAAGGGCTTCACCTGCCATCACGTGGTGCGCCTCCTGGGAGTGGTGTCCAAGGGCCAGCCCACGCTGGTGGTGATGGAGCTGATGGCTCACGGAGACCTGAAGAGCTACCTCCGTTCTCTGCGGCCAGAGGCTGAGAATAATCCTGGCCGCCCTCCCCCTACCCTTCAAGAGATGATTCAGATGGCGGCAGAGATTGCTGACGGGATGGCCTACCTGAACGCCAAGAAGTTTGTGCATCGGGACCTGGCAGCGAGAAACTGCATGGTCGCCCATGATTTTACTGTCAAAATTGGAGACTTTGGAATGACCAGAGACATCTATGAAACGGATTACTACCGGAAAGGGGGCAAGGGTCTGCTCCCTGTACGGTGGATGGCACCGGAGTCCCTGAAGGATGGGGTCTTCACCACTTCTTCTGACATGTGGTCCTTTGGCGTGGTCCTTTGGGAAATCACCAGCTTGGCAGAACAGCCTTACCAAGGCCTGTCTAATGAACAGGTGTTGAAATTTGTCATGGATGGAGGGTATCTGGATCAACCCGACAACTGTCCAGAGAGAGTCACTGACCTCATGCGCATGTGCTGGCAATTCAACCCCAACATGAGGCCAACCTTCCTGGAGATTGTCAACCTGCTCAAGGACGACCTGCACCCCAGCTTTCCAGAGGTGTCGTTCTTCCACAGCGAGGAGAACAAGGCTCCCGAGAGTGAGGAGCTGGAGATGGAGTTTGAGGACATGGAGAATGTGCCCCTGGACCGTTCCTCGCACTGTCAGAGGGAGGAGGCGGGGGGCCGGGATGGAGGGTCCTCGCTGGGTTTCAAGCGGAGCTACGAGGAACACATCCCTTACACACACATGAACGGAGGCAAGAAAAACGGGCGGATTCTGACCTTGCCTCGGTCCAATCCTTCCTGGGCCCGGGATCCACCGGTCGCCACCGCGGAAGGATCCGTCGCCAGGCAGCCTGACCTCTTGACCTGCGACGATGAGCCGATCCATATCCCCGGTGCCATCCAACCGCATGGACTGCTGCTCGCCCTCGCCGCCGACATGACGATCGTTGCCGGCAGCGACAACCTTCCCGAACTCACCGGACTGGCGATCGGCGCCCTGATCGGCCGCTCTGCGGCCGATGTCTTCGACTCGGAGACGCACAACCGTCTGACGATCGCCTTGGCCGAGCCCGGGGCGGCCGTCGGAGCACCGATCACTGTCGGCTTCACGATGCGAAAGGACGCAGGCTTCATCGGCTCCTGGCATCGCCATGATCAGCTCATCTTCCTCGAGCTCGAGCCTCCCCAGCGGGACGTCGCCGAGCCGCAGGCGTTCTTCCGCCGCACCAACAGCGCCATCCGCCGCCTGCAGGCCGCCGAAACCTTGGAAAGCGCCTGCGCCGCCGCGGCGCAAGAGGTGCGGAAGATTACCGGCTTCGATCGGGTGATGATCTATCGCTTCGCCTCCGACTTCAGCGGCGAAGTGATCGCAGAGGATCGGTGCGCCGAGGTCGAGTCAAAACTAGGCCTGCACTATCCTGCCTCAACCGTGCCGGCGCAGGCCCGTCGGCTCTATACCATCAACCCGGTACGGATCATTCCCGATATCAATTATCGGCCGGTGCCGGTCACCCCAGACCTCAATCCGGTCACCGGGCGGCCGATTGATCTTAGCTTCGCCATCCTGCGCAGCGTCTCGCCCGTCCATCTGGAATTCATGCGCAACATAGGCATGCACGGCACGATGTCGATCTCGATTTTGCGCGGCGAGCGACTGTGGGGATTGATCGTTTGCCATCACCGAACGCCGTACTACGTCGATCTCGATGGCCGCCAAGCCTGCGAGCTAGTCGCCCAGGTTCTGGCCTGGCAGATCGGCGTGATGGAAGAGTAAGCGGCCGCGACTCTAGATCATAATCAGCACATGAGGATCACCCATGTCTGCAGGTCGACTCTAGAAAACATGAGG ATCACCCATGT(SEQ ID NO:213)

蛋白:(X表示非典型氨基酸)

MGTGGRRGAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIRNNLTRLHELENCSVIEGHLQILLMFKTRPEDFRDLSFPKLIMITDYLLLFRVYGLESLKDLFPNLTVIRGSRLFFNYALVIFEMVHLKELGLYNLMNITRGSVRIEKNNELCYLATIDWSRILDSVEDNYIVLNKDDNEECGDICPGTAKGKTNCPATVINGQFVERCWTHSHCQKVCPTICKSHGCTAEGLCCHSECLGNCSQPDDPTKCVACRNFYLDGRCVETCPPPYYHFQDWRCVNFSFCQDLHHKCKNSRRQGCHQYVIHNNKCIPECPSGYTMNSSNLLCTPCLGPCPKVCHLLEGEKTIDSVTSAQELRGCTVINGSLIINIRGGNNLAAELEANLGLIEEISGYLKIRRSYALVSLSFFRKLRLIRGETLEIGNYSFYALDNQNLRQLWDWSKHNLTITQGKLFFHYNPKLCLSEIHKMEEVSGTKGRQERNDIALKTNGDQASCENELLKFSYIRTSFDKILLRWEPYWPPDFRDLLGFMLFYKEAPYQNVTEFDGQDACGSNSWTVVDIDPPLRSNDPKSQNHPGWLMRGLKPWTQYAIFVKTLVTFSDERRTYGAKSDIIYVQTDATNPSVPLDPISVSNSSSQIILKWKPPSDPNGNITHYLVFWERQAEDSELFELDYCLXGLKLPSRTWSPPFESEDSQKHNQSEYEDSAGECCSCPKTDSQILKELEESSFRKTFEDYLHNVVFVPRPSRKRRSLGDVGNVTVAVPTVAAFPNTSSTSVPTSPEEHRPFEKVVNKESLVISGLRHFTGYRIELQACNQDTPEERCSVAAYVSARTMPEAKADDIVGPVTHEIFENNVVHLMWQEPKEPNGLIVLYEVSYRRYGDEELHLCVSRKHFALERGCRLRGLSPGNYSVRIRATSLAGNGSWTEPTYFYVTDYLDVPSNIAKIIIGPLIFVFLFSVVIGSIYLFLRKRQPDGPLGPLYASSNPEYLSASDVFPCSVYVPDEWEVSREKITLLRELGQGSFGMVYEGNARDIIKGEAETRVAVKTVNESASLRERIEFLNEASVMKGFTCHHVVRLLGVVSKGQPTLVVMELMAHGDLKSYLRSLRPEAENNPGRPPPTLQEMIQMAAEIADGMAYLNAKKFVHRDLAARNCMVAHDFTVKIGDFGMTRDIYETDYYRKGGKGLLPVRWMAPESLKDGVFTTSSDMWSFGVVLWEITSLAEQPYQGLSNEQVLKFVMDGGYLDQPDNCPERVTDLMRMCWQFNPNMRPTFLEIVNLLKDDLHPSFPEVSFFHSEENKAPESEELEMEFEDMENVPLDRSSHCQREEAGGRDGGSSLGFKRSYEEHIPYTHMNGGKKNGRILTLPRSNPSWARDPPVATAEGSVARQPDLLTCDDEPIHIPGAIQPHGLLLALAADMTIVAGSDNLPELTGLAIGALIGRSAADVFDSETHNRLTIALAEPGAAVGAPITVGFTMRKDAGFIGSWHRHDQLIFLELEPPQRDVAEPQAFFRRTNSAIRRLQAAETLESACAAAAQEVRKITGFDRVMIYRFASDFSGEVIAEDRCAEVESKLGLHYPASTVPAQARRLYTINPVRIIPDINYRPVPVTPDLNPVTGRPIDLSFAILRSVSPVHLEFMRNIGMHGTMSISILRGERLWGLIVCHHRTPYYVDLDGRQACELVAQVLAWQIGVMEE(SEQ ID NO:214)

序列–集合2

1.其他组分：

mCherry^190TAG-2xPP7具有琥珀型位点和2个PP7环的mCherry(TAG密码子，PP7环)

DNA:

蛋白:

mCherry^190TAG-4xPP7具有琥珀型位点和4个PP7环的mCherry(TAG密码子，PP7环)

DNA:

蛋白:

mCherry^190TAG-6xPP7具有琥珀型位点和6个PP7环的mCherry(TAG密码子，PP7环)

DNA:

蛋白:

H2B-mCherry^190TAG-2xMS2人组蛋白H2B 1-J型(Uniprot:P06899)与具有琥珀型位点和2xms2环的mCherry融合(TAG密码子，ms2环)

蛋白:

IFRS1马氏甲烷八叠球菌PylRS(L305M、Y306L、L309S、N346S、C348M)

DNA:

GACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATATGCTGAACTATAGCCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGTCTTTTATGCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:223)

蛋白:

DKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNMLNYSRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLSFMQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:224)

CbzRS马氏甲烷八叠球菌PylRS(Y306M、L309G、C348T)

DNA:

GACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATCTGATGAACTATGGACGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTACACAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:225)

蛋白:

DKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLMNYGRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFTQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:226)

CpkRS马氏甲烷八叠球菌PylRS(A302S)

DNA:

GATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTTCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:227)

蛋白:

DKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLSPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:228)

tRNA^pyl,CGA吡咯赖氨酰tRNA(用于丝氨酸密码子，反密码子以粗体显示)(马氏甲烷八叠球菌)

tRNA^pyl,CGG吡咯赖氨酰tRNA(用于脯氨酸密码子，反密码子以粗体显示)(马氏甲烷八叠球菌)

tRNA^pyl,UAA吡咯赖氨酰tRNA(用于亮氨酸密码子，反密码子以粗体显示)(马氏甲烷八叠球菌)

tRNA^pyl,UAG吡咯赖氨酰tRNA(用于亮氨酸密码子，反密码子以粗体显示)(马氏甲烷八叠球菌)

tRNA^pyl,CCG吡咯赖氨酰tRNA(用于精氨酸密码子，反密码子以粗体显示)(马氏甲烷八叠球菌)

tRNA^pyl,AUA吡咯赖氨酰tRNA(用于异亮氨酸密码子，反密码子以紫色显示)(马氏甲烷八叠球菌)

OMeRS吡咯赖氨酰tRNA合成酶突变体：A302T、Y384F、N346V、C348W、V401L(马氏甲烷八叠球菌)

DNA:

ATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAACACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGTCTTTTGGCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCCTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ IDNO:235)

蛋白:

MACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLTPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLVFWQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSALVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO:236)

GFP^66TAG具有琥珀型位点的GFP

DNA:(MS2茎环，琥珀密码子)

蛋白:

表示非典型氨基酸

GFP^66TCG具有丝氨酸位点的GFP

DNA:(MS2茎环，丝氨酸密码子)

蛋白:

表示非典型氨基酸

GFP^66CCG具有脯氨酸位点的GFP

DNA:(MS2茎环，脯氨酸密码子)

蛋白:

表示非典型氨基酸

GFP^66CTA具有亮氨酸位点的GFP

DNA:(MS2茎环，亮氨酸密码子)

蛋白:

表示非典型氨基酸

GFP^66TTA具有亮氨酸位点的GFP

DNA:(MS2茎环，亮氨酸密码子)

蛋白:

表示非典型氨基酸

GFP^66ATA具有异亮氨酸位点的GFP

DNA:(MS2茎环，异亮氨酸密码子)

蛋白:

表示非典型氨基酸

GFP^66CGG具有精氨酸位点的GFP

DNA:(MS2茎环，精氨酸密码子)

蛋白:

表示非典型氨基酸

GFP^39TCG具有丝氨酸位点的GFP

DNA:(MS2茎环，丝氨酸密码子)

蛋白:

表示非典型氨基酸

GFP^39CCG具有脯氨酸位点的GFP

DNA:(MS2茎环，脯氨酸密码子

蛋白:

表示非典型氨基酸

GFP^39CTA具有亮氨酸位点的GFP

DNA:(MS2茎环，亮氨酸密码子)

蛋白:

表示非典型氨基酸

GFP^39CGG具有精氨酸位点的GFP

DNA:(MS2茎环，精氨酸密码子)

蛋白:

表示非典型氨基酸

mCherry^72TAG具有琥珀型位点的mCherry

DNA:(MS2茎环，琥珀密码子)

蛋白:

表示非典型氨基酸

mCherry^72TCG具有丝氨酸位点的mCherry

DNA:(MS2茎环，丝氨酸密码子)

蛋白:

表示非典型氨基酸

mCherry^72CCG具有脯氨酸位点的mCherry

DNA:(MS2茎环，脯氨酸密码子)

蛋白:

表示非典型氨基酸

mCherry^72CTA具有亮氨酸位点的mCherryDNA:(MS2茎环，亮氨酸密码子)

蛋白:

表示非典型氨基酸

mCherry^72TTA具有亮氨酸位点的mCherry

DNA:(MS2茎环，亮氨酸密码子)

蛋白:

表示非典型氨基酸

mCherry^72ATA具有异亮氨酸位点的mCherry

DNA:(MS2茎环，异亮氨酸密码子)

蛋白:

表示非典型氨基酸

mCherry^185TCG具有丝氨酸位点的mcherry

DNA:(丝氨酸密码子)

蛋白:

表示非典型氨基酸

mCherry^185CCG具有脯氨酸位点的mCherry

DNA:(脯氨酸密码子)

蛋白:

表示非典型氨基酸

mCherry^185CTA具有亮氨酸位点的mCherry

DNA:(亮氨酸密码子)

蛋白:

表示非典型氨基酸

GFP^39TCG具有丝氨酸位点的LCK-GFP

DNA:(MS2茎环，丝氨酸密码子以红色显示，

蛋白:

表示非典型氨基酸

GFP^39CCG具有脯氨酸位点的LCK-GFP

DNA:(MS2茎环，脯氨酸密码子，

)

蛋白:

表示非典型氨基酸

GFP^39CTA具有亮氨酸位点的LCK-GFP

DNA:(MS2茎环，亮氨酸密码子，

)

蛋白:

表示非典型氨基酸

扩展的GFP^39TCG与GFP^66CCG基因融合的在第39位具有丝氨酸位点的GFP

DNA:(MS2茎环，丝氨酸密码子，

)

蛋白:

表示非典型氨基酸

扩展的GFP^39CCG与GFP^66TCG基因融合的在第39位具有脯氨酸位点的GFP

DNA:(MS2茎环，脯氨酸密码子，

)

蛋白:

表示非典型氨基酸

扩展的GFP^39CTA与GFP^66TCG融合的在第39位具有亮氨酸位点的GFP

DNA:(MS2茎环，亮氨酸密码子，

)

蛋白:

表示非典型氨基酸

pp7细菌噬菌体PP7 RNA茎环:(形式1)

DNA:

GGAGCAGACGATATGGCGTCGCTCC(SEQ ID NO:289)

pp7细菌噬菌体PP7 RNA茎环的DNA序列:(形式2)

DNA:

CCAGCAGAGCATATGGGCTCGCTGG(SEQ ID NO:290)

EBAG9:在SiSo细胞上表达的受体结合癌抗原(智人，Uniprot:O00559)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTA

ATATGCAGATCTGGCAGAGGACGGAAATTAAGTGGAGACCAAATAACTTTGCCAACTACAGTTGATTATTCATCA

GTTCCTAAGCAGACAGATGTTGAAGAGTGGACTTCCTGGGATGAAGATGCACCCACCAGTGTAAAGATCGAAGGA

GGGAATGGGAATGTGGCAACACAACAAAATTCTTTGGAACAACTGGAACCTGACTATTTTAAGGACATGACACCA

ACTATTAGGAAAACTCAGAAAATTGTTATTAAGAAGAGAGAACCATTGAATTTTGGCATCCCAGATGGGAGCACA

GGTTTCTCTAGTAGATTAGCAGCTACACAAGATCTGCCTTTTATTCATCAGTCTTCTGAATTAGGTGACTTAGAT

ACCTGGCAGGAAAATACCAATGCATGGGAAGAAGAAGAAGATGCAGCCTGGCAAGCAGAAGAAGTTCTGAGACAG

CAGAAACTAGCAGACAGAGAAAAGAGAGCAGCCGAACAACAAAGGAAGAAAATGGAAAAGGAAGCACAACGGCTAATGAAGAAGGAACAAAACAAAATTGGTGTGAAACTTTCA(SEQ ID NO:291)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGRGRKLSGDQITLPTTVDYSSVPKQTDVEEWTSWDEDAPTSVKIEG

GNGNVATQQNSLEQLEPDYFKDMTPTIRKTQKIVIKKREPLNFGIPDGSTGFSSRLAATQDLPFIHQSSELGDLDTWQENTNAWEEEEDAAWQAEEVLRQQKLADREKRAAEQQRKKMEKEAQRLMKKEQNKIGVKLS(SEQ IDNO:292)

EBAG9_1-29:在SiSo细胞上表达的受体结合癌抗原(智人，Uniprot:O00559)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCT(SEQ ID NO:293)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRS(SEQ ID NO:294)

CMP-SaTr/SLC35A1:CMP唾液酸转运蛋白(智人，Uniprot:P78382)

DNA:

ATGGCTGCCCCGAGAGACAATGTCACTTTATTATTCAAGTTATACTGCTTGGCAGTGATGACCCTGATGGCTGCAGTCTATACCATAGCTTTAAGATACACAAGGACATCAGACAAAGAACTCTACTTTTCAACGACAGCCGTGTGTATCACAGAAGTTATAAAGTTATTGCTAAGTGTGGGAATTTTAGCTAAAGAAACTGGTAGTCTGGGTAGATTCAAAGCATCTTTAAGAGAAAATGTCTTGGGGAGCCCCAAGGAACTGTTGAAGTTAAGTGTGCCATCGTTAGTGTATGCTGTTCAGAACAACATGGCTTTCCTAGCTCTTAGCAATCTGGATGCAGCAGTGTACCAGGTGACCTACCAGTTGAAGATTCCGTGTACTGCTTTATGCACTGTTTTAATGTTAAATCGGACACTCAGCAAATTACAGTGGGTTTCAGTTTTTATGCTGTGTGCTGGAGTTACGCTTGTACAGTGGAAACCAGCCCAAGCTACAAAAGTGGTGGTGGAACAAAATCCATTATTAGGGTTTGGCGCTATAGCTATTGCTGTATTGTGCTCAGGATTTGCAGGAGTATATTTTGAAAAAGTTTTAAAGAGTTCAGATACTTCTCTTTGGGTGAGAAACATTCAAATGTATCTATCAGGGATTATTGTGACATTAGCTGGCGTCTACTTGTCAGATGGAGCTGAAATTAAAGAAAAAGGATTTTTCTATGGTTACACATATTATGTCTGGTTTGTCATCTTTCTTGCAAGTGTTGGTGGCCTCTACACTTCTGTTGTGGTTAAGTACACAGACAACATCATGAAAGGCTTTTCTGCAGCAGCGGCCATTGTCCTTTCCACCATTGCTTCAGTAATGCTGTTTGGATTACAGATAACACTCACCTTTGCCCTGGGTACTCTTCTTGTATGTGTTTCCATATATCTCTATGGATTACCCAGACAAGACACTACATCCATCCAACAAGGAGAAACAGCTTCAAAGGAGAGAGTTATTGGTGTG(SEQ ID NO:295)

蛋白:

MAAPRDNVTLLFKLYCLAVMTLMAAVYTIALRYTRTSDKELYFSTTAVCITEVIKLLLSVGILAKETGSLGRFKASLRENVLGSPKELLKLSVPSLVYAVQNNMAFLALSNLDAAVYQVTYQLKIPCTALCTVLMLNRTLSKLQWVSVFMLCAGVTLVQWKPAQATKVVVEQNPLLGFGAIAIAVLCSGFAGVYFEKVLKSSDTSLWVRNIQMYLSGIIVTLAGVYLSDGAEIKEKGFFYGYTYYVWFVIFLASVGGLYTSVVVKYTDNIMKGFSAAAAIVLSTIASVMLFGLQITLTFALGTLLVCVSIYLYGLPRQDTTSIQQGETASKERVIGV(SEQ ID NO:296)

P450 2C1_1-27:细胞色素P450 2C1(穴兔(Oryctolagus cuniculus)，Uniprot:P00180)DNA:

ATGGACCCCGTGGTCGTGCTGGGCCTGTGCCTGTCATGCCTGCTGCTGCTGAGCCTGTGGAAGCAGAGCTACGGCGGAGGC(SEQ ID NO:297)

蛋白:

MDPVVVLGLCLSCLLLLSLWKQSYGGG(SEQ ID NO:298)

P450 2C1_1-29:细胞色素P450 2C1(穴兔，Uniprot:P00180)

DNA:

ATGGACCCCGTGGTCGTGCTGGGCCTGTGCCTGTCATGCCTGCTGCTGCTGAGCCTGTGGAAGCAGAGCTACGGCGGAGGCAAGCTG(SEQ ID NO:299)

蛋白:

MDPVVVLGLCLSCLLLLSLWKQSYGGGKL(SEQ ID NO:300)

EB1:微管相关蛋白RP/EB家族成员1(智人，Uniprot:Q8WQ86)

DNA:

ATGGCAGTGAACGTATACTCAACGTCAGTGACCAGTGATAACCTAAGTCGACATGACATGCTGGCCTGGATCAATGAGTCTCTGCAGTTGAATCTGACAAAGATCGAACAGTTGTGCTCAGGGGCTGCGTATTGTCAGTTTATGGACATGCTGTTCCCTGGCTCCATTGCCTTGAAGAAAGTGAAATTCCAAGCTAAGCTAGAACACGAGTACATCCAGAACTTCAAAATACTACAAGCAGGTTTTAAGAGAATGGGTGTTGACAAAATAATTCCTGTGGACAAATTAGTAAAAGGAAAGTTTCAGGACAATTTTGAATTCGTTCAGTGGTTCAAGAAGTTTTTCGATGCAAACTATGATGGAAAAGACTATGACCCTGTGGCTGCCAGACAAGGTCAAGAAACTGCAGTGGCTCCTTCCCTTGTTGCTCCAGCTCTGAATAAACCGAAGAAACCTCTCACTTCTAGCAGTGCAGCTCCCCAGAGGCCCATCTCAACACAGAGAACCGCTGCGGCTCCTAAGGCTGGCCCTGGTGTGGTGCGAAAGAACCCTGGTGTGGGCAACGGAGATGACGAGGCAGCTGAGTTGATGCAGCAGGTCAACGTATTGAAACTTACTGTTGAAGACTTGGAGAAAGAGAGGGATTTCTACTTCGGAAAGCTACGGAACATTGAATTGATTTGCCAGGAGAACGAGGGGGAAAACGACCCTGTATTGCAGAGGATTGTAGACATTCTGTATGCCACAGATGAAGGCTTTGTGATACCTGATGAAGGGGGCCCACAGGAGGAGCAAGAAGAGTAT(SEQ ID NO:301)

蛋白:

MAVNVYSTSVTSDNLSRHDMLAWINESLQLNLTKIEQLCSGAAYCQFMDMLFPGSIALKKVKFQAKLEHEYIQNFKILQAGFKRMGVDKIIPVDKLVKGKFQDNFEFVQWFKKFFDANYDGKDYDPVAARQGQETAVAPSLVAPALNKPKKPLTSSSAAPQRPISTQRTAAAPKAGPGVVRKNPGVGNGDDEAAELMQQVNVLKLTVEDLEKERDFYFGKLRNIELICQENEGENDPVLQRIVDILYATDEGFVIPDEGGPQEEQEEY(SEQ ID NO:302)

CG1:核孔蛋白NUP42(智人，Uniprot:O15504)

DNA:

ATGGCCATTTGTCAATTCTTCCTTCAAGGCCGGTGCCGCTTTGGAGATCGGTGCTGGAACGAACATCCCGGTGCTAGGGGTGCAGGAGGAGGACGGCAGCAACCGCAGCAGCAGCCTTCAGGTAATAATAGACGTGGATGGAATACAACTAGCCAGAGATATTCCAATGTCATCCAGCCATCCAGTTTCTCCAAATCCACACCATGGGGGGGCAGCAGAGATCAAGAAAAGCCATATTTCAGTTCTTTTGATTCTGGAGCTTCAACTAACAGGAAGGAAGGCTTTGGATTGTCTGAGAACCCATTTGCTTCACTTAGTCCTGATGAGCAGAAAGATGAAAAGAAACTTCTGGAAGGAATTGTAAAAGATATGGAGGTTTGGGAATCATCAGGGCAGTGGATGTTTTCTGTTTATTCACCAGTGAAAAAGAAACCTAATATTTCAGGTTTTACAGACATTTCACCAGAGGAATTGAGGCTTGAATACCATAACTTCTTAACCAGCAATAACTTACAGAGTTATCTAAATTCTGTCCAACGTTTAATAAATCAATGGAGGAACAGGGTAAATGAACTGAAAAGTCTAAATATATCAACTAAAGTAGCTTTGCTCTCTGATGTAAAGGATGGAGTAAATCAAGCAGCACCTGCATTTGGATTTGGCAGCAGTCAAGCAGCAACATTTATGTCGCCAGGCTTTCCAGTCAATAACAGCAGCAGTGATAATGCTCAGAACTTTAGTTTTAAAACAAACTCTGGATTTGCTGCTGCCTCTTCTGGAAGCCCTGCTGGTTTTGGGAGTTCCCCAGCATTTGGAGCTGCAGCCTCTACCAGTTCAGGTATCTCTACTTCTGCTCCAGCTTTTGGATTTGGGAAGCCTGAAGTCACATCGGCTGCATCATTTTCATTCAAAAGCCCTGCAGCTTCCAGTTTTGGATCACCTGGATTTTCAGGACTTCCAGCTTCCTTGGCAACAGGTCCTGTCAGAGCTCCAGTGGCCCCAGCCTTTGGAGGTGGCAGTTCTGTGGCTGGTTTTGGTAGTCCGGGCTCACATTCTCACACTGCTTTTTCTAAGCCATCCAGTGACACTTTTGGAAATAGCAGCATATCCACTTCTCTGTCAGCCTCAAGCAGCATCATTGCAACAGATAATGTGTTATTCACACCCAGAGATAAACTAACAGTAGAAGAACTGGAACAATTTCAATCCAAGAAATTTACTCTGGGAAAAATTCCATTAAAGCCTCCACCTCTGGAACTTCTAAATGTT(SEQ ID NO:303)

蛋白:

MAICQFFLQGRCRFGDRCWNEHPGARGAGGGRQQPQQQPSGNNRRGWNTTSQRYSNVIQPSSFSKSTPWGGSRDQEKPYFSSFDSGASTNRKEGFGLSENPFASLSPDEQKDEKKLLEGIVKDMEVWESSGQWMFSVYSPVKKKPNISGFTDISPEELRLEYHNFLTSNNLQSYLNSVQRLINQWRNRVNELKSLNISTKVALLSDVKDGVNQAAPAFGFGSSQAATFMSPGFPVNNSSSDNAQNFSFKTNSGFAAASSGSPAGFGSSPAFGAAASTSSGISTSAPAFGFGKPEVTSAASFSFKSPAASSFGSPGFSGLPASLATGPVRAPVAPAFGGGSSVAGFGSPGSHSHTAFSKPSSDTFGNSSISTSLSASSSIIATDNVLFTPRDKLTVEELEQFQSKKFTLGKIPLKPPPLELLNV(SEQ ID NO:304)

PCP:细胞色素P450 2C1(穴兔，Uniprot:P00180)

DNA:

TCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGT(SEQ IDNO:305)

蛋白:

SKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGR(SEQ ID NO:306)

LAF-1:ATP依赖性RNA解旋酶laf-1(RGG结构域，1-168)(秀丽隐杆线虫，Uniprot:D0PV95)DNA:

ATGGAAAGCAACCAGAGCAACAACGGCGGCTCTGGCAACGCCGCTCTGAACAGAGGCGGCAGATACGTGCCCCCCCACCTGAGAGGAGGCGACGGCGGCGCCGCCGCCGCTGCATCTGCCGGCGGAGATGACAGAAGAGGCGGAGCCGGAGGCGGCGGCTATAGACGGGGAGGCGGAAACAGCGGCGGCGGAGGCGGAGGCGGCTACGACAGAGGCTACAACGACAACCGGGACGACCGGGACAACAGAGGCGGCAGCGGCGGATACGGCAGAGATCGAAACTACGAGGACAGAGGCTACAATGGCGGAGGCGGAGGCGGCGGCAACCGGGGCTACAACAACAACAGAGGAGGCGGCGGCGGCGGCTACAACCGCCAGGACAGAGGCGATGGCGGATCTAGCAATTTCAGCAGAGGCGGCTACAACAACCGGGACGAGGGCAGCGACAACAGAGGCAGCGGAAGAAGCTACAACAATGACCGGAGAGATAATGGCGGAGATGGC(SEQ ID NO:307)

蛋白:

MESNQSNNGGSGNAALNRGGRYVPPHLRGGDGGAAAAASAGGDDRRGGAGGGGYRRGGGNSGGGGGGGYDRGYNDNRDDRDNRGGSGGYGRDRNYEDRGYNGGGGGGGNRGYNNNRGGGGGGYNRQDRGDGGSSNFSRGGYNNRDEGSDNRGSGRSYNNDRRDNGGDG(SEQ ID NO:308)

SLP3:红细胞膜整合蛋白样蛋白3，aa 1-59(智人，Uniprot:Q8TAV4)

DNA:

ATGGATTCTAGGGTGTCTTCACCTGAGAAGCAAGATAAAGAGAATTTCGTGGGTGTCAACAATAAACGGCTTGGTGTATGTGGCTGGATCCTGTTTTCCCTCTCTTTCCTGTTGGTGATCATTACCTTCCCCATCTCCATATGGATGTGCTTGAAGATCATTAAGGAGTATGAACGT(SEQ ID NO:309)

蛋白:

MDSRVSSPEKQDKENFVGVNNKRLGVCGWILFSLSFLLVIITFPISIWMCLKIIKEYER(SEQ IDNO:310)SYNZIP1:合成卷曲螺旋肽1(合成的)

DNA:

AATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAA(SEQID NO:311)

蛋白:

NLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEE(SEQ ID NO:312)

SYNZIP2:合成卷曲螺旋肽1(合成的)

DNA:

GCTAGAAACGCCTACCTGAGAAAGAAAATCGCCAGACTGAAGAAGGACAACCTGCAGCTGGAAAGAGACGAGCAGAACCTGGAAAAGATCATCGCCAACCTCAGAGATGAGATCGCCAGACTGGAAAACGAGGTGGCCAGCCACGAGCAG(SEQ ID NO:313)

蛋白:

ARNAYLRKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLENEVASHEQ(SEQ ID NO:314)

SYNZIP3:合成卷曲螺旋肽1(合成的)

DNA:

AATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAG(SEQ ID NO:315)

蛋白:

NEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKK(SEQ ID NO:316)

SYNZIP4:合成卷曲螺旋肽1(合成的)

DNA:

CAAAAGGTGGCTGAACTGAAAAATAGAGTGGCCGTGAAGCTGAACCGGAACGAGCAGCTGAAGAACAAGGTGGAAGAGCTGAAGAACAGAAACGCCTACCTGAAGAATGAGCTGGCCACCCTGGAAAACGAGGTGGCCAGACTGGAAAACGACGTGGCCGAG(SEQ ID NO:317)

蛋白:

QKVAELKNRVAVKLNRNEQLKNKVEELKNRNAYLKNELATLENEVARLENDVAE(SEQ ID NO:318)

2.其他融合蛋白：

EBAG9_1-29::FUS::PylRS(AF)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:319)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:320)

EBAG9::PylRS(AF)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGCAGAGGACGGAAATTAAGTGGAGACCAAATAACTTTGCCAACTACAGTTGATTATTCATCAGTTCCTAAGCAGACAGATGTTGAAGAGTGGACTTCCTGGGATGAAGATGCACCCACCAGTGTAAAGATCGAAGGAGGGAATGGGAATGTGGCAACACAACAAAATTCTTTGGAACAACTGGAACCTGACTATTTTAAGGACATGACACCAACTATTAGGAAAACTCAGAAAATTGTTATTAAGAAGAGAGAACCATTGAATTTTGGCATCCCAGATGGGAGCACAGGTTTCTCTAGTAGATTAGCAGCTACACAAGATCTGCCTTTTATTCATCAGTCTTCTGAATTAGGTGACTTAGATACCTGGCAGGAAAATACCAATGCATGGGAAGAAGAAGAAGATGCAGCCTGGCAAGCAGAAGAAGTTCTGAGACAGCAGAAACTAGCAGACAGAGAAAAGAGAGCAGCCGAACAACAAAGGAAGAAAATGGAAAAGGAAGCACAACGGCTAATGAAGAAGGAACAAAACAAAATTGGTGTGAAACTTTCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:321)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGRGRKLSGDQITLPTTVDYSSVPKQTDVEEWTSWDEDAPTSVKIEGGNGNVATQQNSLEQLEPDYFKDMTPTIRKTQKIVIKKREPLNFGIPDGSTGFSSRLAATQDLPFIHQSSELGDLDTWQENTNAWEEEEDAAWQAEEVLRQQKLADREKRAAEQQRKKMEKEAQRLMKKEQNKIGVKLSGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:322)

EBAG9::FUS::PylRS(AF)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGCAGAGGACGGAAATTAAGTGGAGACCAAATAACTTTGCCAACTACAGTTGATTATTCATCAGTTCCTAAGCAGACAGATGTTGAAGAGTGGACTTCCTGGGATGAAGATGCACCCACCAGTGTAAAGATCGAAGGAGGGAATGGGAATGTGGCAACACAACAAAATTCTTTGGAACAACTGGAACCTGACTATTTTAAGGACATGACACCAACTATTAGGAAAACTCAGAAAATTGTTATTAAGAAGAGAGAACCATTGAATTTTGGCATCCCAGATGGGAGCACAGGTTTCTCTAGTAGATTAGCAGCTACACAAGATCTGCCTTTTATTCATCAGTCTTCTGAATTAGGTGACTTAGATACCTGGCAGGAAAATACCAATGCATGGGAAGAAGAAGAAGATGCAGCCTGGCAAGCAGAAGAAGTTCTGAGACAGCAGAAACTAGCAGACAGAGAAAAGAGAGCAGCCGAACAACAAAGGAAGAAAATGGAAAAGGAAGCACAACGGCTAATGAAGAAGGAACAAAACAAAATTGGTGTGAAACTTTCAGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:323)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGRGRKLSGDQITLPTTVDYSSVPKQTDVEEWTSWDEDAPTSVKIEGGNGNVATQQNSLEQLEPDYFKDMTPTIRKTQKIVIKKREPLNFGIPDGSTGFSSRLAATQDLPFIHQSSELGDLDTWQENTNAWEEEEDAAWQAEEVLRQQKLADREKRAAEQQRKKMEKEAQRLMKKEQNKIGVKLSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ IDNO:324)

EBAG9::MCP

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGCAGAGGACGGAAATTAAGTGGAGACCAAATAACTTTGCCAACTACAGTTGATTATTCATCAGTTCCTAAGCAGACAGATGTTGAAGAGTGGACTTCCTGGGATGAAGATGCACCCACCAGTGTAAAGATCGAAGGAGGGAATGGGAATGTGGCAACACAACAAAATTCTTTGGAACAACTGGAACCTGACTATTTTAAGGACATGACACCAACTATTAGGAAAACTCAGAAAATTGTTATTAAGAAGAGAGAACCATTGAATTTTGGCATCCCAGATGGGAGCACAGGTTTCTCTAGTAGATTAGCAGCTACACAAGATCTGCCTTTTATTCATCAGTCTTCTGAATTAGGTGACTTAGATACCTGGCAGGAAAATACCAATGCATGGGAAGAAGAAGAAGATGCAGCCTGGCAAGCAGAAGAAGTTCTGAGACAGCAGAAACTAGCAGACAGAGAAAAGAGAGCAGCCGAACAACAAAGGAAGAAAATGGAAAAGGAAGCACAACGGCTAATGAAGAAGGAACAAAACAAAATTGGTGTGAAACTTTCAGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:325)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGRGRKLSGDQITLPTTVDYSSVPKQTDVEEWTSWDEDAPTSVKIEGGNGNVATQQNSLEQLEPDYFKDMTPTIRKTQKIVIKKREPLNFGIPDGSTGFSSRLAATQDLPFIHQSSELGDLDTWQENTNAWEEEEDAAWQAEEVLRQQKLADREKRAAEQQRKKMEKEAQRLMKKEQNKIGVKLSAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:326)

EBAG9::EWSR1::MCP

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGCAGAGGACGGAAATTAAGTGGAGACCAAATAACTTTGCCAACTACAGTTGATTATTCATCAGTTCCTAAGCAGACAGATGTTGAAGAGTGGACTTCCTGGGATGAAGATGCACCCACCAGTGTAAAGATCGAAGGAGGGAATGGGAATGTGGCAACACAACAAAATTCTTTGGAACAACTGGAACCTGACTATTTTAAGGACATGACACCAACTATTAGGAAAACTCAGAAAATTGTTATTAAGAAGAGAGAACCATTGAATTTTGGCATCCCAGATGGGAGCACAGGTTTCTCTAGTAGATTAGCAGCTACACAAGATCTGCCTTTTATTCATCAGTCTTCTGAATTAGGTGACTTAGATACCTGGCAGGAAAATACCAATGCATGGGAAGAAGAAGAAGATGCAGCCTGGCAAGCAGAAGAAGTTCTGAGACAGCAGAAACTAGCAGACAGAGAAAAGAGAGCAGCCGAACAACAAAGGAAGAAAATGGAAAAGGAAGCACAACGGCTAATGAAGAAGGAACAAAACAAAATTGGTGTGAAACTTTCAATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ IDNO:327)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGRGRKLSGDQITLPTTVDYSSVPKQTDVEEWTSWDEDAPTSVKIEGGNGNVATQQNSLEQLEPDYFKDMTPTIRKTQKIVIKKREPLNFGIPDGSTGFSSRLAATQDLPFIHQSSELGDLDTWQENTNAWEEEEDAAWQAEEVLRQQKLADREKRAAEQQRKKMEKEAQRLMKKEQNKIGVKLSMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:328)

EBAG9_1-29::PylRS(AF)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:329)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:330)

EBAG9_1-29::FUS::PylRS(AF)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:331)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPY

GQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:332)

EBAG9_1-29::MCP

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:333)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:334)

EBAG9_1-29::EWSR1::MCP

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:335)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:336)

EBAG9::EWSR1::4xλ_N22

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGCAGAGGACGGAAATTAAGTGGAGACCAAATAACTTTGCCAACTACAGTTGATTATTCATCAGTTCCTAAGCAGACAGATGTTGAAGAGTGGACTTCCTGGGATGAAGATGCACCCACCAGTGTAAAGATCGAAGGAGGGAATGGGAATGTGGCAACACAACAAAATTCTTTGGAACAACTGGAACCTGACTATTTTAAGGACATGACACCAACTATTAGGAAAACTCAGAAAATTGTTATTAAGAAGAGAGAACCATTGAATTTTGGCATCCCAGATGGGAGCACAGGTTTCTCTAGTAGATTAGCAGCTACACAAGATCTGCCTTTTATTCATCAGTCTTCTGAATTAGGTGACTTAGATACCTGGCAGGAAAATACCAATGCATGGGAAGAAGAAGAAGATGCAGCCTGGCAAGCAGAAGAAGTTCTGAGACAGCAGAAACTAGCAGACAGAGAAAAGAGAGCAGCCGAACAACAAAGGAAGAAAATGGAAAAGGAAGCACAACGGCTAATGAAGAAGGAACAAAACAAAATTGGTGTGAAACTTTCAATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCAGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTTAA(SEQ ID NO:337)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGRGRKLSGDQITLPTTVDYSSVPKQTDVEEWTSWDEDAPTSVKIEGGNGNVATQQNSLEQLEPDYFKDMTPTIRKTQKIVIKKREPLNFGIPDGSTGFSSRLAATQDLPFIHQSSELGDLDTWQENTNAWEEEEDAAWQAEEVLRQQKLADREKRAAEQQRKKMEKEAQRLMKKEQNKIGVKLSMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAGAPGSAGSAAGSGEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPV＊(SEQ ID NO:338)

EBAG9_1-29::EWSR1::4xλ_N22

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCAGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTTAA(SEQ ID NO:339)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAGAPGSAGSAAGSGEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPV＊(SEQ ID NO:340)

EBAG9::PylRS(AA)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGCAGAGGACGGAAATTAAGTGGAGACCAAATAACTTTGCCAACTACAGTTGATTATTCATCAGTTCCTAAGCAGACAGATGTTGAAGAGTGGACTTCCTGGGATGAAGATGCACCCACCAGTGTAAAGATCGAAGGAGGGAATGGGAATGTGGCAACACAACAAAATTCTTTGGAACAACTGGAACCTGACTATTTTAAGGACATGACACCAACTATTAGGAAAACTCAGAAAATTGTTATTAAGAAGAGAGAACCATTGAATTTTGGCATCCCAGATGGGAGCACAGGTTTCTCTAGTAGATTAGCAGCTACACAAGATCTGCCTTTTATTCATCAGTCTTCTGAATTAGGTGACTTAGATACCTGGCAGGAAAATACCAATGCATGGGAAGAAGAAGAAGATGCAGCCTGGCAAGCAGAAGAAGTTCTGAGACAGCAGAAACTAGCAGACAGAGAAAAGAGAGCAGCCGAACAACAAAGGAAGAAAATGGAAAAGGAAGCACAACGGCTAATGAAGAAGGAACAAAACAAAATTGGTGTGAAACTTTCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:341)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGRGRKLSGDQITLPTTVDYSSVPKQTDVEEWTSWDEDAPTSVKIEGGNGNVATQQNSLEQLEPDYFKDMTPTIRKTQKIVIKKREPLNFGIPDGSTGFSSRLAATQDLPFIHQSSELGDLDTWQENTNAWEEEEDAAWQAEEVLRQQKLADREKRAAEQQRKKMEKEAQRLMKKEQNKIGVKLSGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:342)

EBAG9::PylRS(AAAF)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGCAGAGGACGGAAATTAAGTGGAGACCAAATAACTTTGCCAACTACAGTTGATTATTCATCAGTTCCTAAGCAGACAGATGTTGAAGAGTGGACTTCCTGGGATGAAGATGCACCCACCAGTGTAAAGATCGAAGGAGGGAATGGGAATGTGGCAACACAACAAAATTCTTTGGAACAACTGGAACCTGACTATTTTAAGGACATGACACCAACTATTAGGAAAACTCAGAAAATTGTTATTAAGAAGAGAGAACCATTGAATTTTGGCATCCCAGATGGGAGCACAGGTTTCTCTAGTAGATTAGCAGCTACACAAGATCTGCCTTTTATTCATCAGTCTTCTGAATTAGGTGACTTAGATACCTGGCAGGAAAATACCAATGCATGGGAAGAAGAAGAAGATGCAGCCTGGCAAGCAGAAGAAGTTCTGAGACAGCAGAAACTAGCAGACAGAGAAAAGAGAGCAGCCGAACAACAAAGGAAGAAAATGGAAAAGGAAGCACAACGGCTAATGAAGAAGGAACAAAACAAAATTGGTGTGAAACTTTCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:343)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGRGRKLSGDQITLPTTVDYSSVPKQTDVEEWTSWDEDAPTSVKIEGGNGNVATQQNSLEQLEPDYFKDMTPTIRKTQKIVIKKREPLNFGIPDGSTGFSSRLAATQDLPFIHQSSELGDLDTWQENTNAWEEEEDAAWQAEEVLRQQKLADREKRAAEQQRKKMEKEAQRLMKKEQNKIGVKLSGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:344)

EBAG9::FUS::PylRS(AA)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGCAGAGGACGGAAATTAAGTGGAGACCAAATAACTTTGCCAACTACAGTTGATTATTCATCAGTTCCTAAGCAGACAGATGTTGAAGAGTGGACTTCCTGGGATGAAGATGCACCCACCAGTGTAAAGATCGAAGGAGGGAATGGGAATGTGGCAACACAACAAAATTCTTTGGAACAACTGGAACCTGACTATTTTAAGGACATGACACCAACTATTAGGAAAACTCAGAAAATTGTTATTAAGAAGAGAGAACCATTGAATTTTGGCATCCCAGATGGGAGCACAGGTTTCTCTAGTAGATTAGCAGCTACACAAGATCTGCCTTTTATTCATCAGTCTTCTGAATTAGGTGACTTAGATACCTGGCAGGAAAATACCAATGCATGGGAAGAAGAAGAAGATGCAGCCTGGCAAGCAGAAGAAGTTCTGAGACAGCAGAAACTAGCAGACAGAGAAAAGAGAGCAGCCGAACAACAAAGGAAGAAAATGGAAAAGGAAGCACAACGGCTAATGAAGAAGGAACAAAACAAAATTGGTGTGAAACTTTCAGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:345)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGRGRKLSGDQITLPTTVDYSSVPKQTDVEEWTSWDEDAPTSVKIEGGNGNVATQQNSLEQLEPDYFKDMTPTIRKTQKIVIKKREPLNFGIPDGSTGFSSRLAATQDLPFIHQSSELGDLDTWQENTNAWEEEEDAAWQAEEVLRQQKLADREKRAAEQQRKKMEKEAQRLMKKEQNKIGVKLSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ IDNO:346)

EBAG9::FUS::PylRS(AAAF)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGCAGAGGACGGAAATTAAGTGGAGACCAAATAACTTTGCCAACTACAGTTGATTATTCATCAGTTCCTAAGCAGACAGATGTTGAAGAGTGGACTTCCTGGGATGAAGATGCACCCACCAGTGTAAAGATCGAAGGAGGGAATGGGAATGTGGCAACACAACAAAATTCTTTGGAACAACTGGAACCTGACTATTTTAAGGACATGACACCAACTATTAGGAAAACTCAGAAAATTGTTATTAAGAAGAGAGAACCATTGAATTTTGGCATCCCAGATGGGAGCACAGGTTTCTCTAGTAGATTAGCAGCTACACAAGATCTGCCTTTTATTCATCAGTCTTCTGAATTAGGTGACTTAGATACCTGGCAGGAAAATACCAATGCATGGGAAGAAGAAGAAGATGCAGCCTGGCAAGCAGAAGAAGTTCTGAGACAGCAGAAACTAGCAGACAGAGAAAAGAGAGCAGCCGAACAACAAAGGAAGAAAATGGAAAAGGAAGCACAACGGCTAATGAAGAAGGAACAAAACAAAATTGGTGTGAAACTTTCAGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:347)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGRGRKLSGDQITLPTTVDYSSVPKQTDVEEWTSWDEDAPTSVKIEGGNGNVATQQNSLEQLEPDYFKDMTPTIRKTQKIVIKKREPLNFGIPDGSTGFSSRLAATQDLPFIHQSSELGDLDTWQENTNAWEEEEDAAWQAEEVLRQQKLADREKRAAEQQRKKMEKEAQRLMKKEQNKIGVKLSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ IDNO:348)

EBAG9_1-29::FUS::PylRS(AA)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:349)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:350)

EBAG9_1-29::FUS::PylRS(AAAF)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:351)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:352)

EBAG9_1-29::FUS::MCP::PylRS(AF)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:353)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:354)

CG1::PylRS(AF)

DNA:

ATGGCCATTTGTCAATTCTTCCTTCAAGGCCGGTGCCGCTTTGGAGATCGGTGCTGGAACGAACATCCCGGTGCTAGGGGTGCAGGAGGAGGACGGCAGCAACCGCAGCAGCAGCCTTCAGGTAATAATAGACGTGGATGGAATACAACTAGCCAGAGATATTCCAATGTCATCCAGCCATCCAGTTTCTCCAAATCCACACCATGGGGGGGCAGCAGAGATCAAGAAAAGCCATATTTCAGTTCTTTTGATTCTGGAGCTTCAACTAACAGGAAGGAAGGCTTTGGATTGTCTGAGAACCCATTTGCTTCACTTAGTCCTGATGAGCAGAAAGATGAAAAGAAACTTCTGGAAGGAATTGTAAAAGATATGGAGGTTTGGGAATCATCAGGGCAGTGGATGTTTTCTGTTTATTCACCAGTGAAAAAGAAACCTAATATTTCAGGTTTTACAGACATTTCACCAGAGGAATTGAGGCTTGAATACCATAACTTCTTAACCAGCAATAACTTACAGAGTTATCTAAATTCTGTCCAACGTTTAATAAATCAATGGAGGAACAGGGTAAATGAACTGAAAAGTCTAAATATATCAACTAAAGTAGCTTTGCTCTCTGATGTAAAGGATGGAGTAAATCAAGCAGCACCTGCATTTGGATTTGGCAGCAGTCAAGCAGCAACATTTATGTCGCCAGGCTTTCCAGTCAATAACAGCAGCAGTGATAATGCTCAGAACTTTAGTTTTAAAACAAACTCTGGATTTGCTGCTGCCTCTTCTGGAAGCCCTGCTGGTTTTGGGAGTTCCCCAGCATTTGGAGCTGCAGCCTCTACCAGTTCAGGTATCTCTACTTCTGCTCCAGCTTTTGGATTTGGGAAGCCTGAAGTCACATCGGCTGCATCATTTTCATTCAAAAGCCCTGCAGCTTCCAGTTTTGGATCACCTGGATTTTCAGGACTTCCAGCTTCCTTGGCAACAGGTCCTGTCAGAGCTCCAGTGGCCCCAGCCTTTGGAGGTGGCAGTTCTGTGGCTGGTTTTGGTAGTCCGGGCTCACATTCTCACACTGCTTTTTCTAAGCCATCCAGTGACACTTTTGGAAATAGCAGCATATCCACTTCTCTGTCAGCCTCAAGCAGCATCATTGCAACAGATAATGTGTTATTCACACCCAGAGATAAACTAACAGTAGAAGAACTGGAACAATTTCAATCCAAGAAATTTACTCTGGGAAAAATTCCATTAAAGCCTCCACCTCTGGAACTTCTAAATGTTGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:355)

蛋白:

MAICQFFLQGRCRFGDRCWNEHPGARGAGGGRQQPQQQPSGNNRRGWNTTSQRYSNVIQPSSFSKSTPWGGSRDQEKPYFSSFDSGASTNRKEGFGLSENPFASLSPDEQKDEKKLLEGIVKDMEVWESSGQWMFSVYSPVKKKPNISGFTDISPEELRLEYHNFLTSNNLQSYLNSVQRLINQWRNRVNELKSLNISTKVALLSDVKDGVNQAAPAFGFGSSQAATFMSPGFPVNNSSSDNAQNFSFKTNSGFAAASSGSPAGFGSSPAFGAAASTSSGISTSAPAFGFGKPEVTSAASFSFKSPAASSFGSPGFSGLPASLATGPVRAPVAPAFGGGSSVAGFGSPGSHSHTAFSKPSSDTFGNSSISTSLSASSSIIATDNVLFTPRDKLTVEELEQFQSKKFTLGKIPLKPPPLELLNVGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:356)

CG1::PylRS(AA)

DNA:

ATGGCCATTTGTCAATTCTTCCTTCAAGGCCGGTGCCGCTTTGGAGATCGGTGCTGGAACGAACATCCCGGTGCTAGGGGTGCAGGAGGAGGACGGCAGCAACCGCAGCAGCAGCCTTCAGGTAATAATAGACGTGGATGGAATACAACTAGCCAGAGATATTCCAATGTCATCCAGCCATCCAGTTTCTCCAAATCCACACCATGGGGGGGCAGCAGAGATCAAGAAAAGCCATATTTCAGTTCTTTTGATTCTGGAGCTTCAACTAACAGGAAGGAAGGCTTTGGATTGTCTGAGAACCCATTTGCTTCACTTAGTCCTGATGAGCAGAAAGATGAAAAGAAACTTCTGGAAGGAATTGTAAAAGATATGGAGGTTTGGGAATCATCAGGGCAGTGGATGTTTTCTGTTTATTCACCAGTGAAAAAGAAACCTAATATTTCAGGTTTTACAGACATTTCACCAGAGGAATTGAGGCTTGAATACCATAACTTCTTAACCAGCAATAACTTACAGAGTTATCTAAATTCTGTCCAACGTTTAATAAATCAATGGAGGAACAGGGTAAATGAACTGAAAAGTCTAAATATATCAACTAAAGTAGCTTTGCTCTCTGATGTAAAGGATGGAGTAAATCAAGCAGCACCTGCATTTGGATTTGGCAGCAGTCAAGCAGCAACATTTATGTCGCCAGGCTTTCCAGTCAATAACAGCAGCAGTGATAATGCTCAGAACTTTAGTTTTAAAACAAACTCTGGATTTGCTGCTGCCTCTTCTGGAAGCCCTGCTGGTTTTGGGAGTTCCCCAGCATTTGGAGCTGCAGCCTCTACCAGTTCAGGTATCTCTACTTCTGCTCCAGCTTTTGGATTTGGGAAGCCTGAAGTCACATCGGCTGCATCATTTTCATTCAAAAGCCCTGCAGCTTCCAGTTTTGGATCACCTGGATTTTCAGGACTTCCAGCTTCCTTGGCAACAGGTCCTGTCAGAGCTCCAGTGGCCCCAGCCTTTGGAGGTGGCAGTTCTGTGGCTGGTTTTGGTAGTCCGGGCTCACATTCTCACACTGCTTTTTCTAAGCCATCCAGTGACACTTTTGGAAATAGCAGCATATCCACTTCTCTGTCAGCCTCAAGCAGCATCATTGCAACAGATAATGTGTTATTCACACCCAGAGATAAACTAACAGTAGAAGAACTGGAACAATTTCAATCCAAGAAATTTACTCTGGGAAAAATTCCATTAAAGCCTCCACCTCTGGAACTTCTAAATGTTGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:357)

蛋白:

MAICQFFLQGRCRFGDRCWNEHPGARGAGGGRQQPQQQPSGNNRRGWNTTSQRYSNVIQPSSFSKSTPWGGSRDQEKPYFSSFDSGASTNRKEGFGLSENPFASLSPDEQKDEKKLLEGIVKDMEVWESSGQWMFSVYSPVKKKPNISGFTDISPEELRLEYHNFLTSNNLQSYLNSVQRLINQWRNRVNELKSLNISTKVALLSDVKDGVNQAAPAFGFGSSQAATFMSPGFPVNNSSSDNAQNFSFKTNSGFAAASSGSPAGFGSSPAFGAAASTSSGISTSAPAFGFGKPEVTSAASFSFKSPAASSFGSPGFSGLPASLATGPVRAPVAPAFGGGSSVAGFGSPGSHSHTAFSKPSSDTFGNSSISTSLSASSSIIATDNVLFTPRDKLTVEELEQFQSKKFTLGKIPLKPPPLELLNVGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:358)

CG1::PylRS(AAAF)

DNA:

ATGGCCATTTGTCAATTCTTCCTTCAAGGCCGGTGCCGCTTTGGAGATCGGTGCTGGAACGAACATCCCGGTGCTAGGGGTGCAGGAGGAGGACGGCAGCAACCGCAGCAGCAGCCTTCAGGTAATAATAGACGTGGATGGAATACAACTAGCCAGAGATATTCCAATGTCATCCAGCCATCCAGTTTCTCCAAATCCACACCATGGGGGGGCAGCAGAGATCAAGAAAAGCCATATTTCAGTTCTTTTGATTCTGGAGCTTCAACTAACAGGAAGGAAGGCTTTGGATTGTCTGAGAACCCATTTGCTTCACTTAGTCCTGATGAGCAGAAAGATGAAAAGAAACTTCTGGAAGGAATTGTAAAAGATATGGAGGTTTGGGAATCATCAGGGCAGTGGATGTTTTCTGTTTATTCACCAGTGAAAAAGAAACCTAATATTTCAGGTTTTACAGACATTTCACCAGAGGAATTGAGGCTTGAATACCATAACTTCTTAACCAGCAATAACTTACAGAGTTATCTAAATTCTGTCCAACGTTTAATAAATCAATGGAGGAACAGGGTAAATGAACTGAAAAGTCTAAATATATCAACTAAAGTAGCTTTGCTCTCTGATGTAAAGGATGGAGTAAATCAAGCAGCACCTGCATTTGGATTTGGCAGCAGTCAAGCAGCAACATTTATGTCGCCAGGCTTTCCAGTCAATAACAGCAGCAGTGATAATGCTCAGAACTTTAGTTTTAAAACAAACTCTGGATTTGCTGCTGCCTCTTCTGGAAGCCCTGCTGGTTTTGGGAGTTCCCCAGCATTTGGAGCTGCAGCCTCTACCAGTTCAGGTATCTCTACTTCTGCTCCAGCTTTTGGATTTGGGAAGCCTGAAGTCACATCGGCTGCATCATTTTCATTCAAAAGCCCTGCAGCTTCCAGTTTTGGATCACCTGGATTTTCAGGACTTCCAGCTTCCTTGGCAACAGGTCCTGTCAGAGCTCCAGTGGCCCCAGCCTTTGGAGGTGGCAGTTCTGTGGCTGGTTTTGGTAGTCCGGGCTCACATTCTCACACTGCTTTTTCTAAGCCATCCAGTGACACTTTTGGAAATAGCAGCATATCCACTTCTCTGTCAGCCTCAAGCAGCATCATTGCAACAGATAATGTGTTATTCACACCCAGAGATAAACTAACAGTAGAAGAACTGGAACAATTTCAATCCAAGAAATTTACTCTGGGAAAAATTCCATTAAAGCCTCCACCTCTGGAACTTCTAAATGTTGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:359)

蛋白:

MAICQFFLQGRCRFGDRCWNEHPGARGAGGGRQQPQQQPSGNNRRGWNTTSQRYSNVIQPSSFSKSTPWGGSRDQEKPYFSSFDSGASTNRKEGFGLSENPFASLSPDEQKDEKKLLEGIVKDMEVWESSGQWMFSVYSPVKKKPNISGFTDISPEELRLEYHNFLTSNNLQSYLNSVQRLINQWRNRVNELKSLNISTKVALLSDVKDGVNQAAPAFGFGSSQAATFMSPGFPVNNSSSDNAQNFSFKTNSGFAAASSGSPAGFGSSPAFGAAASTSSGISTSAPAFGFGKPEVTSAASFSFKSPAASSFGSPGFSGLPASLATGPVRAPVAPAFGGGSSVAGFGSPGSHSHTAFSKPSSDTFGNSSISTSLSASSSIIATDNVLFTPRDKLTVEELEQFQSKKFTLGKIPLKPPPLELLNVGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:360)

CG1::FUS::PylRS(AA)

DNA:

ATGGCCATTTGTCAATTCTTCCTTCAAGGCCGGTGCCGCTTTGGAGATCGGTGCTGGAACGAACATCCCGGTGCTAGGGGTGCAGGAGGAGGACGGCAGCAACCGCAGCAGCAGCCTTCAGGTAATAATAGACGTGGATGGAATACAACTAGCCAGAGATATTCCAATGTCATCCAGCCATCCAGTTTCTCCAAATCCACACCATGGGGGGGCAGCAGAGATCAAGAAAAGCCATATTTCAGTTCTTTTGATTCTGGAGCTTCAACTAACAGGAAGGAAGGCTTTGGATTGTCTGAGAACCCATTTGCTTCACTTAGTCCTGATGAGCAGAAAGATGAAAAGAAACTTCTGGAAGGAATTGTAAAAGATATGGAGGTTTGGGAATCATCAGGGCAGTGGATGTTTTCTGTTTATTCACCAGTGAAAAAGAAACCTAATATTTCAGGTTTTACAGACATTTCACCAGAGGAATTGAGGCTTGAATACCATAACTTCTTAACCAGCAATAACTTACAGAGTTATCTAAATTCTGTCCAACGTTTAATAAATCAATGGAGGAACAGGGTAAATGAACTGAAAAGTCTAAATATATCAACTAAAGTAGCTTTGCTCTCTGATGTAAAGGATGGAGTAAATCAAGCAGCACCTGCATTTGGATTTGGCAGCAGTCAAGCAGCAACATTTATGTCGCCAGGCTTTCCAGTCAATAACAGCAGCAGTGATAATGCTCAGAACTTTAGTTTTAAAACAAACTCTGGATTTGCTGCTGCCTCTTCTGGAAGCCCTGCTGGTTTTGGGAGTTCCCCAGCATTTGGAGCTGCAGCCTCTACCAGTTCAGGTATCTCTACTTCTGCTCCAGCTTTTGGATTTGGGAAGCCTGAAGTCACATCGGCTGCATCATTTTCATTCAAAAGCCCTGCAGCTTCCAGTTTTGGATCACCTGGATTTTCAGGACTTCCAGCTTCCTTGGCAACAGGTCCTGTCAGAGCTCCAGTGGCCCCAGCCTTTGGAGGTGGCAGTTCTGTGGCTGGTTTTGGTAGTCCGGGCTCACATTCTCACACTGCTTTTTCTAAGCCATCCAGTGACACTTTTGGAAATAGCAGCATATCCACTTCTCTGTCAGCCTCAAGCAGCATCATTGCAACAGATAATGTGTTATTCACACCCAGAGATAAACTAACAGTAGAAGAACTGGAACAATTTCAATCCAAGAAATTTACTCTGGGAAAAATTCCATTAAAGCCTCCACCTCTGGAACTTCTAAATGTTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:361)

蛋白:

MAICQFFLQGRCRFGDRCWNEHPGARGAGGGRQQPQQQPSGNNRRGWNTTSQRYSNVIQPSSFSKSTPWGGSRDQEKPYFSSFDSGASTNRKEGFGLSENPFASLSPDEQKDEKKLLEGIVKDMEVWESSGQWMFSVYSPVKKKPNISGFTDISPEELRLEYHNFLTSNNLQSYLNSVQRLINQWRNRVNELKSLNISTKVALLSDVKDGVNQAAPAFGFGSSQAATFMSPGFPVNNSSSDNAQNFSFKTNSGFAAASSGSPAGFGSSPAFGAAASTSSGISTSAPAFGFGKPEVTSAASFSFKSPAASSFGSPGFSGLPASLATGPVRAPVAPAFGGGSSVAGFGSPGSHSHTAFSKPSSDTFGNSSISTSLSASSSIIATDNVLFTPRDKLTVEELEQFQSKKFTLGKIPLKPPPLELLNVGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:362)

CG1::FUS::PylRS(AAAF)

DNA:

ATGGCCATTTGTCAATTCTTCCTTCAAGGCCGGTGCCGCTTTGGAGATCGGTGCTGGAACGAACATCCCGGTGCTAGGGGTGCAGGAGGAGGACGGCAGCAACCGCAGCAGCAGCCTTCAGGTAATAATAGACGTGGATGGAATACAACTAGCCAGAGATATTCCAATGTCATCCAGCCATCCAGTTTCTCCAAATCCACACCATGGGGGGGCAGCAGAGATCAAGAAAAGCCATATTTCAGTTCTTTTGATTCTGGAGCTTCAACTAACAGGAAGGAAGGCTTTGGATTGTCTGAGAACCCATTTGCTTCACTTAGTCCTGATGAGCAGAAAGATGAAAAGAAACTTCTGGAAGGAATTGTAAAAGATATGGAGGTTTGGGAATCATCAGGGCAGTGGATGTTTTCTGTTTATTCACCAGTGAAAAAGAAACCTAATATTTCAGGTTTTACAGACATTTCACCAGAGGAATTGAGGCTTGAATACCATAACTTCTTAACCAGCAATAACTTACAGAGTTATCTAAATTCTGTCCAACGTTTAATAAATCAATGGAGGAACAGGGTAAATGAACTGAAAAGTCTAAATATATCAACTAAAGTAGCTTTGCTCTCTGATGTAAAGGATGGAGTAAATCAAGCAGCACCTGCATTTGGATTTGGCAGCAGTCAAGCAGCAACATTTATGTCGCCAGGCTTTCCAGTCAATAACAGCAGCAGTGATAATGCTCAGAACTTTAGTTTTAAAACAAACTCTGGATTTGCTGCTGCCTCTTCTGGAAGCCCTGCTGGTTTTGGGAGTTCCCCAGCATTTGGAGCTGCAGCCTCTACCAGTTCAGGTATCTCTACTTCTGCTCCAGCTTTTGGATTTGGGAAGCCTGAAGTCACATCGGCTGCATCATTTTCATTCAAAAGCCCTGCAGCTTCCAGTTTTGGATCACCTGGATTTTCAGGACTTCCAGCTTCCTTGGCAACAGGTCCTGTCAGAGCTCCAGTGGCCCCAGCCTTTGGAGGTGGCAGTTCTGTGGCTGGTTTTGGTAGTCCGGGCTCACATTCTCACACTGCTTTTTCTAAGCCATCCAGTGACACTTTTGGAAATAGCAGCATATCCACTTCTCTGTCAGCCTCAAGCAGCATCATTGCAACAGATAATGTGTTATTCACACCCAGAGATAAACTAACAGTAGAAGAACTGGAACAATTTCAATCCAAGAAATTTACTCTGGGAAAAATTCCATTAAAGCCTCCACCTCTGGAACTTCTAAATGTTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:363)

蛋白:

MAICQFFLQGRCRFGDRCWNEHPGARGAGGGRQQPQQQPSGNNRRGWNTTSQRYSNVIQPSSFSKSTPWGGSRDQEKPYFSSFDSGASTNRKEGFGLSENPFASLSPDEQKDEKKLLEGIVKDMEVWESSGQWMFSVYSPVKKKPNISGFTDISPEELRLEYHNFLTSNNLQSYLNSVQRLINQWRNRVNELKSLNISTKVALLSDVKDGVNQAAPAFGFGSSQAATFMSPGFPVNNSSSDNAQNFSFKTNSGFAAASSGSPAGFGSSPAFGAAASTSSGISTSAPAFGFGKPEVTSAASFSFKSPAASSFGSPGFSGLPASLATGPVRAPVAPAFGGGSSVAGFGSPGSHSHTAFSKPSSDTFGNSSISTSLSASSSIIATDNVLFTPRDKLTVEELEQFQSKKFTLGKIPLKPPPLELLNVGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:364)

CG1::MCP

DNA:

ATGGCCATTTGTCAATTCTTCCTTCAAGGCCGGTGCCGCTTTGGAGATCGGTGCTGGAACGAACATCCCGGTGCTAGGGGTGCAGGAGGAGGACGGCAGCAACCGCAGCAGCAGCCTTCAGGTAATAATAGACGTGGATGGAATACAACTAGCCAGAGATATTCCAATGTCATCCAGCCATCCAGTTTCTCCAAATCCACACCATGGGGGGGCAGCAGAGATCAAGAAAAGCCATATTTCAGTTCTTTTGATTCTGGAGCTTCAACTAACAGGAAGGAAGGCTTTGGATTGTCTGAGAACCCATTTGCTTCACTTAGTCCTGATGAGCAGAAAGATGAAAAGAAACTTCTGGAAGGAATTGTAAAAGATATGGAGGTTTGGGAATCATCAGGGCAGTGGATGTTTTCTGTTTATTCACCAGTGAAAAAGAAACCTAATATTTCAGGTTTTACAGACATTTCACCAGAGGAATTGAGGCTTGAATACCATAACTTCTTAACCAGCAATAACTTACAGAGTTATCTAAATTCTGTCCAACGTTTAATAAATCAATGGAGGAACAGGGTAAATGAACTGAAAAGTCTAAATATATCAACTAAAGTAGCTTTGCTCTCTGATGTAAAGGATGGAGTAAATCAAGCAGCACCTGCATTTGGATTTGGCAGCAGTCAAGCAGCAACATTTATGTCGCCAGGCTTTCCAGTCAATAACAGCAGCAGTGATAATGCTCAGAACTTTAGTTTTAAAACAAACTCTGGATTTGCTGCTGCCTCTTCTGGAAGCCCTGCTGGTTTTGGGAGTTCCCCAGCATTTGGAGCTGCAGCCTCTACCAGTTCAGGTATCTCTACTTCTGCTCCAGCTTTTGGATTTGGGAAGCCTGAAGTCACATCGGCTGCATCATTTTCATTCAAAAGCCCTGCAGCTTCCAGTTTTGGATCACCTGGATTTTCAGGACTTCCAGCTTCCTTGGCAACAGGTCCTGTCAGAGCTCCAGTGGCCCCAGCCTTTGGAGGTGGCAGTTCTGTGGCTGGTTTTGGTAGTCCGGGCTCACATTCTCACACTGCTTTTTCTAAGCCATCCAGTGACACTTTTGGAAATAGCAGCATATCCACTTCTCTGTCAGCCTCAAGCAGCATCATTGCAACAGATAATGTGTTATTCACACCCAGAGATAAACTAACAGTAGAAGAACTGGAACAATTTCAATCCAAGAAATTTACTCTGGGAAAAATTCCATTAAAGCCTCCACCTCTGGAACTTCTAAATGTTGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:365)

蛋白:

MAICQFFLQGRCRFGDRCWNEHPGARGAGGGRQQPQQQPSGNNRRGWNTTSQRYSNVIQPSSFSKSTPWGGSRDQEKPYFSSFDSGASTNRKEGFGLSENPFASLSPDEQKDEKKLLEGIVKDMEVWESSGQWMFSVYSPVKKKPNISGFTDISPEELRLEYHNFLTSNNLQSYLNSVQRLINQWRNRVNELKSLNISTKVALLSDVKDGVNQAAPAFGFGSSQAATFMSPGFPVNNSSSDNAQNFSFKTNSGFAAASSGSPAGFGSSPAFGAAASTSSGISTSAPAFGFGKPEVTSAASFSFKSPAASSFGSPGFSGLPASLATGPVRAPVAPAFGGGSSVAGFGSPGSHSHTAFSKPSSDTFGNSSISTSLSASSSIIATDNVLFTPRDKLTVEELEQFQSKKFTLGKIPLKPPPLELLNVAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:366)

CG1::EWSR1::MCP

DNA:ATGGCCATTTGTCAATTCTTCCTTCAAGGCCGGTGCCGCTTTGGAGATCGGTGCTGGAACGAACATCCCGGTGCTAGGGGTGCAGGAGGAGGACGGCAGCAACCGCAGCAGCAGCCTTCAGGTAATAATAGACGTGGATGGAATACAACTAGCCAGAGATATTCCAATGTCATCCAGCCATCCAGTTTCTCCAAATCCACACCATGGGGGGGCAGCAGAGATCAAGAAAAGCCATATTTCAGTTCTTTTGATTCTGGAGCTTCAACTAACAGGAAGGAAGGCTTTGGATTGTCTGAGAACCCATTTGCTTCACTTAGTCCTGATGAGCAGAAAGATGAAAAGAAACTTCTGGAAGGAATTGTAAAAGATATGGAGGTTTGGGAATCATCAGGGCAGTGGATGTTTTCTGTTTATTCACCAGTGAAAAAGAAACCTAATATTTCAGGTTTTACAGACATTTCACCAGAGGAATTGAGGCTTGAATACCATAACTTCTTAACCAGCAATAACTTACAGAGTTATCTAAATTCTGTCCAACGTTTAATAAATCAATGGAGGAACAGGGTAAATGAACTGAAAAGTCTAAATATATCAACTAAAGTAGCTTTGCTCTCTGATGTAAAGGATGGAGTAAATCAAGCAGCACCTGCATTTGGATTTGGCAGCAGTCAAGCAGCAACATTTATGTCGCCAGGCTTTCCAGTCAATAACAGCAGCAGTGATAATGCTCAGAACTTTAGTTTTAAAACAAACTCTGGATTTGCTGCTGCCTCTTCTGGAAGCCCTGCTGGTTTTGGGAGTTCCCCAGCATTTGGAGCTGCAGCCTCTACCAGTTCAGGTATCTCTACTTCTGCTCCAGCTTTTGGATTTGGGAAGCCTGAAGTCACATCGGCTGCATCATTTTCATTCAAAAGCCCTGCAGCTTCCAGTTTTGGATCACCTGGATTTTCAGGACTTCCAGCTTCCTTGGCAACAGGTCCTGTCAGAGCTCCAGTGGCCCCAGCCTTTGGAGGTGGCAGTTCTGTGGCTGGTTTTGGTAGTCCGGGCTCACATTCTCACACTGCTTTTTCTAAGCCATCCAGTGACACTTTTGGAAATAGCAGCATATCCACTTCTCTGTCAGCCTCAAGCAGCATCATTGCAACAGATAATGTGTTATTCACACCCAGAGATAAACTAACAGTAGAAGAACTGGAACAATTTCAATCCAAGAAATTTACTCTGGGAAAAATTCCATTAAAGCCTCCACCTCTGGAACTTCTAAATGTTATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:367)

蛋白:

MAICQFFLQGRCRFGDRCWNEHPGARGAGGGRQQPQQQPSGNNRRGWNTTSQRYSNVIQPSSFSKSTPWGGSRDQEKPYFSSFDSGASTNRKEGFGLSENPFASLSPDEQKDEKKLLEGIVKDMEVWESSGQWMFSVYSPVKKKPNISGFTDISPEELRLEYHNFLTSNNLQSYLNSVQRLINQWRNRVNELKSLNISTKVALLSDVKDGVNQAAPAFGFGSSQAATFMSPGFPVNNSSSDNAQNFSFKTNSGFAAASSGSPAGFGSSPAFGAAASTSSGISTSAPAFGFGKPEVTSAASFSFKSPAASSFGSPGFSGLPASLATGPVRAPVAPAFGGGSSVAGFGSPGSHSHTAFSKPSSDTFGNSSISTSLSASSSIIATDNVLFTPRDKLTVEELEQFQSKKFTLGKIPLKPPPLELLNVMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:368)

CG1::FUS::PylRS(AF)

DNA:

ATGGCCATTTGTCAATTCTTCCTTCAAGGCCGGTGCCGCTTTGGAGATCGGTGCTGGAACGAACATCCCGGTGCTAGGGGTGCAGGAGGAGGACGGCAGCAACCGCAGCAGCAGCCTTCAGGTAATAATAGACGTGGATGGAATACAACTAGCCAGAGATATTCCAATGTCATCCAGCCATCCAGTTTCTCCAAATCCACACCATGGGGGGGCAGCAGAGATCAAGAAAAGCCATATTTCAGTTCTTTTGATTCTGGAGCTTCAACTAACAGGAAGGAAGGCTTTGGATTGTCTGAGAACCCATTTGCTTCACTTAGTCCTGATGAGCAGAAAGATGAAAAGAAACTTCTGGAAGGAATTGTAAAAGATATGGAGGTTTGGGAATCATCAGGGCAGTGGATGTTTTCTGTTTATTCACCAGTGAAAAAGAAACCTAATATTTCAGGTTTTACAGACATTTCACCAGAGGAATTGAGGCTTGAATACCATAACTTCTTAACCAGCAATAACTTACAGAGTTATCTAAATTCTGTCCAACGTTTAATAAATCAATGGAGGAACAGGGTAAATGAACTGAAAAGTCTAAATATATCAACTAAAGTAGCTTTGCTCTCTGATGTAAAGGATGGAGTAAATCAAGCAGCACCTGCATTTGGATTTGGCAGCAGTCAAGCAGCAACATTTATGTCGCCAGGCTTTCCAGTCAATAACAGCAGCAGTGATAATGCTCAGAACTTTAGTTTTAAAACAAACTCTGGATTTGCTGCTGCCTCTTCTGGAAGCCCTGCTGGTTTTGGGAGTTCCCCAGCATTTGGAGCTGCAGCCTCTACCAGTTCAGGTATCTCTACTTCTGCTCCAGCTTTTGGATTTGGGAAGCCTGAAGTCACATCGGCTGCATCATTTTCATTCAAAAGCCCTGCAGCTTCCAGTTTTGGATCACCTGGATTTTCAGGACTTCCAGCTTCCTTGGCAACAGGTCCTGTCAGAGCTCCAGTGGCCCCAGCCTTTGGAGGTGGCAGTTCTGTGGCTGGTTTTGGTAGTCCGGGCTCACATTCTCACACTGCTTTTTCTAAGCCATCCAGTGACACTTTTGGAAATAGCAGCATATCCACTTCTCTGTCAGCCTCAAGCAGCATCATTGCAACAGATAATGTGTTATTCACACCCAGAGATAAACTAACAGTAGAAGAACTGGAACAATTTCAATCCAAGAAATTTACTCTGGGAAAAATTCCATTAAAGCCTCCACCTCTGGAACTTCTAAATGTTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:369)

蛋白:

MAICQFFLQGRCRFGDRCWNEHPGARGAGGGRQQPQQQPSGNNRRGWNTTSQRYSNVIQPSSFSKSTPWGGSRDQEKPYFSSFDSGASTNRKEGFGLSENPFASLSPDEQKDEKKLLEGIVKDMEVWESSGQWMFSVYSPVKKKPNISGFTDISPEELRLEYHNFLTSNNLQSYLNSVQRLINQWRNRVNELKSLNISTKVALLSDVKDGVNQAAPAFGFGSSQAATFMSPGFPVNNSSSDNAQNFSFKTNSGFAAASSGSPAGFGSSPAFGAAASTSSGISTSAPAFGFGKPEVTSAASFSFKSPAASSFGSPGFSGLPASLATGPVRAPVAPAFGGGSSVAGFGSPGSHSHTAFSKPSSDTFGNSSISTSLSASSSIIATDNVLFTPRDKLTVEELEQFQSKKFTLGKIPLKPPPLELLNVGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:370)

CG1::FUS::MCP::PylRS(AF)

DNA:

ATGGCCATTTGTCAATTCTTCCTTCAAGGCCGGTGCCGCTTTGGAGATCGGTGCTGGAACGAACATCCCGGTGCTAGGGGTGCAGGAGGAGGACGGCAGCAACCGCAGCAGCAGCCTTCAGGTAATAATAGACGTGGATGGAATACAACTAGCCAGAGATATTCCAATGTCATCCAGCCATCCAGTTTCTCCAAATCCACACCATGGGGGGGCAGCAGAGATCAAGAAAAGCCATATTTCAGTTCTTTTGATTCTGGAGCTTCAACTAACAGGAAGGAAGGCTTTGGATTGTCTGAGAACCCATTTGCTTCACTTAGTCCTGATGAGCAGAAAGATGAAAAGAAACTTCTGGAAGGAATTGTAAAAGATATGGAGGTTTGGGAATCATCAGGGCAGTGGATGTTTTCTGTTTATTCACCAGTGAAAAAGAAACCTAATATTTCAGGTTTTACAGACATTTCACCAGAGGAATTGAGGCTTGAATACCATAACTTCTTAACCAGCAATAACTTACAGAGTTATCTAAATTCTGTCCAACGTTTAATAAATCAATGGAGGAACAGGGTAAATGAACTGAAAAGTCTAAATATATCAACTAAAGTAGCTTTGCTCTCTGATGTAAAGGATGGAGTAAATCAAGCAGCACCTGCATTTGGATTTGGCAGCAGTCAAGCAGCAACATTTATGTCGCCAGGCTTTCCAGTCAATAACAGCAGCAGTGATAATGCTCAGAACTTTAGTTTTAAAACAAACTCTGGATTTGCTGCTGCCTCTTCTGGAAGCCCTGCTGGTTTTGGGAGTTCCCCAGCATTTGGAGCTGCAGCCTCTACCAGTTCAGGTATCTCTACTTCTGCTCCAGCTTTTGGATTTGGGAAGCCTGAAGTCACATCGGCTGCATCATTTTCATTCAAAAGCCCTGCAGCTTCCAGTTTTGGATCACCTGGATTTTCAGGACTTCCAGCTTCCTTGGCAACAGGTCCTGTCAGAGCTCCAGTGGCCCCAGCCTTTGGAGGTGGCAGTTCTGTGGCTGGTTTTGGTAGTCCGGGCTCACATTCTCACACTGCTTTTTCTAAGCCATCCAGTGACACTTTTGGAAATAGCAGCATATCCACTTCTCTGTCAGCCTCAAGCAGCATCATTGCAACAGATAATGTGTTATTCACACCCAGAGATAAACTAACAGTAGAAGAACTGGAACAATTTCAATCCAAGAAATTTACTCTGGGAAAAATTCCATTAAAGCCTCCACCTCTGGAACTTCTAAATGTTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:371)

蛋白:

MAICQFFLQGRCRFGDRCWNEHPGARGAGGGRQQPQQQPSGNNRRGWNTTSQRYSNVIQPSSFSKSTPWGGSRDQEKPYFSSFDSGASTNRKEGFGLSENPFASLSPDEQKDEKKLLEGIVKDMEVWESSGQWMFSVYSPVKKKPNISGFTDISPEELRLEYHNFLTSNNLQSYLNSVQRLINQWRNRVNELKSLNISTKVALLSDVKDGVNQAAPAFGFGSSQAATFMSPGFPVNNSSSDNAQNFSFKTNSGFAAASSGSPAGFGSSPAFGAAASTSSGISTSAPAFGFGKPEVTSAASFSFKSPAASSFGSPGFSGLPASLATGPVRAPVAPAFGGGSSVAGFGSPGSHSHTAFSKPSSDTFGNSSISTSLSASSSIIATDNVLFTPRDKLTVEELEQFQSKKFTLGKIPLKPPPLELLNVGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:372)

CMP-SaTr::PylRS(AF)

DNA:

ATGGCTGCCCCGAGAGACAATGTCACTTTATTATTCAAGTTATACTGCTTGGCAGTGATGACCCTGATGGCTGCAGTCTATACCATAGCTTTAAGATACACAAGGACATCAGACAAAGAACTCTACTTTTCAACCACAGCCGTGTGTATCACAGAAGTTATAAAGTTATTGCTAAGTGTGGGAATTTTAGCTAAAGAAACTGGTAGTCTGGGTAGATTCAAAGCATCTTTAAGAGAAAATGTCTTGGGGAGCCCCAAGGAACTGTTGAAGTTAAGTGTGCCATCGTTAGTGTATGCTGTTCAGAACAACATGGCTTTCCTAGCTCTTAGCAATCTGGATGCAGCAGTGTACCAGGTGACCTACCAGTTGAAGATTCCGTGTACTGCTTTATGCACTGTTTTAATGTTAAACCGGACACTCAGCAAATTACAGTGGGTTTCAGTTTTTATGCTGTGTGCTGGAGTTACGCTTGTACAGTGGAAACCAGCCCAAGCTACAAAAGTGGTGGTGGAACAAAATCCATTATTAGGGTTTGGCGCTATAGCTATTGCTGTATTGTGCTCAGGATTTGCAGGAGTATATTTTGAAAAAGTTTTAAAGAGTTCAGATACTTCTCTTTGGGTGAGAAACATTCAAATGTATCTATCAGGGATTATTGTGACATTAGCTGGCGTCTACTTGTCAGATGGAGCTGAAATTAAAGAAAAAGGATTTTTCTATGGTTACACATATTATGTCTGGTTTGTCATCTTTCTTGCAAGTGTTGGTGGCCTCTACACTTCTGTTGTGGTTAAGTACACAGACAATATCATGAAAGGCTTTTCTGCAGCAGCGGCCATTGTCCTTTCCACCATTGCTTCAGTAATGCTGTTTGGATTACAGATAACACTTACCTTTGCCCTGGGTACTCTTCTTGTATGTGTTTCCATATATCTCTATGGATTACCCAGACAAGACACTACATCCATCCAACAAGGAGAAACAGCTTCAAAGGAGAGAGTTATTGGTGTGGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ IDNO:373)

蛋白:

MAAPRDNVTLLFKLYCLAVMTLMAAVYTIALRYTRTSDKELYFSTTAVCITEVIKLLLSVGILAKETGSLGRFKASLRENVLGSPKELLKLSVPSLVYAVQNNMAFLALSNLDAAVYQVTYQLKIPCTALCTVLMLNRTLSKLQWVSVFMLCAGVTLVQWKPAQATKVVVEQNPLLGFGAIAIAVLCSGFAGVYFEKVLKSSDTSLWVRNIQMYLSGIIVTLAGVYLSDGAEIKEKGFFYGYTYYVWFVIFLASVGGLYTSVVVKYTDNIMKGFSAAAAIVLSTIASVMLFGLQITLTFALGTLLVCVSIYLYGLPRQDTTSIQQGETASKERVIGVGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:374)

CMP-SaTr::PylRS(AA)

DNA:

ATGGCTGCCCCGAGAGACAATGTCACTTTATTATTCAAGTTATACTGCTTGGCAGTGATGACCCTGATGGCTGCAGTCTATACCATAGCTTTAAGATACACAAGGACATCAGACAAAGAACTCTACTTTTCAACCACAGCCGTGTGTATCACAGAAGTTATAAAGTTATTGCTAAGTGTGGGAATTTTAGCTAAAGAAACTGGTAGTCTGGGTAGATTCAAAGCATCTTTAAGAGAAAATGTCTTGGGGAGCCCCAAGGAACTGTTGAAGTTAAGTGTGCCATCGTTAGTGTATGCTGTTCAGAACAACATGGCTTTCCTAGCTCTTAGCAATCTGGATGCAGCAGTGTACCAGGTGACCTACCAGTTGAAGATTCCGTGTACTGCTTTATGCACTGTTTTAATGTTAAACCGGACACTCAGCAAATTACAGTGGGTTTCAGTTTTTATGCTGTGTGCTGGAGTTACGCTTGTACAGTGGAAACCAGCCCAAGCTACAAAAGTGGTGGTGGAACAAAATCCATTATTAGGGTTTGGCGCTATAGCTATTGCTGTATTGTGCTCAGGATTTGCAGGAGTATATTTTGAAAAAGTTTTAAAGAGTTCAGATACTTCTCTTTGGGTGAGAAACATTCAAATGTATCTATCAGGGATTATTGTGACATTAGCTGGCGTCTACTTGTCAGATGGAGCTGAAATTAAAGAAAAAGGATTTTTCTATGGTTACACATATTATGTCTGGTTTGTCATCTTTCTTGCAAGTGTTGGTGGCCTCTACACTTCTGTTGTGGTTAAGTACACAGACAATATCATGAAAGGCTTTTCTGCAGCAGCGGCCATTGTCCTTTCCACCATTGCTTCAGTAATGCTGTTTGGATTACAGATAACACTTACCTTTGCCCTGGGTACTCTTCTTGTATGTGTTTCCATATATCTCTATGGATTACCCAGACAAGACACTACATCCATCCAACAAGGAGAAACAGCTTCAAAGGAGAGAGTTATTGGTGTGGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ IDNO:375)

蛋白:

MAAPRDNVTLLFKLYCLAVMTLMAAVYTIALRYTRTSDKELYFSTTAVCITEVIKLLLSVGILAKETGSLGRFKASLRENVLGSPKELLKLSVPSLVYAVQNNMAFLALSNLDAAVYQVTYQLKIPCTALCTVLMLNRTLSKLQWVSVFMLCAGVTLVQWKPAQATKVVVEQNPLLGFGAIAIAVLCSGFAGVYFEKVLKSSDTSLWVRNIQMYLSGIIVTLAGVYLSDGAEIKEKGFFYGYTYYVWFVIFLASVGGLYTSVVVKYTDNIMKGFSAAAAIVLSTIASVMLFGLQITLTFALGTLLVCVSIYLYGLPRQDTTSIQQGETASKERVIGVGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:376)

CMP-SaTr::PylRS(AAAF)

DNA:

ATGGCTGCCCCGAGAGACAATGTCACTTTATTATTCAAGTTATACTGCTTGGCAGTGATGACCCTGATGGCTGCAGTCTATACCATAGCTTTAAGATACACAAGGACATCAGACAAAGAACTCTACTTTTCAACCACAGCCGTGTGTATCACAGAAGTTATAAAGTTATTGCTAAGTGTGGGAATTTTAGCTAAAGAAACTGGTAGTCTGGGTAGATTCAAAGCATCTTTAAGAGAAAATGTCTTGGGGAGCCCCAAGGAACTGTTGAAGTTAAGTGTGCCATCGTTAGTGTATGCTGTTCAGAACAACATGGCTTTCCTAGCTCTTAGCAATCTGGATGCAGCAGTGTACCAGGTGACCTACCAGTTGAAGATTCCGTGTACTGCTTTATGCACTGTTTTAATGTTAAACCGGACACTCAGCAAATTACAGTGGGTTTCAGTTTTTATGCTGTGTGCTGGAGTTACGCTTGTACAGTGGAAACCAGCCCAAGCTACAAAAGTGGTGGTGGAACAAAATCCATTATTAGGGTTTGGCGCTATAGCTATTGCTGTATTGTGCTCAGGATTTGCAGGAGTATATTTTGAAAAAGTTTTAAAGAGTTCAGATACTTCTCTTTGGGTGAGAAACATTCAAATGTATCTATCAGGGATTATTGTGACATTAGCTGGCGTCTACTTGTCAGATGGAGCTGAAATTAAAGAAAAAGGATTTTTCTATGGTTACACATATTATGTCTGGTTTGTCATCTTTCTTGCAAGTGTTGGTGGCCTCTACACTTCTGTTGTGGTTAAGTACACAGACAATATCATGAAAGGCTTTTCTGCAGCAGCGGCCATTGTCCTTTCCACCATTGCTTCAGTAATGCTGTTTGGATTACAGATAACACTTACCTTTGCCCTGGGTACTCTTCTTGTATGTGTTTCCATATATCTCTATGGATTACCCAGACAAGACACTACATCCATCCAACAAGGAGAAACAGCTTCAAAGGAGAGAGTTATTGGTGTGGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ IDNO:377)

蛋白:

MAAPRDNVTLLFKLYCLAVMTLMAAVYTIALRYTRTSDKELYFSTTAVCITEVIKLLLSVGILAKETGSLGRFKASLRENVLGSPKELLKLSVPSLVYAVQNNMAFLALSNLDAAVYQVTYQLKIPCTALCTVLMLNRTLSKLQWVSVFMLCAGVTLVQWKPAQATKVVVEQNPLLGFGAIAIAVLCSGFAGVYFEKVLKSSDTSLWVRNIQMYLSGIIVTLAGVYLSDGAEIKEKGFFYGYTYYVWFVIFLASVGGLYTSVVVKYTDNIMKGFSAAAAIVLSTIASVMLFGLQITLTFALGTLLVCVSIYLYGLPRQDTTSIQQGETASKERVIGVGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:378)

CMP-SaTr::FUS::PylRS(AA)

DNA:

ATGGCTGCCCCGAGAGACAATGTCACTTTATTATTCAAGTTATACTGCTTGGCAGTGATGACCCTGATGGCTGCAGTCTATACCATAGCTTTAAGATACACAAGGACATCAGACAAAGAACTCTACTTTTCAACCACAGCCGTGTGTATCACAGAAGTTATAAAGTTATTGCTAAGTGTGGGAATTTTAGCTAAAGAAACTGGTAGTCTGGGTAGATTCAAAGCATCTTTAAGAGAAAATGTCTTGGGGAGCCCCAAGGAACTGTTGAAGTTAAGTGTGCCATCGTTAGTGTATGCTGTTCAGAACAACATGGCTTTCCTAGCTCTTAGCAATCTGGATGCAGCAGTGTACCAGGTGACCTACCAGTTGAAGATTCCGTGTACTGCTTTATGCACTGTTTTAATGTTAAACCGGACACTCAGCAAATTACAGTGGGTTTCAGTTTTTATGCTGTGTGCTGGAGTTACGCTTGTACAGTGGAAACCAGCCCAAGCTACAAAAGTGGTGGTGGAACAAAATCCATTATTAGGGTTTGGCGCTATAGCTATTGCTGTATTGTGCTCAGGATTTGCAGGAGTATATTTTGAAAAAGTTTTAAAGAGTTCAGATACTTCTCTTTGGGTGAGAAACATTCAAATGTATCTATCAGGGATTATTGTGACATTAGCTGGCGTCTACTTGTCAGATGGAGCTGAAATTAAAGAAAAAGGATTTTTCTATGGTTACACATATTATGTCTGGTTTGTCATCTTTCTTGCAAGTGTTGGTGGCCTCTACACTTCTGTTGTGGTTAAGTACACAGACAATATCATGAAAGGCTTTTCTGCAGCAGCGGCCATTGTCCTTTCCACCATTGCTTCAGTAATGCTGTTTGGATTACAGATAACACTTACCTTTGCCCTGGGTACTCTTCTTGTATGTGTTTCCATATATCTCTATGGATTACCCAGACAAGACACTACATCCATCCAACAAGGAGAAACAGCTTCAAAGGAGAGAGTTATTGGTGTGGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:379)

蛋白:

MAAPRDNVTLLFKLYCLAVMTLMAAVYTIALRYTRTSDKELYFSTTAVCITEVIKLLLSVGILAKETGSLGRFKASLRENVLGSPKELLKLSVPSLVYAVQNNMAFLALSNLDAAVYQVTYQLKIPCTALCTVLMLNRTLSKLQWVSVFMLCAGVTLVQWKPAQATKVVVEQNPLLGFGAIAIAVLCSGFAGVYFEKVLKSSDTSLWVRNIQMYLSGIIVTLAGVYLSDGAEIKEKGFFYGYTYYVWFVIFLASVGGLYTSVVVKYTDNIMKGFSAAAAIVLSTIASVMLFGLQITLTFALGTLLVCVSIYLYGLPRQDTTSIQQGETASKERVIGVGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:380)

CMP-SaTr::FUS::PylRS(AAAF)

DNA:

ATGGCTGCCCCGAGAGACAATGTCACTTTATTATTCAAGTTATACTGCTTGGCAGTGATGACCCTGATGGCTGCAGTCTATACCATAGCTTTAAGATACACAAGGACATCAGACAAAGAACTCTACTTTTCAACCACAGCCGTGTGTATCACAGAAGTTATAAAGTTATTGCTAAGTGTGGGAATTTTAGCTAAAGAAACTGGTAGTCTGGGTAGATTCAAAGCATCTTTAAGAGAAAATGTCTTGGGGAGCCCCAAGGAACTGTTGAAGTTAAGTGTGCCATCGTTAGTGTATGCTGTTCAGAACAACATGGCTTTCCTAGCTCTTAGCAATCTGGATGCAGCAGTGTACCAGGTGACCTACCAGTTGAAGATTCCGTGTACTGCTTTATGCACTGTTTTAATGTTAAACCGGACACTCAGCAAATTACAGTGGGTTTCAGTTTTTATGCTGTGTGCTGGAGTTACGCTTGTACAGTGGAAACCAGCCCAAGCTACAAAAGTGGTGGTGGAACAAAATCCATTATTAGGGTTTGGCGCTATAGCTATTGCTGTATTGTGCTCAGGATTTGCAGGAGTATATTTTGAAAAAGTTTTAAAGAGTTCAGATACTTCTCTTTGGGTGAGAAACATTCAAATGTATCTATCAGGGATTATTGTGACATTAGCTGGCGTCTACTTGTCAGATGGAGCTGAAATTAAAGAAAAAGGATTTTTCTATGGTTACACATATTATGTCTGGTTTGTCATCTTTCTTGCAAGTGTTGGTGGCCTCTACACTTCTGTTGTGGTTAAGTACACAGACAATATCATGAAAGGCTTTTCTGCAGCAGCGGCCATTGTCCTTTCCACCATTGCTTCAGTAATGCTGTTTGGATTACAGATAACACTTACCTTTGCCCTGGGTACTCTTCTTGTATGTGTTTCCATATATCTCTATGGATTACCCAGACAAGACACTACATCCATCCAACAAGGAGAAACAGCTTCAAAGGAGAGAGTTATTGGTGTGGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:381)

蛋白:

MAAPRDNVTLLFKLYCLAVMTLMAAVYTIALRYTRTSDKELYFSTTAVCITEVIKLLLSVGILAKETGSLGRFKASLRENVLGSPKELLKLSVPSLVYAVQNNMAFLALSNLDAAVYQVTYQLKIPCTALCTVLMLNRTLSKLQWVSVFMLCAGVTLVQWKPAQATKVVVEQNPLLGFGAIAIAVLCSGFAGVYFEKVLKSSDTSLWVRNIQMYLSGIIVTLAGVYLSDGAEIKEKGFFYGYTYYVWFVIFLASVGGLYTSVVVKYTDNIMKGFSAAAAIVLSTIASVMLFGLQITLTFALGTLLVCVSIYLYGLPRQDTTSIQQGETASKERVIGVGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:382)

CMP-SaTr::MCP

DNA:

ATGGCTGCCCCGAGAGACAATGTCACTTTATTATTCAAGTTATACTGCTTGGCAGTGATGACCCTGATGGCTGCAGTCTATACCATAGCTTTAAGATACACAAGGACATCAGACAAAGAACTCTACTTTTCAACCACAGCCGTGTGTATCACAGAAGTTATAAAGTTATTGCTAAGTGTGGGAATTTTAGCTAAAGAAACTGGTAGTCTGGGTAGATTCAAAGCATCTTTAAGAGAAAATGTCTTGGGGAGCCCCAAGGAACTGTTGAAGTTAAGTGTGCCATCGTTAGTGTATGCTGTTCAGAACAACATGGCTTTCCTAGCTCTTAGCAATCTGGATGCAGCAGTGTACCAGGTGACCTACCAGTTGAAGATTCCGTGTACTGCTTTATGCACTGTTTTAATGTTAAACCGGACACTCAGCAAATTACAGTGGGTTTCAGTTTTTATGCTGTGTGCTGGAGTTACGCTTGTACAGTGGAAACCAGCCCAAGCTACAAAAGTGGTGGTGGAACAAAATCCATTATTAGGGTTTGGCGCTATAGCTATTGCTGTATTGTGCTCAGGATTTGCAGGAGTATATTTTGAAAAAGTTTTAAAGAGTTCAGATACTTCTCTTTGGGTGAGAAACATTCAAATGTATCTATCAGGGATTATTGTGACATTAGCTGGCGTCTACTTGTCAGATGGAGCTGAAATTAAAGAAAAAGGATTTTTCTATGGTTACACATATTATGTCTGGTTTGTCATCTTTCTTGCAAGTGTTGGTGGCCTCTACACTTCTGTTGTGGTTAAGTACACAGACAATATCATGAAAGGCTTTTCTGCAGCAGCGGCCATTGTCCTTTCCACCATTGCTTCAGTAATGCTGTTTGGATTACAGATAACACTTACCTTTGCCCTGGGTACTCTTCTTGTATGTGTTTCCATATATCTCTATGGATTACCCAGACAAGACACTACATCCATCCAACAAGGAGAAACAGCTTCAAAGGAGAGAGTTATTGGTGTGGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:383)

蛋白:

MAAPRDNVTLLFKLYCLAVMTLMAAVYTIALRYTRTSDKELYFSTTAVCITEVIKLLLSVGILAKETGSLGRFKASLRENVLGSPKELLKLSVPSLVYAVQNNMAFLALSNLDAAVYQVTYQLKIPCTALCTVLMLNRTLSKLQWVSVFMLCAGVTLVQWKPAQATKVVVEQNPLLGFGAIAIAVLCSGFAGVYFEKVLKSSDTSLWVRNIQMYLSGIIVTLAGVYLSDGAEIKEKGFFYGYTYYVWFVIFLASVGGLYTSVVVKYTDNIMKGFSAAAAIVLSTIASVMLFGLQITLTFALGTLLVCVSIYLYGLPRQDTTSIQQGETASKERVIGVAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:384)

CMP-SaTr::EWSR1::MCP

DNA:

ATGGCTGCCCCGAGAGACAATGTCACTTTATTATTCAAGTTATACTGCTTGGCAGTGATGACCCTGATGGCTGCAGTCTATACCATAGCTTTAAGATACACAAGGACATCAGACAAAGAACTCTACTTTTCAACCACAGCCGTGTGTATCACAGAAGTTATAAAGTTATTGCTAAGTGTGGGAATTTTAGCTAAAGAAACTGGTAGTCTGGGTAGATTCAAAGCATCTTTAAGAGAAAATGTCTTGGGGAGCCCCAAGGAACTGTTGAAGTTAAGTGTGCCATCGTTAGTGTATGCTGTTCAGAACAACATGGCTTTCCTAGCTCTTAGCAATCTGGATGCAGCAGTGTACCAGGTGACCTACCAGTTGAAGATTCCGTGTACTGCTTTATGCACTGTTTTAATGTTAAACCGGACACTCAGCAAATTACAGTGGGTTTCAGTTTTTATGCTGTGTGCTGGAGTTACGCTTGTACAGTGGAAACCAGCCCAAGCTACAAAAGTGGTGGTGGAACAAAATCCATTATTAGGGTTTGGCGCTATAGCTATTGCTGTATTGTGCTCAGGATTTGCAGGAGTATATTTTGAAAAAGTTTTAAAGAGTTCAGATACTTCTCTTTGGGTGAGAAACATTCAAATGTATCTATCAGGGATTATTGTGACATTAGCTGGCGTCTACTTGTCAGATGGAGCTGAAATTAAAGAAAAAGGATTTTTCTATGGTTACACATATTATGTCTGGTTTGTCATCTTTCTTGCAAGTGTTGGTGGCCTCTACACTTCTGTTGTGGTTAAGTACACAGACAATATCATGAAAGGCTTTTCTGCAGCAGCGGCCATTGTCCTTTCCACCATTGCTTCAGTAATGCTGTTTGGATTACAGATAACACTTACCTTTGCCCTGGGTACTCTTCTTGTATGTGTTTCCATATATCTCTATGGATTACCCAGACAAGACACTACATCCATCCAACAAGGAGAAACAGCTTCAAAGGAGAGAGTTATTGGTGTGATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:385)

蛋白:

MAAPRDNVTLLFKLYCLAVMTLMAAVYTIALRYTRTSDKELYFSTTAVCITEVIKLLLSVGILAKETGSLGRFKASLRENVLGSPKELLKLSVPSLVYAVQNNMAFLALSNLDAAVYQVTYQLKIPCTALCTVLMLNRTLSKLQWVSVFMLCAGVTLVQWKPAQATKVVVEQNPLLGFGAIAIAVLCSGFAGVYFEKVLKSSDTSLWVRNIQMYLSGIIVTLAGVYLSDGAEIKEKGFFYGYTYYVWFVIFLASVGGLYTSVVVKYTDNIMKGFSAAAAIVLSTIASVMLFGLQITLTFALGTLLVCVSIYLYGLPRQDTTSIQQGETASKERVIGVMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:386)

CMP-SaTr::PylRS(AF)EWSR1::4xλ_N22

DNA:

ATGGCTGCCCCGAGAGACAATGTCACTTTATTATTCAAGTTATACTGCTTGGCAGTGATGACCCTGATGGCTGCAGTCTATACCATAGCTTTAAGATACACAAGGACATCAGACAAAGAACTCTACTTTTCAACCACAGCCGTGTGTATCACAGAAGTTATAAAGTTATTGCTAAGTGTGGGAATTTTAGCTAAAGAAACTGGTAGTCTGGGTAGATTCAAAGCATCTTTAAGAGAAAATGTCTTGGGGAGCCCCAAGGAACTGTTGAAGTTAAGTGTGCCATCGTTAGTGTATGCTGTTCAGAACAACATGGCTTTCCTAGCTCTTAGCAATCTGGATGCAGCAGTGTACCAGGTGACCTACCAGTTGAAGATTCCGTGTACTGCTTTATGCACTGTTTTAATGTTAAACCGGACACTCAGCAAATTACAGTGGGTTTCAGTTTTTATGCTGTGTGCTGGAGTTACGCTTGTACAGTGGAAACCAGCCCAAGCTACAAAAGTGGTGGTGGAACAAAATCCATTATTAGGGTTTGGCGCTATAGCTATTGCTGTATTGTGCTCAGGATTTGCAGGAGTATATTTTGAAAAAGTTTTAAAGAGTTCAGATACTTCTCTTTGGGTGAGAAACATTCAAATGTATCTATCAGGGATTATTGTGACATTAGCTGGCGTCTACTTGTCAGATGGAGCTGAAATTAAAGAAAAAGGATTTTTCTATGGTTACACATATTATGTCTGGTTTGTCATCTTTCTTGCAAGTGTTGGTGGCCTCTACACTTCTGTTGTGGTTAAGTACACAGACAATATCATGAAAGGCTTTTCTGCAGCAGCGGCCATTGTCCTTTCCACCATTGCTTCAGTAATGCTGTTTGGATTACAGATAACACTTACCTTTGCCCTGGGTACTCTTCTTGTATGTGTTTCCATATATCTCTATGGATTACCCAGACAAGACACTACATCCATCCAACAAGGAGAAACAGCTTCAAAGGAGAGAGTTATTGGTGTGATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCAGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTTAA(SEQ ID NO:387)

蛋白:

MAAPRDNVTLLFKLYCLAVMTLMAAVYTIALRYTRTSDKELYFSTTAVCITEVIKLLLSVGILAKETGSLGRFKASLRENVLGSPKELLKLSVPSLVYAVQNNMAFLALSNLDAAVYQVTYQLKIPCTALCTVLMLNRTLSKLQWVSVFMLCAGVTLVQWKPAQATKVVVEQNPLLGFGAIAIAVLCSGFAGVYFEKVLKSSDTSLWVRNIQMYLSGIIVTLAGVYLSDGAEIKEKGFFYGYTYYVWFVIFLASVGGLYTSVVVKYTDNIMKGFSAAAAIVLSTIASVMLFGLQITLTFALGTLLVCVSIYLYGLPRQDTTSIQQGETASKERVIGVMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAGAPGSAGSAAGSGEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPV＊(SEQ ID NO:388)

CMP-SaTr::FUS::PylRS(AF)

DNA:

ATGGCTGCCCCGAGAGACAATGTCACTTTATTATTCAAGTTATACTGCTTGGCAGTGATGACCCTGATGGCTGCAGTCTATACCATAGCTTTAAGATACACAAGGACATCAGACAAAGAACTCTACTTTTCAACCACAGCCGTGTGTATCACAGAAGTTATAAAGTTATTGCTAAGTGTGGGAATTTTAGCTAAAGAAACTGGTAGTCTGGGTAGATTCAAAGCATCTTTAAGAGAAAATGTCTTGGGGAGCCCCAAGGAACTGTTGAAGTTAAGTGTGCCATCGTTAGTGTATGCTGTTCAGAACAACATGGCTTTCCTAGCTCTTAGCAATCTGGATGCAGCAGTGTACCAGGTGACCTACCAGTTGAAGATTCCGTGTACTGCTTTATGCACTGTTTTAATGTTAAACCGGACACTCAGCAAATTACAGTGGGTTTCAGTTTTTATGCTGTGTGCTGGAGTTACGCTTGTACAGTGGAAACCAGCCCAAGCTACAAAAGTGGTGGTGGAACAAAATCCATTATTAGGGTTTGGCGCTATAGCTATTGCTGTATTGTGCTCAGGATTTGCAGGAGTATATTTTGAAAAAGTTTTAAAGAGTTCAGATACTTCTCTTTGGGTGAGAAACATTCAAATGTATCTATCAGGGATTATTGTGACATTAGCTGGCGTCTACTTGTCAGATGGAGCTGAAATTAAAGAAAAAGGATTTTTCTATGGTTACACATATTATGTCTGGTTTGTCATCTTTCTTGCAAGTGTTGGTGGCCTCTACACTTCTGTTGTGGTTAAGTACACAGACAATATCATGAAAGGCTTTTCTGCAGCAGCGGCCATTGTCCTTTCCACCATTGCTTCAGTAATGCTGTTTGGATTACAGATAACACTTACCTTTGCCCTGGGTACTCTTCTTGTATGTGTTTCCATATATCTCTATGGATTACCCAGACAAGACACTACATCCATCCAACAAGGAGAAACAGCTTCAAAGGAGAGAGTTATTGGTGTGGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:389)

蛋白:

MAAPRDNVTLLFKLYCLAVMTLMAAVYTIALRYTRTSDKELYFSTTAVCITEVIKLLLSVGILAKETGSLGRFKASLRENVLGSPKELLKLSVPSLVYAVQNNMAFLALSNLDAAVYQVTYQLKIPCTALCTVLMLNRTLSKLQWVSVFMLCAGVTLVQWKPAQATKVVVEQNPLLGFGAIAIAVLCSGFAGVYFEKVLKSSDTSLWVRNIQMYLSGIIVTLAGVYLSDGAEIKEKGFFYGYTYYVWFVIFLASVGGLYTSVVVKYTDNIMKGFSAAAAIVLSTIASVMLFGLQITLTFALGTLLVCVSIYLYGLPRQDTTSIQQGETASKERVIGVGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:390)

P450 2C1_1-27::PylRS(AF)

DNA:

ATGGACCCCGTGGTCGTGCTGGGCCTGTGCCTGTCATGCCTGCTGCTGCTGAGCCTGTGGAAGCAGAGCTACGGCGGAGGCGCGATCGCAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQID NO:391)

蛋白:

MDPVVVLGLCLSCLLLLSLWKQSYGGGAIAGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:392)

P450 2C1_1-27::MCP

DNA:

ATGGACCCCGTGGTCGTGCTGGGCCTGTGCCTGTCATGCCTGCTGCTGCTGAGCCTGTGGAAGCAGAGCTACGGCGGAGGCGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:393)

蛋白:

MDPVVVLGLCLSCLLLLSLWKQSYGGGAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:394)

P450 2C1_1-27::FUS::PylRS(AF)

DNA:

ATGGACCCCGTGGTCGTGCTGGGCCTGTGCCTGTCATGCCTGCTGCTGCTGAGCCTGTGGAAGCAGAGCTACGGCGGAGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:395)

蛋白:

MDPVVVLGLCLSCLLLLSLWKQSYGGGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:396)

P450 2C1_1-27::EWSR1::MCP

DNA:

ATGGACCCCGTGGTCGTGCTGGGCCTGTGCCTGTCATGCCTGCTGCTGCTGAGCCTGTGGAAGCAGAGCTACGGCGGAGGCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:397)

蛋白:

MDPVVVLGLCLSCLLLLSLWKQSYGGGMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:398)

P450 2C1_1-27::FUS::MCP::PylRS(AF)

DNA:

ATGGACCCCGTGGTCGTGCTGGGCCTGTGCCTGTCATGCCTGCTGCTGCTGAGCCTGTGGAAGCAGAGCTACGGCGGAGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:399)

蛋白:

MDPVVVLGLCLSCLLLLSLWKQSYGGGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:400)

P450 2C1_1-29::FUS::MCP::PylRS(AF)

DNA:

ATGGACCCCGTGGTCGTGCTGGGCCTGTGCCTGTCATGCCTGCTGCTGCTGAGCCTGTGGAAGCAGAGCTACGGCGGAGGCAAGCTGATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:401)

蛋白:

MDPVVVLGLCLSCLLLLSLWKQSYGGGKLMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:402)

EB1::PylRS(AF)

DNA:ATGGCAGTGAACGTATACTCAACGTCAGTGACCAGTGATAACCTAAGTCGACATGACATGCTGGCCTGGATCAATGAGTCTCTGCAGTTGAATCTGACAAAGATCGAACAGTTGTGCTCAGGGGCTGCGTATTGTCAGTTTATGGACATGCTGTTCCCTGGCTCCATTGCCTTGAAGAAAGTGAAATTCCAAGCTAAGCTAGAACACGAGTACATCCAGAACTTCAAAATACTACAAGCAGGTTTTAAGAGAATGGGTGTTGACAAAATAATTCCTGTGGACAAATTAGTAAAAGGAAAGTTTCAGGACAATTTTGAATTCGTTCAGTGGTTCAAGAAGTTTTTCGATGCAAACTATGATGGAAAAGACTATGACCCTGTGGCTGCCAGACAAGGTCAAGAAACTGCAGTGGCTCCTTCCCTTGTTGCTCCAGCTCTGAATAAACCGAAGAAACCTCTCACTTCTAGCAGTGCAGCTCCCCAGAGGCCCATCTCAACACAGAGAACCGCTGCGGCTCCTAAGGCTGGCCCTGGTGTGGTGCGAAAGAACCCTGGTGTGGGCAACGGAGATGACGAGGCAGCTGAGTTGATGCAGCAGGTCAACGTATTGAAACTTACTGTTGAAGACTTGGAGAAAGAGAGGGATTTCTACTTCGGAAAGCTACGGAACATTGAATTGATTTGCCAGGAGAACGAGGGGGAAAACGACCCTGTATTGCAGAGGATTGTAGACATTCTGTATGCCACAGATGAAGGCTTTGTGATACCTGATGAAGGGGGCCCACAGGAGGAGCAAGAAGAGTATGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:403)

蛋白:

MAVNVYSTSVTSDNLSRHDMLAWINESLQLNLTKIEQLCSGAAYCQFMDMLFPGSIALKKVKFQAKLEHEYIQNFKILQAGFKRMGVDKIIPVDKLVKGKFQDNFEFVQWFKKFFDANYDGKDYDPVAARQGQETAVAPSLVAPALNKPKKPLTSSSAAPQRPISTQRTAAAPKAGPGVVRKNPGVGNGDDEAAELMQQVNVLKLTVEDLEKERDFYFGKLRNIELICQENEGENDPVLQRIVDILYATDEGFVIPDEGGPQEEQEEYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:404)

EB1::PylRS(AA)

DNA:

ATGGCAGTGAACGTATACTCAACGTCAGTGACCAGTGATAACCTAAGTCGACATGACATGCTGGCCTGGATCAATGAGTCTCTGCAGTTGAATCTGACAAAGATCGAACAGTTGTGCTCAGGGGCTGCGTATTGTCAGTTTATGGACATGCTGTTCCCTGGCTCCATTGCCTTGAAGAAAGTGAAATTCCAAGCTAAGCTAGAACACGAGTACATCCAGAACTTCAAAATACTACAAGCAGGTTTTAAGAGAATGGGTGTTGACAAAATAATTCCTGTGGACAAATTAGTAAAAGGAAAGTTTCAGGACAATTTTGAATTCGTTCAGTGGTTCAAGAAGTTTTTCGATGCAAACTATGATGGAAAAGACTATGACCCTGTGGCTGCCAGACAAGGTCAAGAAACTGCAGTGGCTCCTTCCCTTGTTGCTCCAGCTCTGAATAAACCGAAGAAACCTCTCACTTCTAGCAGTGCAGCTCCCCAGAGGCCCATCTCAACACAGAGAACCGCTGCGGCTCCTAAGGCTGGCCCTGGTGTGGTGCGAAAGAACCCTGGTGTGGGCAACGGAGATGACGAGGCAGCTGAGTTGATGCAGCAGGTCAACGTATTGAAACTTACTGTTGAAGACTTGGAGAAAGAGAGGGATTTCTACTTCGGAAAGCTACGGAACATTGAATTGATTTGCCAGGAGAACGAGGGGGAAAACGACCCTGTATTGCAGAGGATTGTAGACATTCTGTATGCCACAGATGAAGGCTTTGTGATACCTGATGAAGGGGGCCCACAGGAGGAGCAAGAAGAGTATGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:405)

蛋白:

MAVNVYSTSVTSDNLSRHDMLAWINESLQLNLTKIEQLCSGAAYCQFMDMLFPGSIALKKVKFQAKLEHEYIQNFKILQAGFKRMGVDKIIPVDKLVKGKFQDNFEFVQWFKKFFDANYDGKDYDPVAARQGQETAVAPSLVAPALNKPKKPLTSSSAAPQRPISTQRTAAAPKAGPGVVRKNPGVGNGDDEAAELMQQVNVLKLTVEDLEKERDFYFGKLRNIELICQENEGENDPVLQRIVDILYATDEGFVIPDEGGPQEEQEEYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:406)

EB1::PylRS(AAAF)

DNA:

ATGGCAGTGAACGTATACTCAACGTCAGTGACCAGTGATAACCTAAGTCGACATGACATGCTGGCCTGGATCAATGAGTCTCTGCAGTTGAATCTGACAAAGATCGAACAGTTGTGCTCAGGGGCTGCGTATTGTCAGTTTATGGACATGCTGTTCCCTGGCTCCATTGCCTTGAAGAAAGTGAAATTCCAAGCTAAGCTAGAACACGAGTACATCCAGAACTTCAAAATACTACAAGCAGGTTTTAAGAGAATGGGTGTTGACAAAATAATTCCTGTGGACAAATTAGTAAAAGGAAAGTTTCAGGACAATTTTGAATTCGTTCAGTGGTTCAAGAAGTTTTTCGATGCAAACTATGATGGAAAAGACTATGACCCTGTGGCTGCCAGACAAGGTCAAGAAACTGCAGTGGCTCCTTCCCTTGTTGCTCCAGCTCTGAATAAACCGAAGAAACCTCTCACTTCTAGCAGTGCAGCTCCCCAGAGGCCCATCTCAACACAGAGAACCGCTGCGGCTCCTAAGGCTGGCCCTGGTGTGGTGCGAAAGAACCCTGGTGTGGGCAACGGAGATGACGAGGCAGCTGAGTTGATGCAGCAGGTCAACGTATTGAAACTTACTGTTGAAGACTTGGAGAAAGAGAGGGATTTCTACTTCGGAAAGCTACGGAACATTGAATTGATTTGCCAGGAGAACGAGGGGGAAAACGACCCTGTATTGCAGAGGATTGTAGACATTCTGTATGCCACAGATGAAGGCTTTGTGATACCTGATGAAGGGGGCCCACAGGAGGAGCAAGAAGAGTATGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:407)

蛋白:

MAVNVYSTSVTSDNLSRHDMLAWINESLQLNLTKIEQLCSGAAYCQFMDMLFPGSIALKKVKFQAKLEHEYIQNFKILQAGFKRMGVDKIIPVDKLVKGKFQDNFEFVQWFKKFFDANYDGKDYDPVAARQGQETAVAPSLVAPALNKPKKPLTSSSAAPQRPISTQRTAAAPKAGPGVVRKNPGVGNGDDEAAELMQQVNVLKLTVEDLEKERDFYFGKLRNIELICQENEGENDPVLQRIVDILYATDEGFVIPDEGGPQEEQEEYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:408)

EB1::FUS::PylRS(AA)

DNA:

ATGGCAGTGAACGTATACTCAACGTCAGTGACCAGTGATAACCTAAGTCGACATGACATGCTGGCCTGGATCAATGAGTCTCTGCAGTTGAATCTGACAAAGATCGAACAGTTGTGCTCAGGGGCTGCGTATTGTCAGTTTATGGACATGCTGTTCCCTGGCTCCATTGCCTTGAAGAAAGTGAAATTCCAAGCTAAGCTAGAACACGAGTACATCCAGAACTTCAAAATACTACAAGCAGGTTTTAAGAGAATGGGTGTTGACAAAATAATTCCTGTGGACAAATTAGTAAAAGGAAAGTTTCAGGACAATTTTGAATTCGTTCAGTGGTTCAAGAAGTTTTTCGATGCAAACTATGATGGAAAAGACTATGACCCTGTGGCTGCCAGACAAGGTCAAGAAACTGCAGTGGCTCCTTCCCTTGTTGCTCCAGCTCTGAATAAACCGAAGAAACCTCTCACTTCTAGCAGTGCAGCTCCCCAGAGGCCCATCTCAACACAGAGAACCGCTGCGGCTCCTAAGGCTGGCCCTGGTGTGGTGCGAAAGAACCCTGGTGTGGGCAACGGAGATGACGAGGCAGCTGAGTTGATGCAGCAGGTCAACGTATTGAAACTTACTGTTGAAGACTTGGAGAAAGAGAGGGATTTCTACTTCGGAAAGCTACGGAACATTGAATTGATTTGCCAGGAGAACGAGGGGGAAAACGACCCTGTATTGCAGAGGATTGTAGACATTCTGTATGCCACAGATGAAGGCTTTGTGATACCTGATGAAGGGGGCCCACAGGAGGAGCAAGAAGAGTATGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:409)

蛋白:

MAVNVYSTSVTSDNLSRHDMLAWINESLQLNLTKIEQLCSGAAYCQFMDMLFPGSIALKKVKFQAKLEHEYIQNFKILQAGFKRMGVDKIIPVDKLVKGKFQDNFEFVQWFKKFFDANYDGKDYDPVAARQGQETAVAPSLVAPALNKPKKPLTSSSAAPQRPISTQRTAAAPKAGPGVVRKNPGVGNGDDEAAELMQQVNVLKLTVEDLEKERDFYFGKLRNIELICQENEGENDPVLQRIVDILYATDEGFVIPDEGGPQEEQEEYGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:410)

EB1::FUS::PylRS(AAAF)

DNA:

ATGGCAGTGAACGTATACTCAACGTCAGTGACCAGTGATAACCTAAGTCGACATGACATGCTGGCCTGGATCAATGAGTCTCTGCAGTTGAATCTGACAAAGATCGAACAGTTGTGCTCAGGGGCTGCGTATTGTCAGTTTATGGACATGCTGTTCCCTGGCTCCATTGCCTTGAAGAAAGTGAAATTCCAAGCTAAGCTAGAACACGAGTACATCCAGAACTTCAAAATACTACAAGCAGGTTTTAAGAGAATGGGTGTTGACAAAATAATTCCTGTGGACAAATTAGTAAAAGGAAAGTTTCAGGACAATTTTGAATTCGTTCAGTGGTTCAAGAAGTTTTTCGATGCAAACTATGATGGAAAAGACTATGACCCTGTGGCTGCCAGACAAGGTCAAGAAACTGCAGTGGCTCCTTCCCTTGTTGCTCCAGCTCTGAATAAACCGAAGAAACCTCTCACTTCTAGCAGTGCAGCTCCCCAGAGGCCCATCTCAACACAGAGAACCGCTGCGGCTCCTAAGGCTGGCCCTGGTGTGGTGCGAAAGAACCCTGGTGTGGGCAACGGAGATGACGAGGCAGCTGAGTTGATGCAGCAGGTCAACGTATTGAAACTTACTGTTGAAGACTTGGAGAAAGAGAGGGATTTCTACTTCGGAAAGCTACGGAACATTGAATTGATTTGCCAGGAGAACGAGGGGGAAAACGACCCTGTATTGCAGAGGATTGTAGACATTCTGTATGCCACAGATGAAGGCTTTGTGATACCTGATGAAGGGGGCCCACAGGAGGAGCAAGAAGAGTATGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:411)

蛋白:

MAVNVYSTSVTSDNLSRHDMLAWINESLQLNLTKIEQLCSGAAYCQFMDMLFPGSIALKKVKFQAKLEHEYIQNFKILQAGFKRMGVDKIIPVDKLVKGKFQDNFEFVQWFKKFFDANYDGKDYDPVAARQGQETAVAPSLVAPALNKPKKPLTSSSAAPQRPISTQRTAAAPKAGPGVVRKNPGVGNGDDEAAELMQQVNVLKLTVEDLEKERDFYFGKLRNIELICQENEGENDPVLQRIVDILYATDEGFVIPDEGGPQEEQEEYGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:412)

EB1::MCP

DNA:

ATGGCAGTGAACGTATACTCAACGTCAGTGACCAGTGATAACCTAAGTCGACATGACATGCTGGCCTGGATCAATGAGTCTCTGCAGTTGAATCTGACAAAGATCGAACAGTTGTGCTCAGGGGCTGCGTATTGTCAGTTTATGGACATGCTGTTCCCTGGCTCCATTGCCTTGAAGAAAGTGAAATTCCAAGCTAAGCTAGAACACGAGTACATCCAGAACTTCAAAATACTACAAGCAGGTTTTAAGAGAATGGGTGTTGACAAAATAATTCCTGTGGACAAATTAGTAAAAGGAAAGTTTCAGGACAATTTTGAATTCGTTCAGTGGTTCAAGAAGTTTTTCGATGCAAACTATGATGGAAAAGACTATGACCCTGTGGCTGCCAGACAAGGTCAAGAAACTGCAGTGGCTCCTTCCCTTGTTGCTCCAGCTCTGAATAAACCGAAGAAACCTCTCACTTCTAGCAGTGCAGCTCCCCAGAGGCCCATCTCAACACAGAGAACCGCTGCGGCTCCTAAGGCTGGCCCTGGTGTGGTGCGAAAGAACCCTGGTGTGGGCAACGGAGATGACGAGGCAGCTGAGTTGATGCAGCAGGTCAACGTATTGAAACTTACTGTTGAAGACTTGGAGAAAGAGAGGGATTTCTACTTCGGAAAGCTACGGAACATTGAATTGATTTGCCAGGAGAACGAGGGGGAAAACGACCCTGTATTGCAGAGGATTGTAGACATTCTGTATGCCACAGATGAAGGCTTTGTGATACCTGATGAAGGGGGCCCACAGGAGGAGCAAGAAGAGTATGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:413)

蛋白:

MAVNVYSTSVTSDNLSRHDMLAWINESLQLNLTKIEQLCSGAAYCQFMDMLFPGSIALKKVKFQAKLEHEYIQNFKILQAGFKRMGVDKIIPVDKLVKGKFQDNFEFVQWFKKFFDANYDGKDYDPVAARQGQETAVAPSLVAPALNKPKKPLTSSSAAPQRPISTQRTAAAPKAGPGVVRKNPGVGNGDDEAAELMQQVNVLKLTVEDLEKERDFYFGKLRNIELICQENEGENDPVLQRIVDILYATDEGFVIPDEGGPQEEQEEYAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:414)

EB1::EWSR1::MCP

DNA:

ATGGCAGTGAACGTATACTCAACGTCAGTGACCAGTGATAACCTAAGTCGACATGACATGCTGGCCTGGATCAATGAGTCTCTGCAGTTGAATCTGACAAAGATCGAACAGTTGTGCTCAGGGGCTGCGTATTGTCAGTTTATGGACATGCTGTTCCCTGGCTCCATTGCCTTGAAGAAAGTGAAATTCCAAGCTAAGCTAGAACACGAGTACATCCAGAACTTCAAAATACTACAAGCAGGTTTTAAGAGAATGGGTGTTGACAAAATAATTCCTGTGGACAAATTAGTAAAAGGAAAGTTTCAGGACAATTTTGAATTCGTTCAGTGGTTCAAGAAGTTTTTCGATGCAAACTATGATGGAAAAGACTATGACCCTGTGGCTGCCAGACAAGGTCAAGAAACTGCAGTGGCTCCTTCCCTTGTTGCTCCAGCTCTGAATAAACCGAAGAAACCTCTCACTTCTAGCAGTGCAGCTCCCCAGAGGCCCATCTCAACACAGAGAACCGCTGCGGCTCCTAAGGCTGGCCCTGGTGTGGTGCGAAAGAACCCTGGTGTGGGCAACGGAGATGACGAGGCAGCTGAGTTGATGCAGCAGGTCAACGTATTGAAACTTACTGTTGAAGACTTGGAGAAAGAGAGGGATTTCTACTTCGGAAAGCTACGGAACATTGAATTGATTTGCCAGGAGAACGAGGGGGAAAACGACCCTGTATTGCAGAGGATTGTAGACATTCTGTATGCCACAGATGAAGGCTTTGTGATACCTGATGAAGGGGGCCCACAGGAGGAGCAAGAAGAGTATATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:415)

蛋白:

MAVNVYSTSVTSDNLSRHDMLAWINESLQLNLTKIEQLCSGAAYCQFMDMLFPGSIALKKVKFQAKLEHEYIQNFKILQAGFKRMGVDKIIPVDKLVKGKFQDNFEFVQWFKKFFDANYDGKDYDPVAARQGQETAVAPSLVAPALNKPKKPLTSSSAAPQRPISTQRTAAAPKAGPGVVRKNPGVGNGDDEAAELMQQVNVLKLTVEDLEKERDFYFGKLRNIELICQENEGENDPVLQRIVDILYATDEGFVIPDEGGPQEEQEEYMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:416)

EB1::EWSR1::4xλ_N22

DNA:

ATGGCAGTGAACGTATACTCAACGTCAGTGACCAGTGATAACCTAAGTCGACATGACATGCTGGCCTGGATCAATGAGTCTCTGCAGTTGAATCTGACAAAGATCGAACAGTTGTGCTCAGGGGCTGCGTATTGTCAGTTTATGGACATGCTGTTCCCTGGCTCCATTGCCTTGAAGAAAGTGAAATTCCAAGCTAAGCTAGAACACGAGTACATCCAGAACTTCAAAATACTACAAGCAGGTTTTAAGAGAATGGGTGTTGACAAAATAATTCCTGTGGACAAATTAGTAAAAGGAAAGTTTCAGGACAATTTTGAATTCGTTCAGTGGTTCAAGAAGTTTTTCGATGCAAACTATGATGGAAAAGACTATGACCCTGTGGCTGCCAGACAAGGTCAAGAAACTGCAGTGGCTCCTTCCCTTGTTGCTCCAGCTCTGAATAAACCGAAGAAACCTCTCACTTCTAGCAGTGCAGCTCCCCAGAGGCCCATCTCAACACAGAGAACCGCTGCGGCTCCTAAGGCTGGCCCTGGTGTGGTGCGAAAGAACCCTGGTGTGGGCAACGGAGATGACGAGGCAGCTGAGTTGATGCAGCAGGTCAACGTATTGAAACTTACTGTTGAAGACTTGGAGAAAGAGAGGGATTTCTACTTCGGAAAGCTACGGAACATTGAATTGATTTGCCAGGAGAACGAGGGGGAAAACGACCCTGTATTGCAGAGGATTGTAGACATTCTGTATGCCACAGATGAAGGCTTTGTGATACCTGATGAAGGGGGCCCACAGGAGGAGCAAGAAGAGTATATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCAGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTTAA(SEQ ID NO:417)

蛋白:

MAVNVYSTSVTSDNLSRHDMLAWINESLQLNLTKIEQLCSGAAYCQFMDMLFPGSIALKKVKFQAKLEHEYIQNFKILQAGFKRMGVDKIIPVDKLVKGKFQDNFEFVQWFKKFFDANYDGKDYDPVAARQGQETAVAPSLVAPALNKPKKPLTSSSAAPQRPISTQRTAAAPKAGPGVVRKNPGVGNGDDEAAELMQQVNVLKLTVEDLEKERDFYFGKLRNIELICQENEGENDPVLQRIVDILYATDEGFVIPDEGGPQEEQEEYMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAGAPGSAGSAAGSGEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPV＊(SEQ ID NO:418)

EB1::FUS::PylRS(AF)

DNA:

ATGGCAGTGAACGTATACTCAACGTCAGTGACCAGTGATAACCTAAGTCGACATGACATGCTGGCCTGGATCAATGAGTCTCTGCAGTTGAATCTGACAAAGATCGAACAGTTGTGCTCAGGGGCTGCGTATTGTCAGTTTATGGACATGCTGTTCCCTGGCTCCATTGCCTTGAAGAAAGTGAAATTCCAAGCTAAGCTAGAACACGAGTACATCCAGAACTTCAAAATACTACAAGCAGGTTTTAAGAGAATGGGTGTTGACAAAATAATTCCTGTGGACAAATTAGTAAAAGGAAAGTTTCAGGACAATTTTGAATTCGTTCAGTGGTTCAAGAAGTTTTTCGATGCAAACTATGATGGAAAAGACTATGACCCTGTGGCTGCCAGACAAGGTCAAGAAACTGCAGTGGCTCCTTCCCTTGTTGCTCCAGCTCTGAATAAACCGAAGAAACCTCTCACTTCTAGCAGTGCAGCTCCCCAGAGGCCCATCTCAACACAGAGAACCGCTGCGGCTCCTAAGGCTGGCCCTGGTGTGGTGCGAAAGAACCCTGGTGTGGGCAACGGAGATGACGAGGCAGCTGAGTTGATGCAGCAGGTCAACGTATTGAAACTTACTGTTGAAGACTTGGAGAAAGAGAGGGATTTCTACTTCGGAAAGCTACGGAACATTGAATTGATTTGCCAGGAGAACGAGGGGGAAAACGACCCTGTATTGCAGAGGATTGTAGACATTCTGTATGCCACAGATGAAGGCTTTGTGATACCTGATGAAGGGGGCCCACAGGAGGAGCAAGAAGAGTATGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:419)

蛋白:

MAVNVYSTSVTSDNLSRHDMLAWINESLQLNLTKIEQLCSGAAYCQFMDMLFPGSIALKKVKFQAKLEHEYIQNFKILQAGFKRMGVDKIIPVDKLVKGKFQDNFEFVQWFKKFFDANYDGKDYDPVAARQGQETAVAPSLVAPALNKPKKPLTSSSAAPQRPISTQRTAAAPKAGPGVVRKNPGVGNGDDEAAELMQQVNVLKLTVEDLEKERDFYFGKLRNIELICQENEGENDPVLQRIVDILYATDEGFVIPDEGGPQEEQEEYGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:420)

EB1::FUS::MCP::PylRS(AF)

DNA:

ATGGCAGTGAACGTATACTCAACGTCAGTGACCAGTGATAACCTAAGTCGACATGACATGCTGGCCTGGATCAATGAGTCTCTGCAGTTGAATCTGACAAAGATCGAACAGTTGTGCTCAGGGGCTGCGTATTGTCAGTTTATGGACATGCTGTTCCCTGGCTCCATTGCCTTGAAGAAAGTGAAATTCCAAGCTAAGCTAGAACACGAGTACATCCAGAACTTCAAAATACTACAAGCAGGTTTTAAGAGAATGGGTGTTGACAAAATAATTCCTGTGGACAAATTAGTAAAAGGAAAGTTTCAGGACAATTTTGAATTCGTTCAGTGGTTCAAGAAGTTTTTCGATGCAAACTATGATGGAAAAGACTATGACCCTGTGGCTGCCAGACAAGGTCAAGAAACTGCAGTGGCTCCTTCCCTTGTTGCTCCAGCTCTGAATAAACCGAAGAAACCTCTCACTTCTAGCAGTGCAGCTCCCCAGAGGCCCATCTCAACACAGAGAACCGCTGCGGCTCCTAAGGCTGGCCCTGGTGTGGTGCGAAAGAACCCTGGTGTGGGCAACGGAGATGACGAGGCAGCTGAGTTGATGCAGCAGGTCAACGTATTGAAACTTACTGTTGAAGACTTGGAGAAAGAGAGGGATTTCTACTTCGGAAAGCTACGGAACATTGAATTGATTTGCCAGGAGAACGAGGGGGAAAACGACCCTGTATTGCAGAGGATTGTAGACATTCTGTATGCCACAGATGAAGGCTTTGTGATACCTGATGAAGGGGGCCCACAGGAGGAGCAAGAAGAGTATGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:421)

蛋白:

MAVNVYSTSVTSDNLSRHDMLAWINESLQLNLTKIEQLCSGAAYCQFMDMLFPGSIALKKVKFQAKLEHEYIQNFKILQAGFKRMGVDKIIPVDKLVKGKFQDNFEFVQWFKKFFDANYDGKDYDPVAARQGQETAVAPSLVAPALNKPKKPLTSSSAAPQRPISTQRTAAAPKAGPGVVRKNPGVGNGDDEAAELMQQVNVLKLTVEDLEKERDFYFGKLRNIELICQENEGENDPVLQRIVDILYATDEGFVIPDEGGPQEEQEEYGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:422)

TOM20::FUS::PCP::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGATCGAAGGCCGCCATATGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTGCGGATCCGCTAGCCGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:423)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGKPIPNPLLGLDSTGAPGSAGSAAGSGASIEQKLISEEDLIEGRHMLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRADPLAGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:424)

TOM20::FUS::2xPCP::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGATCGAAGGCCGCCATATGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTGCGGATCCGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTCCACCGGTCGCCACCGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:425)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGKPIPNPLLGLDSTGAPGSAGSAAGSGASIEQKLISEEDLIEGRHMLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRADPLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRPPVATGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:426)

TOM20::FUS::4xλ_N22::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:427)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGKPIPNPLLGLDSTGAPGSAGSAAGSGASIEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPVGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:428)

LCK::FUS::2xPCP::CbzRS

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGATCGAAGGCCGCCATATGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTGCGGATCCGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTCCACCGGTCGCCACCGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATCTGATGAACTATGGACGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTACACAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:429)

蛋白:

MGCVCSSNPEGTELASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGASIEQKLISEEDLIEGRHMLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRADPLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRPPVATGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLMNYGRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFTQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ IDNO:430)

LCK::FUS::PCP::CbzRS

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGATCGAAGGCCGCCATATGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTGCGGATCCGCTAGCCGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATCTGATGAACTATGGACGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTACACAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:431)

蛋白:

MGCVCSSNPEGTELASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGASIEQKLISEEDLIEGRHMLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRADPLAGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLMNYGRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFTQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:432)

TOM20::FUS::CbzRS

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGATCGAAGGCCGCCATATGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTGCGGATCCGCTAGCCGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATCTGATGAACTATGGACGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTACACAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:433)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGKPIPNPLLGLDSTGAPGSAGSAAGSGASIEQKLISEEDLIEGRHMLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRADPLAGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLMNYGRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFTQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:434)

TOM20::FUS::2xPCP::CbzRS

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGATCGAAGGCCGCCATATGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTGCGGATCCGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTCCACCGGTCGCCACCGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATCTGATGAACTATGGACGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTACACAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:435)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGKPIPNPLLGLDSTGAPGSAGSAAGSGASIEQKLISEEDLIEGRHMLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRADPLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRPPVATGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLMNYGRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFTQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:436)

TOM20::FUS::4xλ_N22::CbzRS

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATCTGATGAACTATGGACGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTACACAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:437)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGKPIPNPLLGLDSTGAPGSAGSAAGSGASIEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPVGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLMNYGRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFTQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:438)

EBAG9_1-29::FUS::PCP::PylRS(AF)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGATCGAAGGCCGCCATATGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTGCGGATCCGCTAGCCGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:439)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGASIEQKLISEEDLIEGRHMLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRADPLAGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:440)

EBAG9_1-29::FUS::4xλ_N22::IFRS1

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATATGCTGAACTATAGCCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGTCTTTTATGCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:441)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGASIEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPVGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNMLNYSRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLSFMQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:442)

KIF16B::EWSR1::Myc::2xPCP

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACAATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCAGAGCAGAAGCTGATCTCAGAGGAGGACCTGATCGAAGGCCGCCATATGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTGCGGATCCGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTCCACCGGTCGCCACCTAA(SEQ ID NO:443)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAEQKLISEEDLIEGRHMLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRADPLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRPPVAT＊(SEQ ID NO:444)

KIF16B::EWSR1::HA::2xPCP

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACAATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCATACCCCTACGACGTGCCCGACTACGCCATCGAAGGCCGCCATATGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTGCGGATCCGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTCCACCGGTCGCCACCTAA(SEQ ID NO:445)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAYPYDVPDYAIEGRHMLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRADPLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRPPVAT＊(SEQ ID NO:446)

EBAG9_1-29::EWSR1::Myc::2xPCP

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCAGAGCAGAAGCTGATCTCAGAGGAGGACCTGATCGAAGGCCGCCATATGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTGCGGATCCGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTCCACCGGTCGCCACCTAA(SEQ ID NO:447)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAEQKLISEEDLIEGRHMLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRADPLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRPPVAT＊(SEQ ID NO:448)

EBAG9_1-29::EWSR1::HA::2xPCP

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCATACCCCTACGACGTGCCCGACTACGCCATCGAAGGCCGCCATATGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTGCGGATCCGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTCCACCGGTCGCCACCTAA(SEQ ID NO:449)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAYPYDVPDYAIEGRHMLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRADPLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRPPVAT＊(SEQ ID NO:450)

LCK::CbzRS

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATCTGATGAACTATGGACGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTACACAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:451)

蛋白:

MGCVCSSNPEGTELACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLMNYGRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFTQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:452)

LCK::FUS::CbzRS

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATCTGATGAACTATGGACGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTACACAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:453)

蛋白:

MGCVCSSNPEGTELASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGAPGSAGSAAGSGMACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLMNYGRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFTQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQID NO:454)

TOM20::FUS::SYNZIP1::CpkRS

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTTCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:455)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLSPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:456)

KIF16B::FUS::CbzRS

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATCTGATGAACTATGGACGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTACACAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:457)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTYTDIEMNRLGKGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLMNYGRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFTQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:458)

EBAG9_1-29::FUS::CpkRS

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTTCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:459)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLSPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:460)

TOM20::FUS::CbzRS

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATCTGATGAACTATGGACGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTACACAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:461)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLMNYGRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFTQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ IDNO:462)

EBAG9_1-29::FUS::CbzRS

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATCTGATGAACTATGGACGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTACACAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:463)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLMNYGRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFTQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:464)

TOM20::FUS::SYNZIP1::CbzRS

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATCTGATGAACTATGGACGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTACACAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:465)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLMNYGRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFTQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:466)

KIF16B::FUS::CpkRS

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTTCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:467)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTYTDIEMNRLGKGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLSPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:468)

LCK::FUS::CpkRS

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTTCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:469)

蛋白:

MGCVCSSNPEGTELASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGAPGSAGSAAGSGMACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLSPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQID NO:470)

LCK::CpkRS

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTTCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:471)

蛋白:

MGCVCSSNPEGTELACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLSPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:472)

TOM20::FUS::SYNZIP3::CbzRS

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATCTGATGAACTATGGACGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTACACAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:473)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLMNYGRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFTQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:474)

TOM20::FUS::SYNZIP3::CpkRS

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTTCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:475)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLSPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:476)

TOM20::EWSR1::PylRS(AA)::FUS::PylRS(AA)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAGTTCTTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGGCTAAGCCCCGACCGCGTTAGAGCCGTATCCCACTGGTCTTCCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:477)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGLSPDRVRAVSHWSSACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:478)

LCK::PylRS(AF)::FUS::PylRS(AF)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQID NO:479)

蛋白:

MGCVCSSNPEGTELACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:480)

LCK::FUS::PylRS(AF)::EWSR1::PylRS(AF)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:481)

蛋白:

MGCVCSSNPEGTELASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGAPGSAGSAAGSGMACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:482)

LCK::FUS::PylRS(AF)::FUS::PylRS(AF)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:483)

蛋白:

MGCVCSSNPEGTELASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGAPGSAGSAAGSGMACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:484)

TOM20::FUS::PylRS(AF)::EWSR1::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:485)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:486)

TOM20::FUS::PylRS(AF)::FUS::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:487)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:488)

TOM20::EWSR1::4xλ_N22::PylRS(AA)::FUS::PylRS(AA)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAGTTCTTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCAGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGGGCTAAGCCCCGACCGCGTTAGAGCCGTATCCCACTGGTCTTCCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:489)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAGAPGSAGSAAGSGEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLGLSPDRVRAVSHWSSACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:490)

LCK::EWSR1::MCP::PylRS(AA)::FUS::PylRS(AA)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGGCTAAGCCCCGACCGCGTTAGAGCCGTATCCCACTGGTCTTCCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ IDNO:491)

蛋白:

MGCVCSSNPEGTELMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGLSPDRVRAVSHWSSACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:492)

LCK::PylRS(AA)::FUS::PylRS(AA)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQID NO:493)

蛋白:

MGCVCSSNPEGTELACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:494)

LCK::PylRS(AF)::EWSR1::PylRS(AF)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ IDNO:495)

蛋白:

MGCVCSSNPEGTELACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:496)

TOM20::FUS::MCP::PylRS(AF)::EWSR1::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:497)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ IDNO:498)

TOM20::FUS::4xλ_N22::PylRS(AF)::EWSR1::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:499)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGKPIPNPLLGLDSTGAPGSAGSAAGSGASIEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPVGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:500)

TOM20::FUS::SYNZIP1::MCP::PylRS(AF)::EWSR1::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGCATCGATATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:501)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEASIYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:502)

TOM20::FUS::SYNZIP2::MCP::PylRS(AF)::EWSR1::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGCTAGAAACGCCTACCTGAGAAAGAAAATCGCCAGACTGAAGAAGGACAACCTGCAGCTGGAAAGAGACGAGCAGAACCTGGAAAAGATCATCGCCAACCTCAGAGATGAGATCGCCAGACTGGAAAACGAGGTGGCCAGCCACGAGCAGGCATCGATATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:503)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAARNAYLRKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLENEVASHEQASIYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:504)

LCK::FUS::SYNZIP1::MCP::PylRS(AF)::EWSR1::PylRS(AF)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGCATCGATATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:505)

蛋白:

MGCVCSSNPEGTELASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEASIYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:506)

LCK::FUS::SYNZIP2::MCP::PylRS(AF)::EWSR1::PylRS(AF)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGCTAGAAACGCCTACCTGAGAAAGAAAATCGCCAGACTGAAGAAGGACAACCTGCAGCTGGAAAGAGACGAGCAGAACCTGGAAAAGATCATCGCCAACCTCAGAGATGAGATCGCCAGACTGGAAAACGAGGTGGCCAGCCACGAGCAGGCATCGATATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:507)

蛋白:

MGCVCSSNPEGTELASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAARNAYLRKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLENEVASHEQASIYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:508)

LCK::PylRS(AA)::EWSR1::PylRS(AA)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ IDNO:509)

蛋白:

MGCVCSSNPEGTELACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:510)

LCK::FUS::PylRS(AA)::EWSR1::PylRS(AA)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:511)

蛋白:

MGCVCSSNPEGTELASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGAPGSAGSAAGSGMACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:512)

TOM20::FUS::PylRS(AA)::EWSR1::PylRS(AA)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:513)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:514)

TOM20::FUS::MCP::PylRS(AA)::EWSR1::PylRS(AA)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:515)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ IDNO:516)

TOM20::FUS::4xλ_N22::PylRS(AA)::EWSR1::PylRS(AA)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:517)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGKPIPNPLLGLDSTGAPGSAGSAAGSGASIEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPVGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQID NO:518)

LCK::EWSR1::MCP::PylRS(AF)::FUS::PylRS(AF)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGGCTAAGCTATACAGATATTGAAATGAACAGATTGGGAAAGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:519)

蛋白:

MGCVCSSNPEGTELMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGLSYTDIEMNRLGKACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:520)

TOM20::EWSR1::4xλ_N22::PylRS(AF)::FUS::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAGTTCTTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCAGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGGGCTAAGCTATACAGATATTGAAATGAACAGATTGGGAAAGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:521)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAGAPGSAGSAAGSGEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLGLSYTDIEMNRLGKACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:522)

TOM20::EWSR1::MCP::PylRS(AF)::FUS::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAGTTCTTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGGCTAAGCTATACAGATATTGAAATGAACAGATTGGGAAAGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:523)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGLSYTDIEMNRLGKACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:524)

LCK::PylRS(AA)::FUS::PylRS(AA)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQID NO:525)

蛋白:

MGCVCSSNPEGTELACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNLASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:526)

EBAG9_1-29::EWSR1::SYNZIP4::4xλ_N22

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCACAAAAGGTGGCTGAACTGAAAAATAGAGTGGCCGTGAAGCTGAACCGGAACGAGCAGCTGAAGAACAAGGTGGAAGAGCTGAAGAACAGAAACGCCTACCTGAAGAATGAGCTGGCCACCCTGGAAAACGAGGTGGCCAGACTGGAAAACGACGTGGCCGAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTTAA(SEQ ID NO:527)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAQKVAELKNRVAVKLNRNEQLKNKVEELKNRNAYLKNELATLENEVARLENDVAEGAPGSAGSAAGSGEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPV＊(SEQ ID NO:528)

KIF16B::FUS::SYNZIP1::PylRS(AF)

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:529)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTYTDIEMNRLGKGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:530)

KIF16B::FUS::SYNZIP1::PylRS(AA)

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:531)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTYTDIEMNRLGKGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:532)

EBAG9_1-29::EWSR1::SYNZIP2::MCP

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCAGCTAGAAACGCCTACCTGAGAAAGAAAATCGCCAGACTGAAGAAGGACAACCTGCAGCTGGAAAGAGACGAGCAGAACCTGGAAAAGATCATCGCCAACCTCAGAGATGAGATCGCCAGACTGGAAAACGAGGTGGCCAGCCACGAGCAGTATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:533)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAARNAYLRKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLENEVASHEQYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:534)

TOM20::EWSR1::SYNZIP2::MCP

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAGTTCTTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCAGCTAGAAACGCCTACCTGAGAAAGAAAATCGCCAGACTGAAGAAGGACAACCTGCAGCTGGAAAGAGACGAGCAGAACCTGGAAAAGATCATCGCCAACCTCAGAGATGAGATCGCCAGACTGGAAAACGAGGTGGCCAGCCACGAGCAGTATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:535)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAARNAYLRKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLENEVASHEQYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:536)

TOM20::FUS::SYNZIP4::4xλ_N22::PylRS(AA)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCACAAAAGGTGGCTGAACTGAAAAATAGAGTGGCCGTGAAGCTGAACCGGAACGAGCAGCTGAAGAACAAGGTGGAAGAGCTGAAGAACAGAAACGCCTACCTGAAGAATGAGCTGGCCACCCTGGAAAACGAGGTGGCCAGACTGGAAAACGACGTGGCCGAGTTAATCGCAGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:537)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAQKVAELKNRVAVKLNRNEQLKNKVEELKNRNAYLKNELATLENEVARLENDVAELIAGAPGSAGSAAGSGASIEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPVGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:538)

KIF16B::EWSR1::SYNZIP4::4xλ_N22

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACAATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCACAAAAGGTGGCTGAACTGAAAAATAGAGTGGCCGTGAAGCTGAACCGGAACGAGCAGCTGAAGAACAAGGTGGAAGAGCTGAAGAACAGAAACGCCTACCTGAAGAATGAGCTGGCCACCCTGGAAAACGAGGTGGCCAGACTGGAAAACGACGTGGCCGAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTTAA(SEQ ID NO:539)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAQKVAELKNRVAVKLNRNEQLKNKVEELKNRNAYLKNELATLENEVARLENDVAEGAPGSAGSAAGSGEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPV＊(SEQ ID NO:540)

TOM20::EWSR1::SYNZP4::4xλ_N22

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAGTTCTTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCACAAAAGGTGGCTGAACTGAAAAATAGAGTGGCCGTGAAGCTGAACCGGAACGAGCAGCTGAAGAACAAGGTGGAAGAGCTGAAGAACAGAAACGCCTACCTGAAGAATGAGCTGGCCACCCTGGAAAACGAGGTGGCCAGACTGGAAAACGACGTGGCCGAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTTAA(SEQ ID NO:541)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAQKVAELKNRVAVKLNRNEQLKNKVEELKNRNAYLKNELATLENEVARLENDVAEGAPGSAGSAAGSGEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPV＊(SEQ ID NO:542)

TOM20::FUS::SYNZIP1::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:543)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:544)

TOM20::FUS::SYNZIP::3::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:545)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:546)

EBAG9_1-29::FUS::SYNZIP1::PylRS(AF)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:547)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:548)

EBAG9_1-29::FUS::SYNZIP3::PylRS(AF)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ IDNO:549)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:550)

TOM20::FUS::SYNZIP1::PylRS(AA)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:551)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:552)

TOM20::FUS::SYNZIP3::PylRS(AA)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:553)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:554)

TOM20::FUS::SYNZIP3::PylRS(AAAF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:555)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:556)

LCK::FUS::SYNZIP3::PylRS(AF)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:557)

蛋白:

MGCVCSSNPEGTELMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:558)

LCK::SYNZIP1::PylRS(AF)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:559)

蛋白:

MGCVCSSNPEGTELAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:560)

LCK::SYNZIP3::PylRS(AF)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCGATCGCAAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:561)

蛋白:

MGCVCSSNPEGTELAIANEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:562)

SYNZIP2::MCP

DNA:

ATGGCGATCGCAGCTAGAAACGCCTACCTGAGAAAGAAAATCGCCAGACTGAAGAAGGACAACCTGCAGCTGGAAAGAGACGAGCAGAACCTGGAAAAGATCATCGCCAACCTCAGAGATGAGATCGCCAGACTGGAAAACGAGGTGGCCAGCCACGAGCAGTATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:563)

蛋白:

MAIAARNAYLRKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLENEVASHEQYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:564)

LCK::EWSR1::SYNZIP2::MCP

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCAGCTAGAAACGCCTACCTGAGAAAGAAAATCGCCAGACTGAAGAAGGACAACCTGCAGCTGGAAAGAGACGAGCAGAACCTGGAAAAGATCATCGCCAACCTCAGAGATGAGATCGCCAGACTGGAAAACGAGGTGGCCAGCCACGAGCAGTATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:565)

蛋白:

MGCVCSSNPEGTELMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAARNAYLRKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLENEVASHEQYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:566)

LCK::EWSR1::SYNZIP4::4xλ_N22

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCACAAAAGGTGGCTGAACTGAAAAATAGAGTGGCCGTGAAGCTGAACCGGAACGAGCAGCTGAAGAACAAGGTGGAAGAGCTGAAGAACAGAAACGCCTACCTGAAGAATGAGCTGGCCACCCTGGAAAACGAGGTGGCCAGACTGGAAAACGACGTGGCCGAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTTAA(SEQ ID NO:567)

蛋白:

MGCVCSSNPEGTELMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAQKVAELKNRVAVKLNRNEQLKNKVEELKNRNAYLKNELATLENEVARLENDVAEGAPGSAGSAAGSGEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPV＊(SEQ ID NO:568)

LCK::SYNZIP2::MCP

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCGATCGCAGCTAGAAACGCCTACCTGAGAAAGAAAATCGCCAGACTGAAGAAGGACAACCTGCAGCTGGAAAGAGACGAGCAGAACCTGGAAAAGATCATCGCCAACCTCAGAGATGAGATCGCCAGACTGGAAAACGAGGTGGCCAGCCACGAGCAGTATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:569)

蛋白:

MGCVCSSNPEGTELAIAARNAYLRKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLENEVASHEQYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:570)

EWSR1::SYNZIP2::MCP

DNA:

ATGATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCAGCTAGAAACGCCTACCTGAGAAAGAAAATCGCCAGACTGAAGAAGGACAACCTGCAGCTGGAAAGAGACGAGCAGAACCTGGAAAAGATCATCGCCAACCTCAGAGATGAGATCGCCAGACTGGAAAACGAGGTGGCCAGCCACGAGCAGTATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:571)

蛋白:

MMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAARNAYLRKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLENEVASHEQYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ IDNO:572)

LCK::FUS::SYNZIP1::PylRS(AF)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:573)

蛋白:

MGCVCSSNPEGTELMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:574)

LCK::FUS::SYNZIP3::PylRS(AF)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQID NO:575)

蛋白:

MGCVCSSNPEGTELMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:576)

TOM20::EWSR1::SYNZIP4::2xPCP

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAGTTCTTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCACAAAAGGTGGCTGAACTGAAAAATAGAGTGGCCGTGAAGCTGAACCGGAACGAGCAGCTGAAGAACAAGGTGGAAGAGCTGAAGAACAGAAACGCCTACCTGAAGAATGAGCTGGCCACCCTGGAAAACGAGGTGGCCAGACTGGAAAACGACGTGGCCGAGTTAATCGCAGAGCAGAAGCTGATCTCAGAGGAGGACCTGATCGAAGGCCGCCATATGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTGCGGATCCGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTCCACCGGTCGCCACCTAA(SEQ ID NO:577)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAQKVAELKNRVAVKLNRNEQLKNKVEELKNRNAYLKNELATLENEVARLENDVAELIAEQKLISEEDLIEGRHMLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRADPLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRPPVAT＊(SEQ ID NO:578)

TOM20::EWSR1::SYNZIP2::2xPCP

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAGTTCTTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCAGCTAGAAACGCCTACCTGAGAAAGAAAATCGCCAGACTGAAGAAGGACAACCTGCAGCTGGAAAGAGACGAGCAGAACCTGGAAAAGATCATCGCCAACCTCAGAGATGAGATCGCCAGACTGGAAAACGAGGTGGCCAGCCACGAGCAGTTAATCGCATACCCCTACGACGTGCCCGACTACGCCATCGAAGGCCGCCATATGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTGCGGATCCGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTCCACCGGTCGCCACCTAA(SEQ ID NO:579)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAARNAYLRKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLENEVASHEQLIAYPYDVPDYAIEGRHMLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRADPLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRPPVAT＊(SEQ ID NO:580)

KIF16B::EWSR1::SYNZIP2::MCP

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACAATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCAGCTAGAAACGCCTACCTGAGAAAGAAAATCGCCAGACTGAAGAAGGACAACCTGCAGCTGGAAAGAGACGAGCAGAACCTGGAAAAGATCATCGCCAACCTCAGAGATGAGATCGCCAGACTGGAAAACGAGGTGGCCAGCCACGAGCAGTATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:581)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAARNAYLRKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLENEVASHEQYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:582)

LCK::SYNZIP1::PylRS(AF)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:583)

蛋白:

MGCVCSSNPEGTELAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:584)

LCK::FUS::SYNZIP1::PylRS(AF)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:585)

蛋白:

MGCVCSSNPEGTELMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:586)

SYNZIP4::4xλN22

DNA:

ATGGCGATCGCACAAAAGGTGGCTGAACTGAAAAATAGAGTGGCCGTGAAGCTGAACCGGAACGAGCAGCTGAAGAACAAGGTGGAAGAGCTGAAGAACAGAAACGCCTACCTGAAGAATGAGCTGGCCACCCTGGAAAACGAGGTGGCCAGACTGGAAAACGACGTGGCCGAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTTAA(SEQ ID NO:587)

蛋白:

MAIAQKVAELKNRVAVKLNRNEQLKNKVEELKNRNAYLKNELATLENEVARLENDVAEGAPGSAGSAAGSGEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPV＊(SEQ ID NO:588)

TOM20::FUS::SYNZIP1::MCP::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGCATCGATATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:589)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEASIYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:590)

TOM20::FUS::SYNZIP2::MCP::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGCTAGAAACGCCTACCTGAGAAAGAAAATCGCCAGACTGAAGAAGGACAACCTGCAGCTGGAAAGAGACGAGCAGAACCTGGAAAAGATCATCGCCAACCTCAGAGATGAGATCGCCAGACTGGAAAACGAGGTGGCCAGCCACGAGCAGGCATCGATATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ IDNO:591)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAARNAYLRKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLENEVASHEQASIYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:592)

TOM20::FUS::SYNZIP1::MCP::PylRS(AA)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGCATCGATATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:593)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEASIYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:594)

TOM20::FUS::SYNZIP2::MCP::PylRS(AA)

DNA:ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGCTAGAAACGCCTACCTGAGAAAGAAAATCGCCAGACTGAAGAAGGACAACCTGCAGCTGGAAAGAGACGAGCAGAACCTGGAAAAGATCATCGCCAACCTCAGAGATGAGATCGCCAGACTGGAAAACGAGGTGGCCAGCCACGAGCAGGCATCGATATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQID NO:595)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAARNAYLRKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLENEVASHEQASIYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:596)

TOM20::FUS::SYNZIP::MCP::IFRS1

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGCATCGATATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATATGCTGAACTATAGCCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGTCTTTTATGCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:597)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEASIYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNMLNYSRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLSFMQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:598)

TOM20::FUS::SYNZIP2::MCP::IFRS1

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGCTAGAAACGCCTACCTGAGAAAGAAAATCGCCAGACTGAAGAAGGACAACCTGCAGCTGGAAAGAGACGAGCAGAACCTGGAAAAGATCATCGCCAACCTCAGAGATGAGATCGCCAGACTGGAAAACGAGGTGGCCAGCCACGAGCAGGCATCGATATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATATGCTGAACTATAGCCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGTCTTTTATGCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ IDNO:599)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAARNAYLRKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLENEVASHEQASIYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNMLNYSRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLSFMQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:600)

TOM20::FUS::SYNZIP3::4xλ_N22::CbzRS

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATCTGATGAACTATGGACGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTACACAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:601)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGAPGSAGSAAGSGASIEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPVGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLMNYGRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFTQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:602)

EBAG9_1-29::FUS::SYNZIP3::PCP::PylRS(AF)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGATCGAAGGCCGCCATATGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTGCGGATCCGCTAGCCGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTTTAA(SEQ ID NO:603)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGAPGSAGSAAGSGASIEQKLISEEDLIEGRHMLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRADPLAGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:604)

EBAG9_1-29::FUS::SYNZIP4::PylRS(AF)

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCACAAAAGGTGGCTGAACTGAAAAATAGAGTGGCCGTGAAGCTGAACCGGAACGAGCAGCTGAAGAACAAGGTGGAAGAGCTGAAGAACAGAAACGCCTACCTGAAGAATGAGCTGGCCACCCTGGAAAACGAGGTGGCCAGACTGGAAAACGACGTGGCCGAGTTAATCGCAGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGATCGAAGGCCGCCATATGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTGCGGATCCGCTAGCCGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:605)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAQKVAELKNRVAVKLNRNEQLKNKVEELKNRNAYLKNELATLENEVARLENDVAELIAGAPGSAGSAAGSGASIEQKLISEEDLIEGRHMLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRADPLAGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:606)

EBAG9_1-29::FUS::SYNZIP3::4xλ_N22::IFRS1

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATATGCTGAACTATAGCCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGTCTTTTATGCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:607)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGAPGSAGSAAGSGASIEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPVGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNMLNYSRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLSFMQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:608)

LCK::FUS::SYNZIP1::MCP::PylRS(AF)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGCATCGATATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:609)

蛋白:

MGCVCSSNPEGTELASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEASIYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:610)

LCK::FUS::SYNZIP2::MCP::PylRS(AF)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGCTAGAAACGCCTACCTGAGAAAGAAAATCGCCAGACTGAAGAAGGACAACCTGCAGCTGGAAAGAGACGAGCAGAACCTGGAAAAGATCATCGCCAACCTCAGAGATGAGATCGCCAGACTGGAAAACGAGGTGGCCAGCCACGAGCAGGCATCGATATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:611)

蛋白:

MGCVCSSNPEGTELASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAARNAYLRKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLENEVASHEQASIYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:612)

CG1::FUS::SYNZIP1::MCP::PylRS(AF)

DNA:

ATGGCCATTTGTCAATTCTTCCTTCAAGGCCGGTGCCGCTTTGGAGATCGGTGCTGGAACGAACATCCCGGTGCTAGGGGTGCAGGAGGAGGACGGCAGCAACCGCAGCAGCAGCCTTCAGGTAATAATAGACGTGGATGGAATACAACTAGCCAGAGATATTCCAATGTCATCCAGCCATCCAGTTTCTCCAAATCCACACCATGGGGGGGCAGCAGAGATCAAGAAAAGCCATATTTCAGTTCTTTTGATTCTGGAGCTTCAACTAACAGGAAGGAAGGCTTTGGATTGTCTGAGAACCCATTTGCTTCACTTAGTCCTGATGAGCAGAAAGATGAAAAGAAACTTCTGGAAGGAATTGTAAAAGATATGGAGGTTTGGGAATCATCAGGGCAGTGGATGTTTTCTGTTTATTCACCAGTGAAAAAGAAACCTAATATTTCAGGTTTTACAGACATTTCACCAGAGGAATTGAGGCTTGAATACCATAACTTCTTAACCAGCAATAACTTACAGAGTTATCTAAATTCTGTCCAACGTTTAATAAATCAATGGAGGAACAGGGTAAATGAACTGAAAAGTCTAAATATATCAACTAAAGTAGCTTTGCTCTCTGATGTAAAGGATGGAGTAAATCAAGCAGCACCTGCATTTGGATTTGGCAGCAGTCAAGCAGCAACATTTATGTCGCCAGGCTTTCCAGTCAATAACAGCAGCAGTGATAATGCTCAGAACTTTAGTTTTAAAACAAACTCTGGATTTGCTGCTGCCTCTTCTGGAAGCCCTGCTGGTTTTGGGAGTTCCCCAGCATTTGGAGCTGCAGCCTCTACCAGTTCAGGTATCTCTACTTCTGCTCCAGCTTTTGGATTTGGGAAGCCTGAAGTCACATCGGCTGCATCATTTTCATTCAAAAGCCCTGCAGCTTCCAGTTTTGGATCACCTGGATTTTCAGGACTTCCAGCTTCCTTGGCAACAGGTCCTGTCAGAGCTCCAGTGGCCCCAGCCTTTGGAGGTGGCAGTTCTGTGGCTGGTTTTGGTAGTCCGGGCTCACATTCTCACACTGCTTTTTCTAAGCCATCCAGTGACACTTTTGGAAATAGCAGCATATCCACTTCTCTGTCAGCCTCAAGCAGCATCATTGCAACAGATAATGTGTTATTCACACCCAGAGATAAACTAACAGTAGAAGAACTGGAACAATTTCAATCCAAGAAATTTACTCTGGGAAAAATTCCATTAAAGCCTCCACCTCTGGAACTTCTAAATGTTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGCATCGATATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:613)

蛋白:

MAICQFFLQGRCRFGDRCWNEHPGARGAGGGRQQPQQQPSGNNRRGWNTTSQRYSNVIQPSSFSKSTPWGGSRDQEKPYFSSFDSGASTNRKEGFGLSENPFASLSPDEQKDEKKLLEGIVKDMEVWESSGQWMFSVYSPVKKKPNISGFTDISPEELRLEYHNFLTSNNLQSYLNSVQRLINQWRNRVNELKSLNISTKVALLSDVKDGVNQAAPAFGFGSSQAATFMSPGFPVNNSSSDNAQNFSFKTNSGFAAASSGSPAGFGSSPAFGAAASTSSGISTSAPAFGFGKPEVTSAASFSFKSPAASSFGSPGFSGLPASLATGPVRAPVAPAFGGGSSVAGFGSPGSHSHTAFSKPSSDTFGNSSISTSLSASSSIIATDNVLFTPRDKLTVEELEQFQSKKFTLGKIPLKPPPLELLNVGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEASIYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:614)

CG1::FUS::SYNZIP2::MCP::PylRS(AF)

DNA:

ATGGCCATTTGTCAATTCTTCCTTCAAGGCCGGTGCCGCTTTGGAGATCGGTGCTGGAACGAACATCCCGGTGCTAGGGGTGCAGGAGGAGGACGGCAGCAACCGCAGCAGCAGCCTTCAGGTAATAATAGACGTGGATGGAATACAACTAGCCAGAGATATTCCAATGTCATCCAGCCATCCAGTTTCTCCAAATCCACACCATGGGGGGGCAGCAGAGATCAAGAAAAGCCATATTTCAGTTCTTTTGATTCTGGAGCTTCAACTAACAGGAAGGAAGGCTTTGGATTGTCTGAGAACCCATTTGCTTCACTTAGTCCTGATGAGCAGAAAGATGAAAAGAAACTTCTGGAAGGAATTGTAAAAGATATGGAGGTTTGGGAATCATCAGGGCAGTGGATGTTTTCTGTTTATTCACCAGTGAAAAAGAAACCTAATATTTCAGGTTTTACAGACATTTCACCAGAGGAATTGAGGCTTGAATACCATAACTTCTTAACCAGCAATAACTTACAGAGTTATCTAAATTCTGTCCAACGTTTAATAAATCAATGGAGGAACAGGGTAAATGAACTGAAAAGTCTAAATATATCAACTAAAGTAGCTTTGCTCTCTGATGTAAAGGATGGAGTAAATCAAGCAGCACCTGCATTTGGATTTGGCAGCAGTCAAGCAGCAACATTTATGTCGCCAGGCTTTCCAGTCAATAACAGCAGCAGTGATAATGCTCAGAACTTTAGTTTTAAAACAAACTCTGGATTTGCTGCTGCCTCTTCTGGAAGCCCTGCTGGTTTTGGGAGTTCCCCAGCATTTGGAGCTGCAGCCTCTACCAGTTCAGGTATCTCTACTTCTGCTCCAGCTTTTGGATTTGGGAAGCCTGAAGTCACATCGGCTGCATCATTTTCATTCAAAAGCCCTGCAGCTTCCAGTTTTGGATCACCTGGATTTTCAGGACTTCCAGCTTCCTTGGCAACAGGTCCTGTCAGAGCTCCAGTGGCCCCAGCCTTTGGAGGTGGCAGTTCTGTGGCTGGTTTTGGTAGTCCGGGCTCACATTCTCACACTGCTTTTTCTAAGCCATCCAGTGACACTTTTGGAAATAGCAGCATATCCACTTCTCTGTCAGCCTCAAGCAGCATCATTGCAACAGATAATGTGTTATTCACACCCAGAGATAAACTAACAGTAGAAGAACTGGAACAATTTCAATCCAAGAAATTTACTCTGGGAAAAATTCCATTAAAGCCTCCACCTCTGGAACTTCTAAATGTTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGCTAGAAACGCCTACCTGAGAAAGAAAATCGCCAGACTGAAGAAGGACAACCTGCAGCTGGAAAGAGACGAGCAGAACCTGGAAAAGATCATCGCCAACCTCAGAGATGAGATCGCCAGACTGGAAAACGAGGTGGCCAGCCACGAGCAGGCATCGATATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:615)

蛋白:

MAICQFFLQGRCRFGDRCWNEHPGARGAGGGRQQPQQQPSGNNRRGWNTTSQRYSNVIQPSSFSKSTPWGGSRDQEKPYFSSFDSGASTNRKEGFGLSENPFASLSPDEQKDEKKLLEGIVKDMEVWESSGQWMFSVYSPVKKKPNISGFTDISPEELRLEYHNFLTSNNLQSYLNSVQRLINQWRNRVNELKSLNISTKVALLSDVKDGVNQAAPAFGFGSSQAATFMSPGFPVNNSSSDNAQNFSFKTNSGFAAASSGSPAGFGSSPAFGAAASTSSGISTSAPAFGFGKPEVTSAASFSFKSPAASSFGSPGFSGLPASLATGPVRAPVAPAFGGGSSVAGFGSPGSHSHTAFSKPSSDTFGNSSISTSLSASSSIIATDNVLFTPRDKLTVEELEQFQSKKFTLGKIPLKPPPLELLNVGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAARNAYLRKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLENEVASHEQASIYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:616)

TOM20::FUS::SYNZIP4::λ_N22::CbzRS

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCACAAAAGGTGGCTGAACTGAAAAATAGAGTGGCCGTGAAGCTGAACCGGAACGAGCAGCTGAAGAACAAGGTGGAAGAGCTGAAGAACAGAAACGCCTACCTGAAGAATGAGCTGGCCACCCTGGAAAACGAGGTGGCCAGACTGGAAAACGACGTGGCCGAGTTAATCGCAGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATCTGATGAACTATGGACGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTACACAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:617)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAQKVAELKNRVAVKLNRNEQLKNKVEELKNRNAYLKNELATLENEVARLENDVAELIAGAPGSAGSAAGSGASIEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPVGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLMNYGRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFTQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:618)

EBAG9_1-29::FUS::SYNZIP4::4xλ_N22::IFRS1

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCACAAAAGGTGGCTGAACTGAAAAATAGAGTGGCCGTGAAGCTGAACCGGAACGAGCAGCTGAAGAACAAGGTGGAAGAGCTGAAGAACAGAAACGCCTACCTGAAGAATGAGCTGGCCACCCTGGAAAACGAGGTGGCCAGACTGGAAAACGACGTGGCCGAGTTAATCGCAGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTTGCACCAAATATGCTGAACTATAGCCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGTCTTTTATGCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:619)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAQKVAELKNRVAVKLNRNEQLKNKVEELKNRNAYLKNELATLENEVARLENDVAELIAGAPGSAGSAAGSGASIEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPVGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNMLNYSRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLSFMQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:620)

TOM20::FUS::SYNZIP3::4xλ_N22::PylRS(AA)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTGGTGCTCCTGGTTCAGCAGGAAGCGCAGCAGGATCAGGTGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:621)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGAPGSAGSAAGSGASIEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPVGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:622)

LCK::FUS::SYNZIP1::MCP::PylRS(AA)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGCATCGATATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:623)

蛋白:

MGCVCSSNPEGTELASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEASIYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:624)

TOM20::EWSR1::SYNZIP4::4xλ_N22::SYNZIP4::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAGTTCTTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCACAAAAGGTGGCTGAACTGAAAAATAGAGTGGCCGTGAAGCTGAACCGGAACGAGCAGCTGAAGAACAAGGTGGAAGAGCTGAAGAACAGAAACGCCTACCTGAAGAATGAGCTGGCCACCCTGGAAAACGAGGTGGCCAGACTGGAAAACGACGTGGCCGAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTTCTGGGCTAAGCGGTGCTCCGGGGTCAGCCGGAAGTGCAGCAGGATCAGGTCAAAAGGTGGCTGAACTGAAAAATAGAGTGGCCGTGAAGCTGAACCGGAACGAGCAGCTGAAGAACAAGGTGGAAGAGCTGAAGAACAGAAACGCCTACCTGAAGAATGAGCTGGCCACCCTGGAAAACGAGGTGGCCAGACTGGAAAACGACGTGGCCGAGGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:625)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAQKVAELKNRVAVKLNRNEQLKNKVEELKNRNAYLKNELATLENEVARLENDVAEGAPGSAGSAAGSGEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPVSGLSGAPGSAGSAAGSGQKVAELKNRVAVKLNRNEQLKNKVEELKNRNAYLKNELATLENEVARLENDVAEGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:626)

TOM20::FUS::SYNZIP1::MCP::SYNZIP1::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGCATCGATATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGGCTAAGCGGTGCTCCGGGGTCAGCCGGAAGTGCAGCAGGATCAGGTAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:627)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEASIYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGLSGAPGSAGSAAGSGNLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:628)

TOM20::EWSR1::SYNZIP4::4xλ_N22::SYNZIP4::PylRS(AA)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAGTTCTTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCACAAAAGGTGGCTGAACTGAAAAATAGAGTGGCCGTGAAGCTGAACCGGAACGAGCAGCTGAAGAACAAGGTGGAAGAGCTGAAGAACAGAAACGCCTACCTGAAGAATGAGCTGGCCACCCTGGAAAACGAGGTGGCCAGACTGGAAAACGACGTGGCCGAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTTCTGGGCTAAGCGGTGCTCCGGGGTCAGCCGGAAGTGCAGCAGGATCAGGTCAAAAGGTGGCTGAACTGAAAAATAGAGTGGCCGTGAAGCTGAACCGGAACGAGCAGCTGAAGAACAAGGTGGAAGAGCTGAAGAACAGAAACGCCTACCTGAAGAATGAGCTGGCCACCCTGGAAAACGAGGTGGCCAGACTGGAAAACGACGTGGCCGAGGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:629)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAQKVAELKNRVAVKLNRNEQLKNKVEELKNRNAYLKNELATLENEVARLENDVAEGAPGSAGSAAGSGEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPVSGLSGAPGSAGSAAGSGQKVAELKNRVAVKLNRNEQLKNKVEELKNRNAYLKNELATLENEVARLENDVAEGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:630)

TOM20::FUS::SYNZIP3::4xλ_N22::SYNZIP3::PylRS(AA)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCTAAGCGGTGCTCCGGGGTCAGCCGGAAGTGCAGCAGGATCAGGTAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTGGCACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGCCTTTGCCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTATGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTTGGACCAATTCCGCTGGACCGTGAGTGGGGTATCGACAAACCGTGGATCGGAGCAGGATTCGGTCTGGAACGCCTGCTGAAAGTGAAACACGACTTCAAAAACATCAAACGTGCCGCCCGTTCTGAATCGTATTATAACGGGATCTCTACGAACCTGTAA(SEQ ID NO:631)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGAPGSAGSAAGSGASIEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGLSGAPGSAGSAAGSGNEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLAFAQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:632)

LCK::EWSR1::SYNZIP4::4xλ_N22::SYNZIP4::PylRS(AF)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCACAAAAGGTGGCTGAACTGAAAAATAGAGTGGCCGTGAAGCTGAACCGGAACGAGCAGCTGAAGAACAAGGTGGAAGAGCTGAAGAACAGAAACGCCTACCTGAAGAATGAGCTGGCCACCCTGGAAAACGAGGTGGCCAGACTGGAAAACGACGTGGCCGAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTTCTGGGCTAAGCGGTGCTCCGGGGTCAGCCGGAAGTGCAGCAGGATCAGGTCAAAAGGTGGCTGAACTGAAAAATAGAGTGGCCGTGAAGCTGAACCGGAACGAGCAGCTGAAGAACAAGGTGGAAGAGCTGAAGAACAGAAACGCCTACCTGAAGAATGAGCTGGCCACCCTGGAAAACGAGGTGGCCAGACTGGAAAACGACGTGGCCGAGGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:633)

蛋白:

MGCVCSSNPEGTELMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAQKVAELKNRVAVKLNRNEQLKNKVEELKNRNAYLKNELATLENEVARLENDVAEGAPGSAGSAAGSGEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPVSGLSGAPGSAGSAAGSGQKVAELKNRVAVKLNRNEQLKNKVEELKNRNAYLKNELATLENEVARLENDVAEGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:634)

LCK::FUS::SYNZIP3::4xλ_N22::SYNZIP3::PylRS(AF)

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCTAAGCGGTGCTCCGGGGTCAGCCGGAAGTGCAGCAGGATCAGGTAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:635)

蛋白:

MGCVCSSNPEGTELASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGAPGSAGSAAGSGASIEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGLSGAPGSAGSAAGSGNEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQID NO:636)

TOM20::FUS::SYNZIP3::4xλ_N22::SYNZIP3::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCATCGATAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCTAAGCGGTGCTCCGGGGTCAGCCGGAAGTGCAGCAGGATCAGGTAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:637)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGAPGSAGSAAGSGASIEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGLSGAPGSAGSAAGSGNEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:638)

TOM20::EWSR1::SYNZIP2::MCP::SYNZIP2::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAGTTCTTCATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCAGCTAGAAACGCCTACCTGAGAAAGAAAATCGCCAGACTGAAGAAGGACAACCTGCAGCTGGAAAGAGACGAGCAGAACCTGGAAAAGATCATCGCCAACCTCAGAGATGAGATCGCCAGACTGGAAAACGAGGTGGCCAGCCACGAGCAGTATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGGCTAAGCGGTGCTCCGGGGTCAGCCGGAAGTGCAGCAGGATCAGGTGCTAGAAACGCCTACCTGAGAAAGAAAATCGCCAGACTGAAGAAGGACAACCTGCAGCTGGAAAGAGACGAGCAGAACCTGGAAAAGATCATCGCCAACCTCAGAGATGAGATCGCCAGACTGGAAAACGAGGTGGCCAGCCACGAGCAGGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGACAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:639)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAARNAYLRKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLENEVASHEQYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGLSGAPGSAGSAAGSGARNAYLRKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLENEVASHEQGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:640)

LCK::OMeRS

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAACACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGTCTTTTGGCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCCTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:641)

蛋白:

MGCVCSSNPEGTELACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLTPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLVFWQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSALVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:642)

TOM20::FUS::OMeRS

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAACACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGTCTTTTGGCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCCTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:643)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLTPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLVFWQMGSGCTRENLESI ITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSALVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQID NO:644)

KIF16B::FUS::OMeRS

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACATATACAGATATTGAAATGAACAGATTGGGAAAGGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGATTACAAGGATGACGACGATAAGGGTACCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAACACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGTCTTTTGGCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCCTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:645)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTYTDIEMNRLGKGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGDYKDDDDKGTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLTPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLVFWQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSALVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:646)

LCK::FUS::OMeRS

DNA:

ATGGGCTGCGTGTGCAGCAGCAACCCCGAGGGTACCGAGCTCGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGGCGCCCCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAACACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGTCTTTTGGCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCCTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:647)

蛋白:

MGCVCSSNPEGTELASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGGAPGSAGSAAGSGMACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLTPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLVFWQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSALVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQID NO:648)

EBAG9_1-29:FUS::OMeRS

DNA:

ATGGCCATCACCCAGTTTCGGTTATTTAAATTTTGTACCTGCCTAGCAACAGTATTCTCATTCCTAAAGAGATTAATATGCAGATCTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAGCAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAACACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGTCTTTTGGCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCCTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:649)

蛋白:

MAITQFRLFKFCTCLATVFSFLKRLICRSGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLTPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLVFWQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSALVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:650)

TOM20::FUS::SYNZIP1::OMeRS

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATCTGGTGGCCCAGCTGGAAAACGAGGTGGCCAGCCTGGAAAACGAGAACGAAACCCTGAAGAAAAAGAACCTGCACAAGAAGGACCTGATCGCCTACCTGGAAAAGGAAATCGCCAACCTGAGAAAGAAGATCGAGGAAGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAACACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGTCTTTTGGCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCCTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:651)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANLVAQLENEVASLENENETLKKKNLHKKDLIAYLEKEIANLRKKIEEGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLTPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLVFWQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSALVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:652)

TOM20::FUS::SYNZIP3::OMeRS

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCAAATGAGGTGACCACCCTGGAAAACGACGCCGCCTTCATCGAGAACGAGAACGCCTACCTGGAAAAAGAGATCGCCAGACTGAGAAAGGAAAAGGCCGCTCTGCGGAACAGACTGGCCCACAAGAAGGGCAAGCCTATTCCCAACCCCCTGCTGGGCCTGGATAGCACCGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAACACCAAATCTGTATAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGGTCTTTTGGCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCCTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:653)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIANEVTTLENDAAFIENENAYLEKEIARLRKEKAALRNRLAHKKGKPIPNPLLGLDSTGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLTPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLVFWQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSALVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:654)

SLP3::FUS::PylRS(AF)

DNA:

ATGGATTCTAGGGTGTCTTCACCTGAGAAGCAAGATAAAGAGAATTTCGTGGGTGTCAACAATAAACGGCTTGGTGTATGTGGCTGGATCCTGTTTTCCCTCTCTTTCCTGTTGGTGATCATTACCTTCCCCATCTCCATATGGATGTGCTTGAAGATCATTAAGGAGTATGAACGTGGAGCACCCGGCTCCGCCGGCTCCGCCGCCGGCTCCGGCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGTGGTGCGATCGCAGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:655)

蛋白:

MDSRVSSPEKQDKENFVGVNNKRLGVCGWILFSLSFLLVIITFPISIWMCLKIIKEYERGAPGSAGSAAGSGMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ IDNO:656)

SLP3::MCP

DNA:

ATGGATTCTAGGGTGTCTTCACCTGAGAAGCAAGATAAAGAGAATTTCGTGGGTGTCAACAATAAACGGCTTGGTGTATGTGGCTGGATCCTGTTTTCCCTCTCTTTCCTGTTGGTGATCATTACCTTCCCCATCTCCATATGGATGTGCTTGAAGATCATTAAGGAGTATGAACGTGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:657)

蛋白:

MDSRVSSPEKQDKENFVGVNNKRLGVCGWILFSLSFLLVIITFPISIWMCLKIIKEYERAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:658)

SLP3::EWSR1::MCP

DNA:

ATGGATTCTAGGGTGTCTTCACCTGAGAAGCAAGATAAAGAGAATTTCGTGGGTGTCAACAATAAACGGCTTGGTGTATGTGGCTGGATCCTGTTTTCCCTCTCTTTCCTGTTGGTGATCATTACCTTCCCCATCTCCATATGGATGTGCTTGAAGATCATTAAGGAGTATGAACGTATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:659)

蛋白:

MDSRVSSPEKQDKENFVGVNNKRLGVCGWILFSLSFLLVIITFPISIWMCLKIIKEYERMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:660)

SLP3::EWSR1::4xλ_N22

DNA:

ATGGATTCTAGGGTGTCTTCACCTGAGAAGCAAGATAAAGAGAATTTCGTGGGTGTCAACAATAAACGGCTTGGTGTATGTGGCTGGATCCTGTTTTCCCTCTCTTTCCTGTTGGTGATCATTACCTTCCCCATCTCCATATGGATGTGCTTGAAGATCATTAAGGAGTATGAACGTATGGCGTCCACGGATTACAGTACCTATAGCCAAGCTGCAGCGCAGCAGGGCTACAGTGCTTACACCGCCCAGCCCACTCAAGGATATGCACAGACCACCCAGGCATATGGGCAACAAAGCTATGGAACCTATGGACAGCCCACTGATGTCAGCTATACCCAGGCTCAGACCACTGCAACCTATGGGCAGACCGCCTATGCAACTTCTTATGGACAGCCTCCCACTGGTTATACTACTCCAACTGCCCCCCAGGCATACAGCCAGCCTGTCCAGGGGTATGGCACTGGTGCTTATGATACCACCACTGCTACAGTCACCACCACCCAGGCCTCCTATGCAGCTCAGTCTGCATATGGCACTCAGCCTGCTTATCCAGCCTATGGGCAGCAGCCAGCAGCCACTGCACCTACAAGACCGCAGGATGGAAACAAGCCCACTGAGACTAGTCAACCTCAATCTAGCACAGGGGGTTACAACCAGCCCAGCCTAGGATATGGACAGAGTAACTACAGTTATCCCCAGGTACCTGGGAGCTACCCCATGCAGCCAGTCACTGCACCTCCATCCTACCCTCCTACCAGCTATTCCTCTACACAGCCGACTAGTTATGATCAGAGCAGTTACTCTCAGCAGAACACCTATGGGCAACCGAGCAGCTATGGACAGCAGAGTAGCTATGGTCAACAAAGCAGCTATGGGCAGCAGCCTCCCACTAGTTACCCACCCCAAACTGGATCCTACAGCCAAGCTCCAAGTCAATATAGCCAACAGAGCAGCAGCTACGGGCAGCAGAGTTCATTCCGACAGGACCACCCCAGTAGCATGGGTGTTTATGGGCAGGAGTCTGGAGGATTTTCCGGACCAGGAGAGAACCGGAGCATGAGTGGCCCTGATAACCGGGGCAGGGGAAGAGGGGGATTTGATCGTGGAGGCATGAGCAGAGGTGGGCGGGGAGGAGGACGCGGTGGAATGGGCAGCGCTGGAGAGCGAGGTGGCTTCAATAAGCCTGGTGGACCCATGGATGAAGGACCAGATCTTGATCTAGGCCCACCTGTAGATCCAGATGAAGACTCTGACAACAGTGCAATTTATGTACAAGGATTAAATGACAGTGTGACTCTAGATGATCTGGCAGACTTCTTTAAGCAGTGTGGGGTTGTTAAGATGAACAAGAGAACTGGGCAACCCATGATCCACATCTACCTGGACAAGGAAACAGGAAAGCCCAAAGGCGATGCCACAGTGTCCTATGAAGACCCACCTACTGCCAAGGCTGCCGTGGAATGGTTTGATGGGAAAGATTTTCAAGGGAGCAAACTTAAAGTCTCCCTTGCTCGGAAGAAGCCTCCAATGAACAGTATGCGGGGTGGTCTGCCACCCCGTGAGGGCAGAGGCATGCCACCACCACTCCGTGGAGGTCCAGGAGGCCCAGGAGGTCCTGGGGGACCCATGGGTCGCATGGGAGGCCGTGGAGGAGATAGAGGAGGCTTCCCTCCAAGAGGACCCCGGGGTTCCCGAGGGAACCCCTCTGGAGGAGGAAACGTCCAGCACCGAGCTGGAGACTGGCAGTGTCCCAATCCGGGTTGTGGAAACCAGAACTTCGCCTGGAGAACAGAGTGCAACCAGTGTAAGGCCCCAAAGCCTGAAGGCTTCCTCCCGCCACCCTTTCCGCCCCCGGGTGGTGATCGTGGCAGAGGTGGCCCTGGTGGCATGCGGGGAGGAAGAGGTGGCCTCATGGATCGTGGTGGTCCCGGTGGAATGTTCAGAGGTGGCCGTGGTGGAGACAGAGGTGGCTTCCGTGGTGGCCGGGGCATGGACCGAGGTGGCTTTGGTGGAGGAAGACGAGGTGGCCCTGGGGGGCCCCCTGGACCTTTGATGGAACAGGCGATCGCAGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGAGCAGAAGCTGATCTCAGAGGAGGACCTGCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGACGGAGCCGGAGCTGGCGCTGGAGCTGGAGCCGGAGCTGGCGGTCTAGCCACCATGGACGCACAAACACGACGACGTGAGCGTCGCGCTGAGAAACAAGCTCAATGGAAAGCTGCAAACCCACCGCTCGAGTCTAGAGGGCCCGTTTAA(SEQ ID NO:661)

蛋白:

MDSRVSSPEKQDKENFVGVNNKRLGVCGWILFSLSFLLVIITFPISIWMCLKIIKEYERMASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQAIAGAPGSAGSAAGSGEQKLISEEDLLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLDGAGAGAGAGAGAGGLATMDAQTRRRERRAEKQAQWKAANPPLESRGPV＊(SEQ ID NO:662)

SLP3::PylRS(AF)

DNA:

ATGGATTCTAGGGTGTCTTCACCTGAGAAGCAAGATAAAGAGAATTTCGTGGGTGTCAACAATAAACGGCTTGGTGTATGTGGCTGGATCCTGTTTTCCCTCTCTTTCCTGTTGGTGATCATTACCTTCCCCATCTCCATATGGATGTGCTTGAAGATCATTAAGGAGTATGAACGTGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQID NO:663)

蛋白:

MDSRVSSPEKQDKENFVGVNNKRLGVCGWILFSLSFLLVIITFPISIWMCLKIIKEYERGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:664)

TOM20::FUS::MCP::PylRS(AF)

DNA:

ATGGTGGGTCGGAACAGCGCCATCGCCGCCGGTGTATGCGGGGCCCTTTTCATTGGGTACTGCATCTACTTCGACCGCAAAAGACGAAGTGACCCCAACTTCAAGAACAGGCTTCGAGAACGAAGAAAGAAACAGAAGCTTGCCAAGGAGAGAGCTGGGCTTTCCAAGTTACCTGACCTTAAAGATGCTGAAGCTGTTCAGAAATTCTTCATGGCCTCAAACGATTATACCCAACAAGCAACCCAAAGCTATGGGGCCTACCCCACCCAGCCCGGGCAGGGCTATTCCCAGCAGAGCAGTCAGCCCTACGGACAGCAGAGTTACAGTGGTTATAGCCAGTCCACGGACACTTCAGGATATGGCCAGAGCAGCTATTCTTCTTATGGCCAGAGCCAGAACACAGGCTATGGAACTCAGTCAACTCCCCAGGGATATGGCTCGACTGGCGGCTATGGCAGTAGCCAGAGCTCCCAATCGTCTTACGGGCAGCAGTCCTCCTACCCTGGCTATGGCCAGCAGCCAGCTCCCAGCAGCACCTCGGGAAGTTACGGTAGCAGTTCTCAGAGCAGCAGCTATGGGCAGCCCCAGAGTGGGAGCTACAGCCAGCAGCCTAGCTATGGTGGACAGCAGCAAAGCTATGGACAGCAGCAAAGCTATAATCCCCCTCAGGGCTATGGACAGCAGAACCAGTACAACAGCAGCAGTGGTGGTGGAGGTGGAGGTGGAGGTGGAGGTAACTATGGCCAAGATCAATCCTCCATGAGTAGTGGTGGTGGCAGTGGTGGCGGTTATGGCAATCAAGACCAGAGTGGTGGAGGTGGCAGCGGTGGCTATGGACAGCAGGACCGTGGAGGCCGCGGCAGGGGTGGCAGTGGTGGCGGCGGCGGCGGCGGCGGTGGTGGTTACAACCGCAGCAGTGGTGGCTATGAACCCAGAGGTCGTGGAGGTGGCCGTGGAGGCAGAGGTGGCATGGGCGGAAGTGACCGTGGTGGCTTCAATAAATTTGGTGGCCCTCGGGACCAAGGATCACGTCATGACTCCGAACAGGATAATTCAGACAACAACACCATCTTTGTGCAAGGCCTGGGTGAGAATGTTACAATTGAGTCTGTGGCTGATTACTTCAAGCAGATTGGTATTATTAAGACAAACAAGAAAACGGGACAGCCCATGATTAATTTGTACACAGACAGGGAAACTGGCAAGCTGAAGGGAGAGGCAACGGTCTCTTTTGATGACCCACCTTCAGCTAAAGCAGCTATTGACTGGTTTGATGGTAAAGAATTCTCCGGAAATCCTATCAAGGTCTCATTTGCTACTCGCCGGGCAGACTTTAATCGGGGTGGTGGCAATGGTCGTGGAGGCCGAGGGCGAGGAGGACCCATGGGCCGTGGAGGCTATGGAGGTGGTGGCAGTGGTGGTGGTGGCCGAGGAGGATTTCCCAGTGGAGGTGGTGGCGGTGGAGGACAGCAGCGAGCTGGTGACTGGAAGTGTCCTAATCCCACCTGTGAGAATATGAACTTCTCTTGGAGGAATGAATGCAACCAGTGTAAGGCCCCTAAACCAGATGGCCCAGGAGGGGGACCAGGTGGCTCTCACATGGGGGGTAACTACGGGGATGATCGTCGTGGTGGCAGAGGAGGCGCGATCGCATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACGGCGCCGATTACAAGGACGATGATGACAAGGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:665)

蛋白:

MVGRNSAIAAGVCGALFIGYCIYFDRKRRSDPNFKNRLRERRKKQKLAKERAGLSKLPDLKDAEAVQKFFMASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGAIAYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGADYKDDDDKGAPGSAGSAAGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:666)

KIF16B::1xLAF-1::PylRS(AF)

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACAGACTACAAGGACGACGATGATAAGATGGAAAGCAACCAGAGCAACAACGGCGGCTCTGGCAACGCCGCTCTGAACAGAGGCGGCAGATACGTGCCCCCCCACCTGAGAGGAGGCGACGGCGGCGCCGCCGCCGCTGCATCTGCCGGCGGAGATGACAGAAGAGGCGGAGCCGGAGGCGGCGGCTATAGACGGGGAGGCGGAAACAGCGGCGGCGGAGGCGGAGGCGGCTACGACAGAGGCTACAACGACAACCGGGACGACCGGGACAACAGAGGCGGCAGCGGCGGATACGGCAGAGATCGAAACTACGAGGACAGAGGCTACAATGGCGGAGGCGGAGGCGGCGGCAACCGGGGCTACAACAACAACAGAGGAGGCGGCGGCGGCGGCTACAACCGCCAGGACAGAGGCGATGGCGGATCTAGCAATTTCAGCAGAGGCGGCTACAACAACCGGGACGAGGGCAGCGACAACAGAGGCAGCGGAAGAAGCTACAACAATGACCGGAGAGATAATGGCGGAGATGGCTCCGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:667)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTDYKDDDDKMESNQSNNGGSGNAALNRGGRYVPPHLRGGDGGAAAAASAGGDDRRGGAGGGGYRRGGGNSGGGGGGGYDRGYNDNRDDRDNRGGSGGYGRDRNYEDRGYNGGGGGGGNRGYNNNRGGGGGGYNRQDRGDGGSSNFSRGGYNNRDEGSDNRGSGRSYNNDRRDNGGDGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ IDNO:668)

KIF16B::1xLAF-1::MCP

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACAGACTACAAGGACGACGATGATAAGATGGAAAGCAACCAGAGCAACAACGGCGGCTCTGGCAACGCCGCTCTGAACAGAGGCGGCAGATACGTGCCCCCCCACCTGAGAGGAGGCGACGGCGGCGCCGCCGCCGCTGCATCTGCCGGCGGAGATGACAGAAGAGGCGGAGCCGGAGGCGGCGGCTATAGACGGGGAGGCGGAAACAGCGGCGGCGGAGGCGGAGGCGGCTACGACAGAGGCTACAACGACAACCGGGACGACCGGGACAACAGAGGCGGCAGCGGCGGATACGGCAGAGATCGAAACTACGAGGACAGAGGCTACAATGGCGGAGGCGGAGGCGGCGGCAACCGGGGCTACAACAACAACAGAGGAGGCGGCGGCGGCGGCTACAACCGCCAGGACAGAGGCGATGGCGGATCTAGCAATTTCAGCAGAGGCGGCTACAACAACCGGGACGAGGGCAGCGACAACAGAGGCAGCGGAAGAAGCTACAACAATGACCGGAGAGATAATGGCGGAGATGGCTCCGGATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:669)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTDYKDDDDKMESNQSNNGGSGNAALNRGGRYVPPHLRGGDGGAAAAASAGGDDRRGGAGGGGYRRGGGNSGGGGGGGYDRGYNDNRDDRDNRGGSGGYGRDRNYEDRGYNGGGGGGGNRGYNNNRGGGGGGYNRQDRGDGGSSNFSRGGYNNRDEGSDNRGSGRSYNNDRRDNGGDGSGYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:670)

KIF16B::1xLAF-1::2xPCP

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACAGACTACAAGGACGACGATGATAAGATGGAAAGCAACCAGAGCAACAACGGCGGCTCTGGCAACGCCGCTCTGAACAGAGGCGGCAGATACGTGCCCCCCCACCTGAGAGGAGGCGACGGCGGCGCCGCCGCCGCTGCATCTGCCGGCGGAGATGACAGAAGAGGCGGAGCCGGAGGCGGCGGCTATAGACGGGGAGGCGGAAACAGCGGCGGCGGAGGCGGAGGCGGCTACGACAGAGGCTACAACGACAACCGGGACGACCGGGACAACAGAGGCGGCAGCGGCGGATACGGCAGAGATCGAAACTACGAGGACAGAGGCTACAATGGCGGAGGCGGAGGCGGCGGCAACCGGGGCTACAACAACAACAGAGGAGGCGGCGGCGGCGGCTACAACCGCCAGGACAGAGGCGATGGCGGATCTAGCAATTTCAGCAGAGGCGGCTACAACAACCGGGACGAGGGCAGCGACAACAGAGGCAGCGGAAGAAGCTACAACAATGACCGGAGAGATAATGGCGGAGATGGCTCCGGCGAGCAGAAGCTGATCTCAGAGGAGGACCTGATCGAAGGCCGCCATATGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTGCGGATCCGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTCCACCGGTCGCCACCTAA(SEQ ID NO:671)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTDYKDDDDKMESNQSNNGGSGNAALNRGGRYVPPHLRGGDGGAAAAASAGGDDRRGGAGGGGYRRGGGNSGGGGGGGYDRGYNDNRDDRDNRGGSGGYGRDRNYEDRGYNGGGGGGGNRGYNNNRGGGGGGYNRQDRGDGGSSNFSRGGYNNRDEGSDNRGSGRSYNNDRRDNGGDGSGEQKLISEEDLIEGRHMLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRADPLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRPPVAT＊(SEQ ID NO:672)

KIF16B::2xLAF-1::2xPCP

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACAGACTACAAGGACGACGATGATAAGATGGAAAGCAACCAGAGCAACAACGGCGGCTCTGGCAACGCCGCTCTGAACAGAGGCGGCAGATACGTGCCCCCCCACCTGAGAGGAGGCGACGGCGGCGCCGCCGCCGCTGCATCTGCCGGCGGAGATGACAGAAGAGGCGGAGCCGGAGGCGGCGGCTATAGACGGGGAGGCGGAAACAGCGGCGGCGGAGGCGGAGGCGGCTACGACAGAGGCTACAACGACAACCGGGACGACCGGGACAACAGAGGCGGCAGCGGCGGATACGGCAGAGATCGAAACTACGAGGACAGAGGCTACAATGGCGGAGGCGGAGGCGGCGGCAACCGGGGCTACAACAACAACAGAGGAGGCGGCGGCGGCGGCTACAACCGCCAGGACAGAGGCGATGGCGGATCTAGCAATTTCAGCAGAGGCGGCTACAACAACCGGGACGAGGGCAGCGACAACAGAGGCAGCGGAAGAAGCTACAACAATGACCGGAGAGATAATGGCGGAGATGGCTCCGGCGGAATGGAAAGCAACCAGAGCAACAACGGCGGCTCTGGCAACGCCGCTCTGAACAGAGGCGGCAGATACGTGCCCCCCCACCTGAGAGGAGGCGACGGCGGCGCCGCCGCCGCTGCATCTGCCGGCGGAGATGACAGAAGAGGCGGAGCCGGAGGCGGCGGCTATAGACGGGGAGGCGGAAACAGCGGCGGCGGAGGCGGAGGCGGCTACGACAGAGGCTACAACGACAACCGGGACGACCGGGACAACAGAGGCGGCAGCGGCGGATACGGCAGAGATCGAAACTACGAGGACAGAGGCTACAATGGCGGAGGCGGAGGCGGCGGCAACCGGGGCTACAACAACAACAGAGGAGGCGGCGGCGGCGGCTACAACCGCCAGGACAGAGGCGATGGCGGATCTAGCAATTTCAGCAGAGGCGGCTACAACAACCGGGACGAGGGCAGCGACAACAGAGGCAGCGGAAGAAGCTACAACAATGACCGGAGAGATAATGGCGGAGATGGCTCCGGCGAGCAGAAGCTGATCTCAGAGGAGGACCTGATCGAAGGCCGCCATATGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTGCGGATCCGCTAGCCTCCAAAACCATCGTTCTTTCGGTCGGCGAGGCTACTCGCACTCTGACTGAGATCCAGTCCACCGCAGACCGTCAGATCTTCGAAGAGAAGGTCGGGCCTCTGGTGGGTCGGCTGCGCCTCACGGCTTCGCTCCGTCAAAACGGAGCCAAGACCGCGTATCGCGTCAACCTAAAACTGGATCAGGCGGACGTCGTTGATTCCGGACTTCCGAAAGTGCGCTACACTCAGGTATGGTCGCACGACGTGACAATCGTTGCGAATAGCACCGAGGCCTCGCGCAAATCGTTGTACGATTTGACCAAGTCCCTCGTCGCGACCTCGCAGGTCGAAGATCTTGTCGTCAACCTTGTGCCGCTGGGCCGTCCACCGGTCGCCACCTAA(SEQ ID NO:673)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTDYKDDDDKMESNQSNNGGSGNAALNRGGRYVPPHLRGGDGGAAAAASAGGDDRRGGAGGGGYRRGGGNSGGGGGGGYDRGYNDNRDDRDNRGGSGGYGRDRNYEDRGYNGGGGGGGNRGYNNNRGGGGGGYNRQDRGDGGSSNFSRGGYNNRDEGSDNRGSGRSYNNDRRDNGGDGSGGMESNQSNNGGSGNAALNRGGRYVPPHLRGGDGGAAAAASAGGDDRRGGAGGGGYRRGGGNSGGGGGGGYDRGYNDNRDDRDNRGGSGGYGRDRNYEDRGYNGGGGGGGNRGYNNNRGGGGGGYNRQDRGDGGSSNFSRGGYNNRDEGSDNRGSGRSYNNDRRDNGGDGSGEQKLISEEDLIEGRHMLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRADPLASKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRPPVAT＊(SEQ ID NO:674)

KIF16B::2xLAF-1::PylRS(AF)

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACAGACTACAAGGACGACGATGATAAGATGGAAAGCAACCAGAGCAACAACGGCGGCTCTGGCAACGCCGCTCTGAACAGAGGCGGCAGATACGTGCCCCCCCACCTGAGAGGAGGCGACGGCGGCGCCGCCGCCGCTGCATCTGCCGGCGGAGATGACAGAAGAGGCGGAGCCGGAGGCGGCGGCTATAGACGGGGAGGCGGAAACAGCGGCGGCGGAGGCGGAGGCGGCTACGACAGAGGCTACAACGACAACCGGGACGACCGGGACAACAGAGGCGGCAGCGGCGGATACGGCAGAGATCGAAACTACGAGGACAGAGGCTACAATGGCGGAGGCGGAGGCGGCGGCAACCGGGGCTACAACAACAACAGAGGAGGCGGCGGCGGCGGCTACAACCGCCAGGACAGAGGCGATGGCGGATCTAGCAATTTCAGCAGAGGCGGCTACAACAACCGGGACGAGGGCAGCGACAACAGAGGCAGCGGAAGAAGCTACAACAATGACCGGAGAGATAATGGCGGAGATGGCTCCGGCGGAATGGAAAGCAACCAGAGCAACAACGGCGGCTCTGGCAACGCCGCTCTGAACAGAGGCGGCAGATACGTGCCCCCCCACCTGAGAGGAGGCGACGGCGGCGCCGCCGCCGCTGCATCTGCCGGCGGAGATGACAGAAGAGGCGGAGCCGGAGGCGGCGGCTATAGACGGGGAGGCGGAAACAGCGGCGGCGGAGGCGGAGGCGGCTACGACAGAGGCTACAACGACAACCGGGACGACCGGGACAACAGAGGCGGCAGCGGCGGATACGGCAGAGATCGAAACTACGAGGACAGAGGCTACAATGGCGGAGGCGGAGGCGGCGGCAACCGGGGCTACAACAACAACAGAGGAGGCGGCGGCGGCGGCTACAACCGCCAGGACAGAGGCGATGGCGGATCTAGCAATTTCAGCAGAGGCGGCTACAACAACCGGGACGAGGGCAGCGACAACAGAGGCAGCGGAAGAAGCTACAACAATGACCGGAGAGATAATGGCGGAGATGGCTCCGGAGCGTGCCCGGTGCCGCTGCAGCTGCCGCCGCTGGAACGCCTGACCCTGGATGATAAAAAACCGCTGAATACCCTGATCTCTGCTACTGGTCTGTGGATGAGTCGTACCGGAACCATTCATAAAATCAAACACCACGAGGTTAGCCGTTCGAAAATCTATATTGAGATGGCGTGTGGCGATCATCTGGTTGTGAACAATAGCCGCTCTTCTCGTACAGCACGTGCACTGCGTCACCACAAATATCGTAAAACCTGTAAACGTTGCCGTGTGTCCGATGAGGATCTGAACAAATTCCTGACAAAAGCCAATGAGGACCAAACAAGCGTGAAAGTGAAAGTCGTTAGCGCTCCTACCCGTACTAAAAAAGCAATGCCGAAATCCGTTGCTCGTGCCCCTAAACCACTGGAAAACACTGAAGCAGCACAGGCACAGCCGTCTGGAAGCAAATTCTCTCCGGCCATTCCTGTTTCTACCCAGGAGTCCGTTTCTGTTCCAGCAAGTGTGAGCACCAGCATTAGCAGTATTAGCACCGGTGCCACCGCTAGCGCCCTGGTTAAAGGCAATACCAATCCGATTACAAGCATGTCTGCCCCGGTTCAAGCATCAGCTCCAGCACTGACAAAATCCCAAACCGATCGTCTGGAGGTTCTGCTGAATCCGAAAGACGAAATCAGCCTGAATTCCGGCAAACCGTTTCGTGAACTGGAGAGCGAACTGCTGTCACGTCGTAAAAAAGACCTGCAACAAATCTATGCCGAAGAACGTGAGAACTATCTGGGGAAACTGGAACGTGAAATCACCCGCTTTTTCGTGGATCGTGGCTTTCTGGAGATCAAATCCCCGATTCTGATTCCTCTGGAGTATATCGAGCGTATGGGCATCGACAATGATACCGAACTGAGCAAACAAATTTTCCGTGTGGATAAAAACTTCTGTCTGCGCCCTATGCTAGCACCAAATCTGGCTAACTATCTGCGCAAACTGGACCGTGCCCTGCCTGATCCTATCAAAATCTTCGAGATCGGCCCGTGTTATCGTAAAGAGTCCGACGGTAAAGAACATCTGGAGGAGTTTACCATGCTGAACTTTTGCCAAATGGGTTCAGGTTGTACTCGTGAGAACCTGGAAAGCATCATCACCGATTTTCTGAACCACCTGGGCATTGACTTCAAAATTGTGGGCGACAGCTGTATGGTGTTTGGCGACACCCTGGATGTCATGCACGGCGACCTGGAACTGTCTAGTGCCGTTGTGGGCCCAATCCCGCTGGATCGTGAGTGGGGTATCGACAAACCTTGGATCGGTGCGGGTTTTGGTCTGGAGCGTCTGCTGAAAGTAAAACACGACTTCAAGAACATCAAACGTGCTGCACGTTCCGAGTCCTATTACAATGGTATTTCTACTAACCTGTAA(SEQ ID NO:675)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTDYKDDDDKMESNQSNNGGSGNAALNRGGRYVPPHLRGGDGGAAAAASAGGDDRRGGAGGGGYRRGGGNSGGGGGGGYDRGYNDNRDDRDNRGGSGGYGRDRNYEDRGYNGGGGGGGNRGYNNNRGGGGGGYNRQDRGDGGSSNFSRGGYNNRDEGSDNRGSGRSYNNDRRDNGGDGSGGMESNQSNNGGSGNAALNRGGRYVPPHLRGGDGGAAAAASAGGDDRRGGAGGGGYRRGGGNSGGGGGGGYDRGYNDNRDDRDNRGGSGGYGRDRNYEDRGYNGGGGGGGNRGYNNNRGGGGGGYNRQDRGDGGSSNFSRGGYNNRDEGSDNRGSGRSYNNDRRDNGGDGSGACPVPLQLPPLERLTLDDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLANYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL＊(SEQ ID NO:676)

KIF16B::2xLAF-1::MCP

DNA:

ATGGCATCGGTCAAGGTGGCCGTGAGGGTCCGGCCCATGAATCGCAGGGAAAAGGACTTGGAGGCCAAGTTCATTATTCAGATGGAGAAAAGCAAAACGACAATCACAAACTTAAAGATACCAGAAGGAGGCACTGGGGACTCAGGAAGAGAACGGACCAAGACCTTCACCTATGACTTTTCTTTTTATTCTGCTGATACAAAAAGCCCAGATTACGTTTCACAAGAAATGGTTTTCAAAACCCTCGGCACAGATGTCGTGAAGTCTGCATTTGAAGGTTATAATGCTTGTGTCTTTGCATATGGGCAAACTGGATCTGGAAAGTCATACACTATGATGGGAAATTCTGGAGATTCTGGCTTAATACCTCGGATCTGTGAAGGACTCTTCAGTCGGATAAATGAAACCACCAGATGGGATGAAGCTTCTTTTCGAACTGAAGTCAGCTACTTAGAAATTTATAACGAACGTGTGAGAGATCTACTTCGGCGGAAGTCATCTAAAACCTTCAATTTGAGAGTCCGTGAGCATCCCAAAGAAGGCCCTTATGTTGAGGATTTATCCAAACATTTAGTACAGAATTATGGTGACGTAGAAGAACTTATGGATGCGGGCAATATCAACCGGACCACCGCAGCGACTGGGATGAACGACGTCAGTAGCAGGTCTCATGCCATCTTCACCATCAAGTTCACTCAGGCTAAATTTGATTCTGAAATGCCATGTGAAACCGTCAGTAAGATCCACTTGGTTGATCTTGCCGGAAGTGAGCGTGCAGATGCCACCGGAGCCACCGGGGTTAGGCTAAAGGAAGGGGGAAATATTAACAAGTCCCTCGTGACTCTGGGGAACGTCATTTCTGCCTTAGCTGATTTATCTCAGGATGCTGCAAATACTCTTGCAAAGAAGAAGCAAGTTTTCGTGCCTTACAGGGATTCTGTGTTGACTTGGTTGTTAAAAGATAGCCTTGGAGGAAACTCTAAAACTATCATGATTGCCACCATTTCACCTGCTGATGTCAATTATGGAGAAACCCTAAGTACTCTTCGCTATGCAAATAGAGCCAAAAACATCATCAACAAGCCTACCATTAATGAGGATGCCAACGTCAAACTTATCCGTGAGCTGCGAGCTGAAATAGCCAGACTGAAAACGCTGCTTGCTCAAGGGAATCAGATTGCCCTCTTAGACTCCCCCACAGACTACAAGGACGACGATGATAAGATGGAAAGCAACCAGAGCAACAACGGCGGCTCTGGCAACGCCGCTCTGAACAGAGGCGGCAGATACGTGCCCCCCCACCTGAGAGGAGGCGACGGCGGCGCCGCCGCCGCTGCATCTGCCGGCGGAGATGACAGAAGAGGCGGAGCCGGAGGCGGCGGCTATAGACGGGGAGGCGGAAACAGCGGCGGCGGAGGCGGAGGCGGCTACGACAGAGGCTACAACGACAACCGGGACGACCGGGACAACAGAGGCGGCAGCGGCGGATACGGCAGAGATCGAAACTACGAGGACAGAGGCTACAATGGCGGAGGCGGAGGCGGCGGCAACCGGGGCTACAACAACAACAGAGGAGGCGGCGGCGGCGGCTACAACCGCCAGGACAGAGGCGATGGCGGATCTAGCAATTTCAGCAGAGGCGGCTACAACAACCGGGACGAGGGCAGCGACAACAGAGGCAGCGGAAGAAGCTACAACAATGACCGGAGAGATAATGGCGGAGATGGCTCCGGCGGAATGGAAAGCAACCAGAGCAACAACGGCGGCTCTGGCAACGCCGCTCTGAACAGAGGCGGCAGATACGTGCCCCCCCACCTGAGAGGAGGCGACGGCGGCGCCGCCGCCGCTGCATCTGCCGGCGGAGATGACAGAAGAGGCGGAGCCGGAGGCGGCGGCTATAGACGGGGAGGCGGAAACAGCGGCGGCGGAGGCGGAGGCGGCTACGACAGAGGCTACAACGACAACCGGGACGACCGGGACAACAGAGGCGGCAGCGGCGGATACGGCAGAGATCGAAACTACGAGGACAGAGGCTACAATGGCGGAGGCGGAGGCGGCGGCAACCGGGGCTACAACAACAACAGAGGAGGCGGCGGCGGCGGCTACAACCGCCAGGACAGAGGCGATGGCGGATCTAGCAATTTCAGCAGAGGCGGCTACAACAACCGGGACGAGGGCAGCGACAACAGAGGCAGCGGAAGAAGCTACAACAATGACCGGAGAGATAATGGCGGAGATGGCTCCGGATATCCCTATGATGTGCCGGATTATGCTGGAGCACCAGGAAGTGCTGGTTCTGCTGCTGGTAGTGGAGCTTCTAACTTTACTCAGTTCGTTCTCGTCGACAATGGCGGAACTGGCGACGTGACTGTCGCCCCAAGCAACTTCGCTAACGGGATCGCTGAATGGATCAGCTCTAACTCGCGTTCACAGGCTTACAAAGTAACCTGTAGCGTTCGTCAGAGCTCTGCGCAGAATCGCAAATACACCATCAAAGTCGAGGTGCCTAAAGGCGCCTGGCGTTCGTACTTAAATATGGAACTAACCATTCCAATTTTCGCCACGAATTCCGACTGCGAGCTTATTGTTAAGGCAATGCAAGGTCTCCTAAAAGATGGAAACCCGATTCCCTCAGCAATCGCAGCAAACTCCGGCATCTACTAA(SEQ ID NO:677)

蛋白:

MASVKVAVRVRPMNRREKDLEAKFIIQMEKSKTTITNLKIPEGGTGDSGRERTKTFTYDFSFYSADTKSPDYVSQEMVFKTLGTDVVKSAFEGYNACVFAYGQTGSGKSYTMMGNSGDSGLIPRICEGLFSRINETTRWDEASFRTEVSYLEIYNERVRDLLRRKSSKTFNLRVREHPKEGPYVEDLSKHLVQNYGDVEELMDAGNINRTTAATGMNDVSSRSHAIFTIKFTQAKFDSEMPCETVSKIHLVDLAGSERADATGATGVRLKEGGNINKSLVTLGNVISALADLSQDAANTLAKKKQVFVPYRDSVLTWLLKDSLGGNSKTIMIATISPADVNYGETLSTLRYANRAKNIINKPTINEDANVKLIRELRAEIARLKTLLAQGNQIALLDSPTDYKDDDDKMESNQSNNGGSGNAALNRGGRYVPPHLRGGDGGAAAAASAGGDDRRGGAGGGGYRRGGGNSGGGGGGGYDRGYNDNRDDRDNRGGSGGYGRDRNYEDRGYNGGGGGGGNRGYNNNRGGGGGGYNRQDRGDGGSSNFSRGGYNNRDEGSDNRGSGRSYNNDRRDNGGDGSGGMESNQSNNGGSGNAALNRGGRYVPPHLRGGDGGAAAAASAGGDDRRGGAGGGGYRRGGGNSGGGGGGGYDRGYNDNRDDRDNRGGSGGYGRDRNYEDRGYNGGGGGGGNRGYNNNRGGGGGGYNRQDRGDGGSSNFSRGGYNNRDEGSDNRGSGRSYNNDRRDNGGDGSGYPYDVPDYAGAPGSAGSAAGSGASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY＊(SEQ ID NO:678)

3.表位标签：

VSV-G:水泡性口炎病毒糖蛋白表位标签

DNA:

TATACAGATATTGAAATGAACAGATTGGGAAAG(SEQ ID NO:679)

蛋白:

YTDIEMNRLGK(SEQ ID NO:680)

HA:人流感病毒血凝素表位标签

DNA:

TACCCCTACGACGTGCCCGACTACGCC(SEQ ID NO:681)

蛋白:

YPYDVPDYA(SEQ ID NO:682)

Myc:人c-Myc原癌基因表位标签

DNA:

GAGCAGAAGCTGATCTCAGAGGAGGACCTG(SEQ ID NO:683)

蛋白:

EQKLISEEDL(SEQ ID NO:684)

Claims

1.一种组装器融合蛋白(AFP)，其包含：

(a)充当组装器(AP)的至少一个第一多肽区段，其选自：

(b)充当效应物(EP)的至少一个第二多肽区段，其选自：

b1)靶向RNA的多肽(RNA-TP)区段，和

b2)正交氨酰tRNA合成酶(O-RS)区段；

其中所述多肽区段在所述AFP中功能性连接。

2.一种组装器融合蛋白(AFP)组合，其包含至少两种权利要求1的AFP。

3.一种融合蛋白(RNA-TP/O-RS融合蛋白)，其包含：

(i)至少一个靶向RNA的多肽(RNA-TP)区段；和

(ii)至少一个正交氨酰tRNA合成酶(O-RS)区段，

其中所述多肽区段在所述RNA-TP/O-RS融合蛋白中功能性连接。

4.一种核酸分子或者两种或更多种核酸分子的组合，其包含：

(i)核苷酸序列，其编码至少一种权利要求1的AFP或者至少一种权利要求2的AFP组合，或

(ii)与(i)的核苷酸序列互补的核酸序列，

(iii)(i)和(ii)。

5.一种核酸分子或者两种或更多种核酸分子的组合，其包含：

(i)核苷酸序列，其编码至少一种权利要求3的RNA-TP/O-RS融合蛋白，或

(ii)与(i)互补的核酸序列，或

(iii)(i)和(ii)。

6.一种表达盒，其包含权利要求4或权利要求5的核酸分子或者核酸分子的组合的核苷酸序列。

7.一种表达载体，其包含至少一种权利要求6的表达盒。

8.一种细胞，其包含至少一种权利要求4或权利要求5的核酸分子或者核酸分子的组合、至少一种权利要求6的表达盒或者至少一种权利要求7的表达载体。

9.权利要求8的细胞，其包含核苷酸序列，所述核苷酸序列编码至少一种权利要求1的AFP或者与编码至少一种权利要求1的AFP的核苷酸序列互补，

所述AFP包含(i)选自RNA-TP区段的至少一个EP，和(ii)选自O-RS区段的至少一个EP。

10.权利要求8的细胞，其包含核苷酸序列，所述核苷酸序列编码至少两种权利要求1的AFP的组合或者与编码至少两种权利要求1的AFP的组合的核苷酸序列互补，

其中所述至少两种AFP中的一种包含至少一个RNA-TP区段，而所述至少两种AFP中的另外一种包含至少一个O-RS区段。

11.权利要求8的细胞，其包含核苷酸序列，所述核苷酸序列编码至少一种权利要求3的RNA-TP/O-RS融合蛋白或者与编码至少一种权利要求3的RNA-TP/O-RS融合蛋白的核苷酸序列互补。

12.一种制备感兴趣的多肽(POI)的方法，所述POI在其氨基酸序列中包含一种或多种非典型氨基酸(ncAA)残基，其中所述方法包括在所述一种或多种ncAA的存在下，在权利要求9或权利要求10的细胞中表达所述POI，其中所述细胞包含：

(i)编码POI的核苷酸序列(CS^POI)，其中所述POI的一种或多种ncAA残基由选择密码子编码，

(ii)靶向核苷酸序列(TN)，其功能性连接至所述CS^POI，并且能够与所述细胞中AFP中的至少一种的RNA-TP区段相互作用；

(iii)一种或多种正交tRNA^ncAA(O-tRNA^ncAA)分子，其携带与所述CS^POI的选择密码子互补的反密码子，并且其中所述O-tRNA^ncAA分子与所述细胞中的AFP中的至少一种的一个或多个O-RS区段一起形成一个或多个正交O-RS/O-tRNA^ncAA对，其允许将所述一种或多种ncAA残基引入所述POI的氨基酸序列中；

并且其中所述方法任选地进一步包括回收表达的POI。

13.一种制备感兴趣的多肽(POI)的方法，所述POI在其氨基酸序列中包含一种或多种非典型氨基酸(ncAA)残基，其中所述方法包括在所述一种或多种ncAA的存在下，在权利要求11的细胞中表达所述POI，其中所述细胞包含：

(iv)编码POI的核苷酸序列(CS^POI)，其中所述POI的一种或多种ncAA残基由选择密码子编码，

(v)靶向核苷酸序列(TN)，其功能性连接至所述CS^POI，并且能够与所述细胞中RNA-TP/O-RS融合蛋白中的至少一种的RNA-TP区段相互作用；

(vi)一种或多种正交tRNA^ncAA(O-tRNA^ncAA)分子，其携带与所述CS^POI的选择密码子互补的反密码子，并且其中所述O-tRNA^ncAA分子与细胞中的RNA-TP/O-RS融合蛋白的一个或多个O-RS区段一起形成一个或多个正交O-RS/OtRNA^ncAA对，其允许将所述一种或多种ncAA残基引入所述POI的氨基酸序列中；

并且其中所述方法任选地进一步包括回收表达的POI。

14.一种核酸分子，其包含：

15.一种试剂盒，其用于制备具有至少一个非典型氨基酸(ncAA)残基的感兴趣的多肽(POI)，所述试剂盒包含：

-至少一种权利要求7的表达载体。