CN117460844A

CN117460844A - 新nrg1融合物、融合接点以及检测它们的方法

Info

Publication number: CN117460844A
Application number: CN202280040112.2A
Authority: CN
Inventors: 埃内斯托·伊萨克·沃瑟曼; 玉龙·吉尔斯·拉默特斯范布伦
Original assignee: Merus BV
Current assignee: Merus BV
Priority date: 2021-06-03
Filing date: 2022-06-01
Publication date: 2024-01-26

Abstract

本公开涉及神经调节蛋白1(NRG1)融合物、检测这类融合物的方法、鉴定或诊断具有这类融合物的患者的方法、以及治疗包含NRG1融合物的癌症、肿瘤或异常细胞的方法的领域。此外，本公开涉及用于治疗患有包含NRG1融合物的ErbB‑2/ErbB‑3阳性癌症的受试者的治疗性(人类)化合物的领域。

Description

新NRG1融合物、融合接点以及检测它们的方法

技术领域

本公开涉及神经调节蛋白1(NRG1)融合物的领域、检测该融合物的方法、鉴定或诊断具有该融合物的患者的方法、以及治疗包含NRG1融合物的癌症、肿瘤或异常细胞的方法。此外，本公开涉及用于治疗患有包含NRG1融合物的ErbB-2/ErbB-3阳性癌症的受试者的治疗性(人类)化合物的领域。

背景技术

跨膜NRG1同种型的胞外结构域的蛋白分解处理会释放可溶性因子。HRG1-β1是由NRG1基因编码的蛋白质之一。NRG1含有Ig结构域和EGF样结构域，该EGF样结构域对于直接结合至受体酪氨酸激酶ErbB-3和ErbB-4是必要的。NRG1基因和同种型已知有许多不同的别名，诸如：神经调节蛋白1(Neuregulin 1)；Pro-NRG1；HRGA；SMDF；HGL；GGF；NDF；NRG1内切转录2(Intronic Transcript 2，不编码蛋白质)；Heregulin,α(45kD,ERBB2P185-活化子)；乙酰胆碱受体诱导活性(Acetylcholine Receptor-Inducing Activity)；原神经调节蛋白-1(Pro-Neuregulin-1)，其是膜结合同种型；感觉和运动神经元衍生因子；新分化因子(NeuDifferentiation Factor)；神经胶质生长因子2；NRG1-IT2；MSTP131；MST131；ARIA；GGF2；HRG1；和HRG。NRG1基因的外部Id为HGNC:7997；Entrez Gene:3084；Ensembl:ENSG00000157168；OMIM:142445及UniProtKB:Q02297。

NRG1同种型是通过选择性剪接制造，且包括跨膜、外部膜结合、脱落(shed)、分泌或胞内形式(Falls,Exp Cell Res 284:14-30,2003；Hayes和Gullick,J.Mammary GlandBiol Neoplasia13:205-214,2008)。它们结合至ErbB-3或ErbB-4，这可理解为促进与ErbB-2(HER2)形成异源二聚体。虽然通常将NRG1编码蛋白视为有丝分裂原(mitogen)，但其也可强力促进细胞凋亡：特别是在细胞中表达NRG1可造成该表达细胞的细胞凋亡(参见Weinstein等人,oncogene17:2107-2113,1998)。

鉴于各种不同具有NRG1融合物的肿瘤类型，基于新的融合配偶体以及NRG1与融合配偶体之间的新的断点，需要有更快且更稳健的诊断方法，且需要鉴定前所未知的NRG融合物的方法。

发明内容

本公开一般地提供了涉及NRG1和新型融合配偶体的融合物，以及由其所编码的多肽融合物。本公开提供了涉及NRG1和VAPB、NRG1和PVALB、NRG1和DAAM1、NRG1和ASPH、NRG1和ZFAT或者NRG1和DSCAML1作为新型融合配偶体的融合物，在此分别通常指VAPB-NRG1、PVALB-NRG1、DAAM1-NRG1、ASPH-NRG1、ZFAT-NRG1和DSCAML1-NRG1。更特别的是，本公开的该方面涉及：

包含与NRG1核酸序列或NRG1核酸序列的一部分融合的VAPB核酸序列或VAPB核酸序列的一部分的多核苷酸，或

包含与NRG1核酸序列或NRG1核酸序列的一部分融合的PVALB核酸序列或PVALB核酸序列的一部分的多核苷酸，或

包含与NRG1核酸序列或NRG1核酸序列的一部分融合的DAAM1核酸序列或DAAM1核酸序列的一部分的多核苷酸，或

包含与NRG1核酸序列或NRG1核酸序列的一部分融合的ASPH核酸序列或ASPH核酸序列的一部分的多核苷酸，或

包含与NRG1核酸序列或NRG1核酸序列的一部分融合的ZFAT核酸序列或ZFAT核酸序列的一部分的多核苷酸，或

包含与NRG1核酸序列或NRG1核酸序列的一部分融合的DSCAML1核酸序列或DSCAML1核酸序列的一部分的多核苷酸。

优选地，该VAPB核酸序列包含序列SEQ ID NO:17-23中的任一者或SEQ ID NO:17-23中的任一者的等位基因变体(的一部分)或由其组成。优选地，该NRG1核酸序列包含序列SEQ ID NO:125-138中的任一者或序列SEQ ID NO:125-138中的任一者的等位基因变体(的一部分)或由其组成。

替代性地或另外地，本公开提供一种包含VAPB的外显子1或外显子1的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地，VAPB的外显子1包含SEQ ID NO:17或由其组成，且其等位基因变体优选为SEQ ID NO:17的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成，且其等位基因变体优选为SEQID NO:126的变体。

优选地，该PVALB核酸序列包含序列SEQ ID NO:439-444中的任一者或SEQ ID NO:439-444中的任一者的等位基因变体(的一部分)或由其组成。优选地，该NRG1核酸序列包含序列SEQ ID NO:125-138中的任一者或序列SEQ ID NO:125-138中的任一者的等位基因变体(的一部分)或由其组成。

替代性地或另外地，本公开提供一种包含PVALB的外显子4或外显子4的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地，PVALB的外显子4包含SEQ ID NO:422或由其组成，且其等位基因变体优选为SEQ IDNO:422的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成，且其等位基因变体优选为SEQ ID NO:130的变体。

优选地，该DAAM1核酸序列包含序列SEQ ID NO:606-631中的任一者或SEQ ID NO:606-631中的任一者的等位基因变体(的一部分)或由其组成。优选地，该NRG1核酸序列包含序列SEQ ID NO:125-138中的任一者或序列SEQ ID NO:125-138中的任一者的等位基因变体(的一部分)或由其组成。

替代性地或另外地，本公开提供一种包含DAAM1的外显子1或外显子1的等位基因变体的一部分且其与NRG1的外显子1或外显子1的等位基因变体的一部分融合的多核苷酸。优选地，DAAM1的外显子1包含SEQ ID NO:606或由其组成，且其等位基因变体优选为SEQ IDNO:606的变体。NRG1的外显子1包含SEQ ID NO:125或由其组成，且其等位基因变体优选为SEQ ID NO:125的变体。

优选地，该ASPH核酸序列包含序列SEQ ID NO:637-662中的任一者或SEQ ID NO:637-662中的任一者的等位基因变体(的一部分)或由其组成。优选地，该NRG1核酸序列包含序列SEQ ID NO:125-138中的任一者或序列SEQ ID NO:125-138中的任一者的等位基因变体(的一部分)或由其组成。

替代性地或另外地，本公开提供一种包含ASPH的外显子22或外显子22的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地，ASPH的外显子22包含SEQ ID NO:658或由其组成，且其等位基因变体优选为SEQ IDNO:658的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成，且其等位基因变体优选为SEQ ID NO:126的变体。

优选地，该ZFAT核酸序列包含序列SEQ ID NO:830-846中的任一者或SEQ ID NO:830-846中的任一者的等位基因变体(的一部分)或由其组成。优选地，该NRG1核酸序列包含序列SEQ ID NO:125-138中的任一者或序列SEQ ID NO:125-138中的任一者的等位基因变体(的一部分)或由其组成。

替代性地或另外地，本公开提供一种包含ZFAT的外显子12或外显子12的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地，ZFAT的外显子12包含SEQ ID NO:841或由其组成，且其等位基因变体优选为SEQ IDNO:841的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成，且其等位基因变体优选为SEQ ID NO:130的变体。

优选地，该DSCAML1核酸序列包含序列SEQ ID NO:870-903中的任一者或SEQ IDNO:870-903中的任一者的等位基因变体(的一部分)或由其组成。优选地，该NRG1核酸序列包含序列SEQ ID NO:125-138中的任一者或序列SEQ ID NO:125-138中的任一者的等位基因变体(的一部分)或由其组成。

替代性地或另外地，本公开提供一种包含DSCAML1的外显子3或外显子3的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地，DSCAML1的外显子3包含SEQ ID NO:872或由其组成，且其等位基因变体优选为SEQ ID NO:872的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成，且其等位基因变体优选为SEQ ID NO:126的变体。

此外，本公开提供涉及具有先前未经公开的融合接点(fusion junctions)的NRG1的融合物，以及由其所编码的多肽融合物。特别地，本公开另外提供涉及NRG1与CADM1的融合物，在此一般来说指的是CADM1-NRG1。本公开也提供涉及NRG1与CD44的融合物，在此一般来说指的是CD44-NRG1。本公开也提供涉及NRG1与SLC3A2的融合物，在此一般来说指的是SLC3A2-NRG1。本公开也提供涉及NRG1与VTCN1的融合物，在此一般来说指的是VTCN1-NRG1。本公开也提供涉及NRG1与CDH1的融合物，在此一般来说指的是CDH1-NRG1。本公开也提供涉及NRG1与CXADR的融合物，在此一般来说指的是CXADR-NRG1。本公开也提供涉及NRG1与GTF2E2的融合物，在此一般来说指的是GTF2E2-NRG1。本公开也提供涉及NRG1与CSMD1的融合物，在此一般来说指的是CSMD1-NRG1。本公开也提供涉及NRG1与PTN的融合物，在此一般来说指的是PTN-NRG1。本公开也提供涉及NRG1与ST14的融合物，在此一般来说指的是ST14-NRG1。本公开也提供涉及NRG1与THBS1的融合物，在此一般来说指的是THBS1-NRG1。本公开也提供涉及NRG1与AGRN的融合物，在此一般来说指的是AGRN-NRG1。本公开也提供涉及NRG1与APP的融合物，在此一般来说指的是APP-NRG1。本公开也提供涉及NRG1与WRN的融合物，在此一般来说指的是WRN-NRG1。本公开也提供涉及NRG1与NRG1的融合物，在此一般来说指的是NRG1-NRG1。本公开也提供涉及NRG1与NOTCH2的融合物，在此一般来说指的是NOTCH2-NRG1。本公开也提供涉及NRG1与CD74的融合物，在此一般来说指的是CD74-NRG1。本公开也提供涉及NRG1与SDC4的融合物，在此一般来说指的是SDC4-NRG1。本公开也提供涉及NRG1与SLC4A4的融合物，在此一般来说指的是SLC4A4-NRG1。

本公开提供以下新型融合接点。特别地，本公开提供一种包含CADM1的外显子7或外显子7的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地，CADM1的外显子7包含SEQ ID NO:39或由其组成，且其等位基因变体优选为SEQ ID NO:39的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成，且其等位基因变体优选为SEQ ID NO:130的变体。

特别地，本公开提供一种包含CD44的外显子5或外显子5的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地，CD44的外显子5包含SEQ ID NO:65或由其组成，且其等位基因变体优选为SEQ ID NO:65的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成，且其等位基因变体优选为SEQ ID NO:126的变体。

特别地，本公开提供一种包含CD44的外显子5或外显子5的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地，CD44的外显子5包含SEQ ID NO:65或由其组成，且其等位基因变体优选为SEQ ID NO:65的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成，且其等位基因变体优选为SEQ ID NO:130的变体。

特别地，本公开提供一种包含SLC3A2的转录本6的外显子1或转录本6的外显子1的等位基因变体的一部分且其与NRG1的外显子5或外显子2的等位基因变体的一部分融合的多核苷酸。优选地，所述SLC3A2的外显子包含SEQ ID NO:103或由其组成，且其等位基因变体优选为SEQ ID NO:103的变体。NRG1的外显子5包含SEQ ID NO:129或由其组成，且其等位基因变体优选为SEQ ID NO:129的变体。

特别地，本公开提供一种包含VTCN1的外显子2或外显子2的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地，VTCN1的外显子2包含SEQ ID NO:169或由其组成，且其等位基因变体优选为SEQ ID NO:169的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成，且其等位基因变体优选为SEQ IDNO:126的变体。

特别地，本公开提供一种包含CDH1的外显子11或外显子11的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地，CDH1的外显子11包含SEQ ID NO:198或由其组成，且其等位基因变体优选为SEQ ID NO:198的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成，且其等位基因变体优选为SEQ IDNO:126的变体。

特别地，本公开提供一种包含CXADR的外显子1或外显子1的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地，CXADR的外显子1包含SEQ ID NO:219或由其组成，且其等位基因变体优选为SEQ ID NO:219的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成，且其等位基因变体优选为SEQ IDNO:126的变体。

特别地，本公开提供一种包含GTF2E2的外显子2或外显子2的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地，GTF2E2的外显子2包含SEQ ID NO:236或由其组成，且其等位基因变体优选为SEQ ID NO:236的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成，且其等位基因变体优选为SEQID NO:126的变体。

特别地，本公开提供一种包含CSMD1的外显子23或外显子23的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地，CSMD1的外显子23包含SEQ ID NO:279或由其组成，且其等位基因变体优选为SEQ ID NO:279的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成，且其等位基因变体优选为SEQID NO:130的变体。

特别地，本公开提供一种包含PTN的外显子4或外显子4的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地，PTN的外显子4包含SEQ ID NO:318或由其组成，且其等位基因变体优选为SEQ ID NO:318的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成，且其等位基因变体优选为SEQ ID NO:126的变体。

特别地，本公开提供一种包含ST14的外显子11或外显子11的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地，ST14的外显子11包含SEQ ID NO:342或由其组成，且其等位基因变体优选为SEQ ID NO:342的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成，且其等位基因变体优选为SEQ IDNO:130的变体。

特别地，本公开提供一种包含THBS1的外显子9或外显子9的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地，THBS1的外显子9包含SEQ ID NO:386或由其组成，且其等位基因变体优选为SEQ ID NO:386的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成，且其等位基因变体优选为SEQ IDNO:130的变体。

特别地，本公开提供一种包含AGRN的外显子12或外显子12的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地，AGRN的外显子12包含SEQ ID NO:416或由其组成，且其等位基因变体优选为SEQ ID NO:416的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成，且其等位基因变体优选为SEQ IDNO:130的变体。

特别地，本公开提供一种包含PVALB的外显子4或外显子4的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地，PVALB的外显子4包含SEQ ID NO:442或由其组成，且其等位基因变体优选为SEQ ID NO:442的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成，且其等位基因变体优选为SEQ IDNO:130的变体。

特别地，本公开提供一种包含SLC3A2的转录本3的外显子2或转录本3的外显子2的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地，所述SLC3A2的外显子包含SEQ ID NO:457或由其组成，且其等位基因变体优选为SEQ ID NO:457的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成，且其等位基因变体优选为SEQ ID NO:130的变体。

特别地，本公开提供一种包含APP的外显子14或外显子14的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地，APP的外显子14包含SEQ ID NO:501或由其组成，且其等位基因变体优选为SEQ ID NO:501的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成，且其等位基因变体优选为SEQ ID NO:130的变体。

特别地，本公开提供一种包含WRN的外显子33或外显子33的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地，WRN的外显子33包含SEQ ID NO:562或由其组成，且其等位基因变体优选为SEQ ID NO:562的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成，且其等位基因变体优选为SEQ ID NO:130的变体。

特别地，本公开提供一种包含NOTCH2的外显子6或外显子6的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地，NOTCH2的外显子6包含SEQ ID NO:700或由其组成，且其等位基因变体优选为SEQ ID NO:700的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成，且其等位基因变体优选为SEQID NO:130的变体。

特别地，本公开提供一种包含CD74的外显子2或外显子2的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地，CD74的外显子2包含SEQ ID NO:720或由其组成，且其等位基因变体优选为SEQ ID NO:720的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成，且其等位基因变体优选为SEQ ID NO:126的变体。

特别地，本公开提供一种包含SDC4的外显子2或外显子2的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地，SDC4的外显子2包含SEQ ID NO:746或由其组成，且其等位基因变体优选为SEQ ID NO:746的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成，且其等位基因变体优选为SEQ ID NO:126的变体。

特别地，本公开提供一种包含SDC4的外显子4或外显子4的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地，SDC4的外显子4包含SEQ ID NO:748或由其组成，且其等位基因变体优选为SEQ ID NO:748的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成，且其等位基因变体优选为SEQ ID NO:126的变体。

特别地，本公开提供一种包含SLC4A4的外显子14或外显子14的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地，SLC4A4的外显子14包含SEQ ID NO:780或由其组成，且其等位基因变体优选为SEQ ID NO:780的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成，且其等位基因变体优选为SEQID NO:130的变体。

本文所提供的NRG1融合物均已在源自患者的样本中观察到，特别是经诊断患有癌症的患者。

所公开的鉴定这些NRG1融合物及基因重排可提供用于确定NRG1多核苷酸融合物或多肽是否存在于或来自于生物样本中的新方法，用于测定NRG1多肽融合物的活性的方法，用于诊断表达NRG1多肽融合物的癌症、肿瘤或异常细胞的方法，用于测定NRG1多肽融合物的活性的方法，用于治疗表达NRG1多肽融合物的癌症、肿瘤或异常细胞的方法，和/或抑制特征在于表达NRG1多核苷酸融合物或多肽的肿瘤形成进程的方法。本公开因此也提供这些或更多个方面并详细描述于下文中。

本公开也提供由选自以下中的任一种多核苷酸融合物所编码的多肽融合物：VAPB-NRG1、CADM1-NRG1 CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1和DSCAML1-NRG1。当本公开的任一种多肽融合物被本文所提及的异常细胞表达时，其优选地也包含NRG1的EGF样结构域。当本公开的任一种多核苷酸融合物被含在本文所提及的异常细胞时，其优选地包含编码EGF样结构域的NRG1外显子，诸如NRG1的外显子6、7或8，更优选地包含NRG1多核苷酸序列的外显子6和7。

也提供一种包含本公开的多核苷酸融合物的载体、一种包含所述多核苷酸和/或所述载体的宿主细胞。也提供一种制造本公开的多肽的方法，包含将所述重组宿主细胞维持在适合该多核苷酸表达的条件下，从而表达该多核苷酸融合物且产生多肽融合物，随后分离或纯化该多肽。也提供一种制造重组宿主细胞的方法，包括将所述载体导入宿主细胞内。

也提供一种用于检测本公开的多核苷酸融合物的核酸探针、引物或引物对以及一种包含用于检测本公开的多核苷酸融合物的存在的核酸探针、引物或引物对的检测测定法。本公开的这类核酸探针、引物或引物对优选的长度为10-40个核苷酸。

也提供一种用于检测本公开的多核苷酸融合物所编码的多肽的第一抗体或第一与第二抗体组，以及包含该第一抗体或该第一与第二抗体组以用于检测本公开的多核苷酸融合物所编码的多肽的存在的检测测定法。优选地，该第一抗体与选自以下的多肽融合物结合：VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1和DSCAML1-NRG1，而该第一与第二抗体组分别与VAPB和NRG1、或CADM1和NRG1、或CD44和NRG1、或SLC3A2和NRG1、或VTCN1和NRG1、或CDH1和NRG1、或CXADR和NRG1、或GTF2E2和NRG1、或CSMD1和NRG1、或PTN和NRG1、或ST14和NRG1、或THBS1和NRG1、或AGRN和NRG1、或PVALB和NRG1、APP和NRG1、或WRN和NRG1、或ASPH和NRG1、或NOTCH2和NRG1、或CD74和NRG1、或SDC4和NRG1、或SLC4A4和NRG1、或ZFAT和NRG1、或DSCAML1和NRG1结合。

本公开包括鉴定或检测人类受试者中的NRG1融合物的方法，且进一步涵盖诊断、治疗选择和药物治疗的方法及其组合，以改善NRG1融合物相关的疾病，包括实体瘤。除此之外，本公开提供直接了断的手段或测定来快速评估受试者是否罹患或易于罹患癌症、肿瘤或异常细胞。这类NRG1融合物信息可有利作为诊断工具中的生物标志物使用。

因此，也提供一种在样本中鉴定如本文所提及的任一多核苷酸融合物、或由其所编码的多肽的方法，所述方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。

也提供一种在样本中检测如本文所提及的任一多核苷酸融合物、或由其所编码的多肽是否存在的方法，所述方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。

也提供一种确定来自受试者的异常细胞(诸如癌细胞或肿瘤细胞)是否包含本文所提及的任一多核苷酸融合物、或由其所编码的多肽的方法，所述方法包括检验获自该受试者的细胞或所述细胞的多核苷酸或多肽内容物是否在样本中存在该融合物。

也提供一种鉴定受试者携带本文所提及的多核苷酸融合物、或由其所编码的多肽的方法，所述方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。

本文所提及的样本的检验优选地为体外分析或这类方法、或离体分析或这类方法的一部分。

优选地，该受试者为哺乳动物或人类受试者，且该多核苷酸或多肽为哺乳动物或人类多核苷酸或多肽。

优选地，本文所提及的任一多核苷酸融合物和/或本文所提及的由其所编码的多肽经分离和/或纯化或者实质上分离或实质上纯化。

本公开涉及于罹患癌症或怀疑罹患癌症(特别是实体癌或实体瘤)的受试者。特别地，这类癌症为腺癌，更特别是黏液腺癌、胰脏癌，更特别是胰脏腺癌、或肾细胞癌、胆管癌、脑癌、神经胶质母细胞瘤、胆管癌、神经胶质瘤、胰管腺癌、肉瘤、膀胱癌、大肠癌、直肠癌、大肠直肠癌、胆囊癌、头颈癌、前列腺癌、子宫癌、乳癌、卵巢癌、肝癌、子宫内膜癌、肺癌，特别是非小细胞肺癌、或浸润性黏液腺癌。该癌症可为原发性癌或转移性癌。

本公开也提供一种治疗患有ErbB-2和/或ErbB-3阳性异常细胞(诸如癌症或肿瘤)的受试者的方法，所述异常细胞包含本文所提及的多核苷酸融合物，和/或这类细胞表达由其所编码的多肽融合物，所述方法包括向该受试者施用治疗量的ErbB-2和/或ErbB-3靶向剂。优选地，在施用所述靶向剂之前检测本文所提及的多核苷酸或多肽融合物。

本公开也提供一种抑制患有ErbB-2和ErbB-3阳性异常细胞的受试者进程的方法，所述异常细胞包含本文所提及的多核苷酸融合物，和/或表达由其所编码的多肽融合物，所述方法包括向该受试者施用治疗量的ErbB-2和/或ErbB-3靶向剂。优选地，在施用所述靶向剂之前检测本文所提及的多核苷酸或多肽融合物。

本公开也提供一种用于患有ErbB-2和ErbB-3阳性癌症或肿瘤的受试者的治疗中的ErbB-2和/或ErbB-3靶向剂，所述癌症或肿瘤包含本文所提及的多核苷酸融合物，和/或表达由其所编码的多肽融合物，所述治疗包含向该受试者施用治疗量的ErbB-2和/或ErbB-3靶向剂。优选地，在施用所述靶向剂之前检测本文所提及的多核苷酸或多肽融合物。

本公开也提供一种诊断携带包含本文所提及的多核苷酸融合物由其所编码的多肽的异常细胞的受试者的方法，该方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。

本公开也提供一种ErbB-2和/或ErbB-3靶向剂的治疗方法或用途，其中筛选受试者是否存有本文所提及的NGR1融合物，随后施用ErbB-2和/或ErbB-3试剂。

本公开也包括体内模型，诸如表达在其基因组内或者包含本文所提及的多核苷酸融合物的移植异常细胞的异种移植或基因转基因动物模型，和/或表达由其所编码的多肽融合物，以及使用ERB2和/或Erb3靶向剂或其他靶向剂的这类模型的治疗。优选地，该动物模型为非人类动物模型。

具体实施方式

本公开提供涉及NRG1与新型融合配偶体的融合物，以及由其所编码的多肽融合物。此外，本公开提供涉及具有先前未经公开的融合接点的NRG1的融合物，以及由其所编码的多肽融合物。

一般地，本公开提供涉及NRG1与融合配偶体的融合物，该融合配偶体选自VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1。所述融合物在本文中指VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、DAAM1-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1或DSCAML1-NRG1。存在本公开的NRG1融合物中的任一者时，无论是多核苷酸或由其翻译的多肽，都表示了异常细胞(诸如癌症或肿瘤)的存在。

NRG1

NRG1基因编码各种NRG1同种型。各种同种型及其预期功能在Adelaide等人，GenesChromosomes Cancer,Aug；37(4):333-45(2003)中进行了描述。GGF和GGF2同种型含有kringle样序列加上Ig和EGF样结构域；且SMDF同种型与其他同种型仅共享EGF样结构域。NRG1同种型的受体是酪氨酸激酶跨膜受体的ErbB家族。该家族也被称作人类表皮生长因子(EGF)受体家族(HER)。该家族有四个成员：ErbB(红血球母细胞瘤)-1、ErbB-2、ErbB-3和ErbB-4。受体(综述于Yarden和Pines，Nat Rev Cancer.2012Jul 12；12(8):553-63)广泛表达于上皮细胞上。HER受体或其配位体，诸如神经调理因子(heregulin,HRG)或表皮生长因子(EGF)的表达量上调，是人类癌症中常见的事件(Wilson,Fridlyand等人，Nature.2012Jul 26；487(7408):505-509)。ErbB-1和ErbB-2的过度表达尤其发生在上皮肿瘤中，并且与肿瘤侵袭、转移、化疗耐药性及预后不良有关(Zhang,H.,Berezov,A.,Wang,Q.,Zhang,G.,Drebin,J.,Murali,R.等人(2007)Erbb receptors:from oncogenes totargeted cancer therapies.J.Clin.Invest.,117,2051-2058)。在正常乳房中，ErbB-3已被证明在管腔上皮的生长及分化中很重要。例如，ErbB-3的丢失/抑制会导致在管腔上皮上的基底选择性扩增(Balko,Miller等人，2012PNAS January 3,2012 109(1)221-226)。配体与酪氨酸激酶受体的细胞外结构域的结合诱导了受体二聚化，两者介于相同(同源二聚化(homodimerization))和不同(异源二聚化(heterodimerization)受体亚型之间。二聚化可以活化细胞内的酪氨酸激酶结构域，使这些结构域进行自磷酸化且继而活化许多下游的促增生信号传导路径，包括由促分裂原活化蛋白激酶(MAPK)及促存活路径Akt所介导的路径(综述于Yarden和Pines，2012)。ErbB-3可以通过其配体的接合而被活化。这些配体包括但不限于神经调节蛋白(NRG)及神经调理因子(HRG)，以及NRG1融合物。

各种NRG1融合基因描述于Dhanasekaran等人Nature Communications 5:5893,2014，以及Jonna等人，Clin Cancer Res August 15 2019,25(16)4966-4972。

本文所使用的术语“NRG1”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。NRG1基因及同种型已知有许多不同的别名，诸如：神经调节蛋白1(Neuregulin 1)；Pro-NRG1；HRGA；SMDF；HGL；GGF；NDF；NRG1内切转录2(Intronic Transcript 2，不编码蛋白质)；Heregulin,α(45kD,ERBB2 P185-活化子)；乙酰胆碱受体诱导活性(Acetylcholine Receptor-Inducing Activity)；原神经调节蛋白-1(Pro-Neuregulin-1)，其是膜结合同种型；感觉及运动神经元衍生因子；新分化因子(Neu Differentiation Factor)；神经胶质生长因子2；NRG1-IT2；MSTP131；MST131；ARIA；GGF2；HRG1以及HRG。NRG1基因的外部Id为HGNC:7997；Entrez Gene:3084；Ensembl:ENSG00000157168；OMIM:142445及UniProtKB:Q02297。为了避免疑虑，带有NRG1序列是指带有来自诸如NCBI参考序列NM_001159999.3或NM_001159999.3的等位基因变体的任何多核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。优选地，本公开的NRG1的全多核苷酸序列是根据SEQ ID NO:138转录，而经转录的NRG1多肽序列是根据SEQ ID NO:152。

优选地，该编码NRG1蛋白序列或NRG1外显子的多核苷酸融合物部分进一步包含或编码NRG1的EGF样结构域。于该融合物中的NRG1基因(例如NRG1基因的3’端)优选地包含外显子6、7或8的编码序列。此结构域是由位于NRG1基因(例如外显子6-8)3’处的部分编码，且对于结合至ErbB-3而言是必要的。NRG1融合基因优选地包含编码NRG1的EGF样结构域的核酸序列。本公开的NRG1融合物优选地在该融合物分子的3’端保有此EGF样结构域的框内编码区。EGF样结构域一般为约三十至四十个氨基酸残基长的序列，其原型发现于表皮生长因子(EGF)的序列“PMID:2288911,PMID:6334307,PMID:1522591,PMID:6607417,PMID:3282918,PMID:11498013”中。已知其以大致保守的形式存在于其他众多、主要为动物蛋白质中。EGF样结构域的共同特征是，它们发现于膜结合蛋白的细胞外结构域或已知会分泌的蛋白质中(例外：前列腺素G/H合成酶)。EGF样结构域一般包括六个半胱氨酸残基，已证明它们(在EGF中)涉及二硫化物键。主要结构为一个双链β折板(sheet)，然后是一个环接到C端的短双链折板。保守半胱氨酸之间的次结构域长度不一。本公开的示例性EGF样结构域优选地是由NCBI参考序列NM_001159999.3的外显子6-8组成，更优选地由外显子6和7组成，但本公开是有关于NRG1的任何功能性EGF样结构域。NRG1的EGF样结构域因此优选地包含示例性序列HLVKCAEKEKTF CVNGGECFMVKDLSNPSRYLCKCPNEFTGDRCQNYVMASF(SEQ ID:163)，或与其具有至少85％一致性、或与其具有至少90％、92％、94％、95％、96％或甚至至少98％一致性的等位基因变体。

本公开的任一NRG1融合多核苷酸优选地至少包含VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的5’部分以作为融合配偶体，以与NRG1核酸序列的3’部分融合。经翻译的多肽融合物包含该NRG1融合多肽的游离C端以及该融合配偶体的游离N端。为了在分子融合物水平反应出此倾向，先提及NRG1的任一融合配偶体，接着是作为其融合配偶体的NRG1。

VAPB

VAPB或囊泡相关膜蛋白的相关蛋白B/C已知有许多不同名称，诸如VAMP相关蛋白B和C；VAMP(囊泡相关膜蛋白)相关蛋白B和C；VAP-B；VAPB；ALS8；VAMP相关33KDa蛋白；VAMP相关蛋白B/C；VAMP-B/VAMP-C；VAP-B/VAP-C；VAMP-B和VAP-C。VAPB基因的外部Id为HGNC:12649；Entrez Gene:9217；Ensembl:ENSG00000124164；OMIM:605704；以及UniProtKB:O95292。本文所使用的术语“VAPB”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有VAPB序列是指带有来自诸如NCBI参考序列NM_004738.4或其任一等位基因变体的任何多核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

CADM1

CADM1或细胞黏附分子1已知有许多不同的名称，诸如肺癌肿瘤抑制因子1；TSLC1；TSLC-1；生精免疫球蛋白超家族；SgIgSF；SgIGSF；免疫球蛋白超家族成员4；IGSF4；IgSF4；IGSF4A；突触细胞黏附分子；SynCAM1；SYNCAM1；SynCAM；SYNCAM；Nectin样蛋白2；NECL2；NECL-2；Nectin样2；Necl-2；RA175；ST17；BL2；免疫球蛋白超家族的成员4D变体1；免疫球蛋白超家族的成员4D变体2；免疫球蛋白超家族的成员4；TSLC1/Nectin样2/IGSF4；截断的CADM1蛋白1及STSLC-1。CADM1的外部Id为HGNC:5951；Entrez Gene:23705；Ensembl:ENSG00000182985；OMIM:605686；以及UniProtKB:Q9BY67。本文所使用的术语“CADM1”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有CADM1序列是指带有来自诸如NCBI参考序列NM_001301045.1或其任一等位基因变体的任何多核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

CD44

CD44已知有许多不同的名称，诸如CD44分子(印度血型)；造血细胞E-及L-选滞蛋白配体；GP90淋巴细胞归巢/黏附受体；硫酸软骨素蛋白聚醣；细胞外基质受体III；硫酸软骨素蛋白聚醣；吞噬细胞醣蛋白1；玻尿酸受体；赫尔墨斯抗原(Hermes Antigen)；CD44抗原；ECMR-III；HUTCH-I；Epican；MDU2；MDU3；MIC4；LHR；CD44抗原(归巢功能及印度血型系统)；归巢功能及印度血型系统；细胞表面醣蛋白CD44；印度血型抗原；吞噬细胞醣蛋白I；可溶性CD44；CDW44；CSPG8；HCELL；CDw44；PGP-1；MC56；Pgp1；及In。CD44基因的外部Id为HGNC:1681；Entrez Gene:960；Ensembl:ENSG00000026508；OMIM:107269；及UniProtKB:P16070。本文所使用的术语“CD44”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有NRG1序列是指带有来自诸如CD44参考序列NM_000610.4或其任一等位基因变体的任何多核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

SLC3A2

SLC3A2或溶质载体家族3成员2已知有许多不同的名称，诸如淋巴细胞活化抗原4F2大亚单元；溶质载体家族3(二元(Dibasic)及中性氨基酸转运的活化子)，成员2；由单克隆抗体4F2、TRA1.10、TROP4及T43所识别的抗原；溶质载体家族3(氨基酸转运蛋白重链)，成员2；4F2细胞表面抗原重链；CD98重链；4F2HC；MDU1；由单克隆抗体4F2定义的抗原，重链；由单克隆抗体4F2定义的抗原；4F2重链抗原；4F2重链；CD98抗原；CD98HC；4T2HC；NACAE；CD98及4F2。SLC3A2的外部Id为HGNC:11026；Entrez Gene:6520；Ensembl:ENSG00000168003；OMIM:158070；及UniProtKB:P08195。本文所使用的术语“SLC3A2”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有SLC3A2转录本6序列是指带有来自诸如NCBI参考序列NM_001013251.3或其任一等位基因变体的任何多核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。而带有SLC3A2转录本3序列是指带有来自诸如NCBI参考序列NM_001013251.3或其任一等位基因变体的任何多核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

VTCN1

VTCN1已知有许多不同的名称，诸如含有T细胞活化抑制剂1的V-Set结构域；B7-H4；B7H4；免疫共刺激蛋白B7-H4；B7超级家族成员1；B7家族成员，H4；B7同源物4；B7h.5；B7S1；T细胞共刺激分子B7x；蛋白质B7S1；FLJ22418；PRO1291；VCTN1；VTCN1及B7X。VTCN1的外部Id为HGNC:28873；NCBI Entrez Gene:79679；Ensembl:ENSG00000134258；608162及UniProtKB/Swiss-Prot:Q7Z7D3。本文所使用的术语“VTCN1”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有VTCN1序列是指带有来自诸如NCBI参考序列NM_024626.4或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

CDH1

CDH1或钙黏蛋白1已知有许多不同的名称，如桑椹胚黏着蛋白(Uvomorulin)；钙黏蛋白1，1型，E-钙黏蛋白(上皮)；上皮钙黏蛋白；E-钙黏蛋白；钙黏蛋白-1；CAM 120/80；CD324；CDHE；UVO；钙依赖性黏附蛋白，上皮；副睪分泌精子结合蛋白；钙黏蛋白1，E-钙黏蛋白(上皮)；细胞-CAM 120/80；CD324抗原；E-钙黏蛋白；Arc-1；BCDS1；ECAD；及LCAM。CDH1的外部Id为HGNC:1748；NCBI Entrez Gene:999；Ensembl:ENSG00000039068；192090及UniProtKB/Swiss-Prot:P12830。本文所使用的术语“CDH1”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有CDH1序列是指带有来自诸如NCBI参考序列NM_001317185.2或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

CXADR

CXADR或柯萨奇病毒及腺病毒受体是B组柯萨奇病毒及C亚组腺病毒的I型膜受体。已发现此基因的若干编码不同同种型的转录变体。与CXADR相关的疾病包括心肌炎及角膜结膜炎。其相关途径包括黏附及同种异体移植排斥。它是上皮细胞顶部接合复合物的一个组成部分，可作用为嗜同性细胞黏附分子，对细胞紧密连接的完整性至关重要。其也涉及通过与白血球膜质膜的跨膜蛋白JAML黏附交互作用所进行的白血球跨上皮细胞迁移。这两种受体之间的交互作用也介导了驻留在上皮细胞中的一种T细胞次族群γ-δT细胞的活化，并涉及组织内环境稳定与修复。在上皮细胞CXADR结合时，JAML会通过PI3激酶及MAP激酶来介导γ-δT细胞中的下游细胞信号传导事件。这通过T细胞相应地刺激上皮细胞组织修复而造成细胞介素及生长因子的增生与生成。CXADR的外部Id包括HGNC:2559NCBI；Entrez Gene:1525；Ensembl:ENSG00000154639；602621；UniProtKB/Swiss-Prot:P78310。本文所使用的术语“CXADR”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有CXADR序列是指带有来自诸如NCBI参考序列NM_001207063.2或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

GTF2E2

GTF2E2或共享转录因子IIE(TFIIE)是RNA聚合酶II转录起始复合体的一部分，其吸收TFIIH且对RNA聚合酶II清除启动子是绝对必要的。TFIIE是一种含α和β亚单元的异源二聚体(且有时为异源四聚体)。此基因所编码的蛋白质表达TFIIE的β亚单元。与GTF2E2相关的疾病包括毛发硫营养障碍症6、非光敏性毛发硫营养障碍症。其相关途径有滑液膜纤维母细胞中的细胞凋亡路径以及巨噬细胞中的CCR5路径。GTF2E2的外部Id包括HGNC:4651；NCBI Entrez Gene:2961；Ensembl:ENSG 00000197265；189964；UniProtKB/Swiss-Prot:P29084。本文所使用的术语“GTF2E2”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有GTF2E2序列是指带有来自诸如NCBI参考序列NM_002095.6或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

CSMD1

CSMD1(或CUB与Sushi多重功能域1)是一种与包括自闭症和思觉失调症的疾病相关的蛋白质。CSMD1的外部Id包括HGNC:14026；NCBI Entrez Gene:64478；Ensembl:ENSG00000183117；608397；UniProtKB/Swiss-Prot:Q96PZ7。本文所使用的术语“CSMD1”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有CSMD1序列是指带有来自诸如NCBI参考序列NM_033225.6或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

PTN

多效生长因子(Pleiotrophin或PTN)蛋白质是一种分泌型肝素结合生长因子。该蛋白质在细胞生长与存活、细胞迁移、血管生成以及肿瘤生成中具有重要的作用。PTN(Pleiotrophin)是蛋白编码基因。与PTN相关的疾病包括佩洛尼氏病(Peyronie'sDisease)及鼻腔嗅神经母细胞瘤。其相关路径有滑液膜纤维母细胞中的GPCR路径及细胞凋亡路径。PTN的外部Id包括HGNC:9630；NCBI Entrez Gene:5764；Ensembl:ENSG00000105894；162095；UniProtKB/Swiss-Prot:P21246。本文所使用的术语“PTN”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有PTN序列是指带有来自诸如NCBI参考序列NM_001321386.2或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

ST14

ST14或ST14跨膜丝氨酸蛋白酶Matriptase是一种上皮细胞衍生的膜主体蛋白丝氨酸蛋白酶。此蛋白酶与Kunitz型丝氨酸蛋白酶抑制剂HAI-1形成复合物，且被发现会被神经鞘胺醇1-磷酸盐活化。此蛋白酶已被证明可裂解及活化肝细胞生长因子/分射因子，以及尿激酶纤溶酶原激活酶，这表明此蛋白酶作为其他蛋白酶与潜在生长因子的上皮细胞膜活化子的功能。与ST14相关的疾病包括不同类型的鱼鳞病。其相关路径包括发育生物学及黏附。ST14的外部Id包括HGNC:11344；NCBI Entrez Gene:6768；Ensembl:ENSG00000149418；606797；UniProtKB/Swiss-Prot:Q9Y5Y6。本文所使用的术语“ST14”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有ST14序列是指带有来自诸如NCBI参考序列NM_021978.4或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

THBS1

THBS1或血小板反应素1是一种二硫键连接的同源三聚体蛋白亚单元。此蛋白质是一种黏附性醣蛋白并介导细胞与细胞的交互作用以及细胞与基质的交互作用。此蛋白可结合至纤维蛋白原、纤维连接蛋白、层黏蛋白、V型胶原蛋白和整联蛋白α-V/β-1。此蛋白已被证明在血小板凝集、血管生成以及肿瘤生成中扮演重要角色。与THBS1相关的疾病包括血栓形成性血小板减少性紫瘢病和Peters-Plus症候群。其相关路径有癌症中的蛋白多醣和胞外基质的降解。与此基因相关的基因本体(GO)标记包括钙离子结合及肝素结合。THBS1的外部Id包括HGNC:11785；NCBI Entrez Gene:7057；Ensembl:ENSG00000137801；188060；UniProtKB/Swiss-Prot:P07996。本文所使用的术语“THBS1”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有THBS1序列是指带有来自诸如NCBI参考序列NM_003246.4或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

AGRN

AGRN或聚集蛋白(Agrin)是神经肌肉接合发育中重要的几种蛋白质之一。所编码的蛋白质包含数个层黏蛋白G、Kazal型丝氨酸蛋白抑制剂和表皮生长因子结构域。其他的翻译后修饰出现在添加葡萄糖胺聚醣及二硫键。在与影响肢带肌的先天性肌无力症候群有关的一个基因家族中发现此基因的突变。与AGRN相关的疾病包括肌无力症候群、先天性、8及突触前先天性肌无力症候群。其相关路径有在神经肌肉接合、血脑障壁、及免疫细胞移位处的Agrin交互作用。AGRN的外部Id包括HGNC:329；NCBI Entrez Gene:375790；Ensembl:ENSG00000188157；103320；UniProtKB/Swiss-Prot:O00468。本文所使用的术语“AGRN”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有AGRN序列是指带有来自诸如NCBI参考序列NM_001305275.2或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

PVALB

PVALP或微小白蛋白(Parvalbumin)是一种高亲合性钙离子结合蛋白，其在结构上与作用上与钙调素及旋光素C相似。所编码的蛋白被认为涉及到肌肉放松。与PVALB相关的疾病包括鱼类过敏及胎儿酒精症候群。与此基因相关的基因本体标记包括钙离子结合及蛋白杂二聚化活性。PVALB的外部Id包括HGNC:9704；NCBI Entrez Gene:5816；Ensembl:ENSG00000100362；168890；UniProtKB/Swiss-Prot:P20472。本文所使用的术语“PVALB”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有PVALB序列是指带有来自诸如NCBI参考序列NM_002854.3或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

APP

APP已知有许多不同的名称，诸如类淀粉蛋白β前驱蛋白、α-SAPP、AD1、阿兹海默病类淀粉蛋白A4蛋白同源物、类淀粉蛋白β(A4)前驱蛋白、阿兹海默病类淀粉蛋白、脑血管类淀粉蛋白肽、类淀粉蛋白β前驱蛋白、类淀粉蛋白前驱蛋白、肽酶连接蛋白(Nexin)-II、蛋白酶连接蛋白-II、PN-II、PreA4、ABPP、APPI、CVAP、β-类淀粉蛋白前驱蛋白、睾丸组织蛋白Li2、β-类淀粉蛋白肽(1-40)、β-类淀粉蛋白肽(1-42)、类淀粉蛋白β-A4蛋白、β-类淀粉蛋白肽、阿兹海默病、CTFγ、ABETA、AAA、PN2和A4。APP基因的外部ID是HGNC：620；Entrez Gene：351；Ensembl：ENSG00000142192；104760及UniProtKB/Swiss-Prot：P05067。APP基因的外部Id为HGNC:620；Entrez Gene:351；Ensembl:ENSG00000142192；/>104760和UniProtKB/Swiss-Prot:P05067。本文所使用的术语“APP”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有APP序列是指带有来自诸如NCBI参考序列NM_001136130.3或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

WRN

WRN或维尔纳氏症候群(Werner Syndrome)ATP依赖性解旋酶已知有许多不同的名称，诸如WRN RecQ样解旋酶；RECQL2；RECQ3；维尔纳氏症候群RecQ样解旋酶；DNA解旋酶、RecQ样第3型；RecQ蛋白样2；核酸外切酶WRN；维尔纳氏症候群，RecQ解旋酶样；维尔纳氏症候群；EC 3.6.4.12；RECQL3和RecQ3。WRN基因外部ID为HGNC:12791；NCBI Entrez Gene:7486；Ensembl:ENSG00000165392；604611和UniProtKB/Swiss-Prot:Q14191。本文所使用的术语“WRN”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有WRN序列是指带有来自诸如NCBI参考序列NM_000553.6或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

DAAM1

DAAM1或形态发生紊乱相关活化子1已知有许多不同的名称，诸如KIAA0666；及形态发生紊乱相关活化子1。DAAM1基因的外部Id为HGNC:18142；NCBI Entrez Gene:23002；Ensembl:ENSG00000100592；606626；及UniProtKB/Swiss-Prot:Q9Y4D1。本文所使用的术语“DAAM1”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有DAAM1序列是指带有来自诸如NCBI参考序列NM_001270520.2或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

ASPH

ASPH或天门冬氨酸β-羟化酶已知有许多不同的名称，诸如BAH、CASQ2BP1、JCTN、HAAH、天门冬氨酸/天冬酰胺基β-羟化酶、肽-天门冬氨酸β-二氧酶、ASPβ-羟化酶、Junctate、Junctin、Humbug、Cardiac Junctin、EC 1.14.11.16、AβH-J-J、FDLAB和AAH。ASPH基因的外部Id为HGNC:757；Entrez Gene:444；Ensembl:ENSG00000198363；600582及UniProtKB/Swiss-Prot:Q12797。本文所使用的术语“ASPH”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有ASPH序列是指带有来自诸如NCBI参考序列NM_001164750.2或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

NOTCH2

NOTCH2或Notch受体2已知有许多不同的名称，诸如Notch 2；神经源性位点缺口同源蛋白2；HN2；Notch(果蝇)同源物2；Notch同源物2(果蝇)；Notch同源物2；HJCYS；和AGS2。NOTCH2基因的外部Id为HGNC:7882；NCBI Entrez Gene:4853；Ensembl:ENSG00000134250；600275；及UniProtKB/Swiss-Prot:Q04721。本文所使用的术语“NOTCH2”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有NOTCH2序列是指带有来自诸如NCBI参考序列NM_024408.4或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

CD74

CD74已知有许多不同的名称，诸如CD74分子；DHLAG；CD74分子，主要组织兼容性复合物，II类不变链；HLA II类组织兼容性抗原γ链；II类MHC相关不变链肽；HLA-DR抗原相关不变链；II类抗原的γ链；Ia相关不变链；MHC HLA-DRγ链；HLA-DR-γ；CLIP；Ia抗原相关不变链；CD74抗原；Ia-γ；HLADG；P33；II；及Ii；CD74基因的外部Id为HGNC:1697；NCBI EntrezGene:972；Ensembl:ENSG00000019582；142790；及UniProtKB/Swiss-Prot:P04233。本文所使用的术语“CD74”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有CD74序列是指带有来自诸如NCBI参考序列NM_001025159.3或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

SDC4

SDC4或多配体聚醣4(Syndecan 4)已知有许多不同的名称，诸如双栖蛋白聚醣(Amphiglycan)；SYND4；多配体聚醣4(Amphiglycan,Ryudocan)；多配体聚醣蛋白聚醣4；Ryudocan核心蛋白；多配体聚醣-4；Ryudocan；及Ryudocan双栖蛋白聚醣。SDC4基因的外部Id为HGNC:10661；NCBI Entrez Gene:6385；Ensembl:ENSG00000124145；600017；及UniProtKB/Swiss-Prot:P31431。本文所使用的术语“SDC4”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有SDC4序列是指带有来自诸如NCBI参考序列NM_002999.4或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

SLC4A4

SLC4A4或溶质载体家族4成员4已知有许多不同的名称，诸如NBC1；HNBC1；HhNMC；NBC2；PNBC；溶质载体家族4(碳酸氢钠共转运蛋白)，成员4；产电位碳酸氢钠共转运蛋白1；Na(+)/HCO3(-)共转运蛋白；SLC4A5；KNBC1；碳酸氢钠共转运蛋白1(碳酸氢钠共转运蛋白，肾脏；碳酸氢钠共转运蛋白，胰脏)；溶质载体家族4，碳酸氢钠共转运蛋白，成员4，脑型；溶质载体家族4，碳酸氢钠共转运蛋白，成员4；溶质载体家族4，碳酸氢钠共转运蛋白，成员5；碳酸氢钠共转运蛋白；NBCe1-A；NBCE1；KNBC；及NBC。SLC4A4基因的外部Id为HGNC:11030；NCBI Entrez Gene:8671；Ensembl:ENSG00000080493；603345；及UniProtKB/Swiss-Prot:Q9Y6R1。本文所使用的术语“SLC4A4”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有SLC4A4序列是指带有来自诸如NCBI参考序列NM_001098484.3或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

ZFAT

ZFAT或含AT-钩结构域的锌指(Zing Finger And AT-Hook Domain Containing)已知有许多不同的名称，诸如锌指蛋白406；KIAA1485；ZNF406；ZFAT1；锌指蛋白ZFAT；在自体免疫性甲状腺疾病的锌指基因；在AITD易感区的锌指基因；和AITD3。ZFAT基因的外部Id为HGNC:19899；NCBI Entrez Gene:57623；Ensembl:ENSG00000066827；610931；及UniProtKB/Swiss-Prot:Q9P243。本文所使用的术语“ZFAT”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有ZFAT序列是指带有来自诸如NCBI参考序列NM_020863.4或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

DSCAML1

DSCAML1或类DS细胞黏附分子1已知有许多不同的名称，诸如KIAA1132；类唐氏症细胞黏附分子蛋白1；唐氏症细胞黏附分子2；DSCAM2；类唐氏症细胞黏附分子1；类唐氏症细胞黏附分子1；及类DSCAM 1。DSCAML1基因的外部Id为HGNC:14656；NCBI Entrez Gene:57453；Ensembl:ENSG00000177103；611782；及UniProtKB/Swiss-Prot:Q8TD84。本文所使用的术语“DSCAML1”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式，而是包括所有这类的形式，除非上下文清楚指出是哪种形式。为了避免疑虑，带有DSCAML1序列是指带有来自诸如NCBI参考序列NM_020693.4或其任一等位基因变体的任何核苷酸序列，包括编码序列或是任何外显子，但也包括任何多肽序列，或其任何部分。

NRG1多核苷酸融合物

根据本公开，现在提供了会导致NRG1融合产物表达的前所未知的基因重排，其中NRG1与融合配偶体融合。特别地，提供了包含NRG1的多核苷酸融合物，包括VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、DAAM1-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1或DSCAML1-NRG1。特别地，在被诊断患有癌症的人类患者中存在或已鉴定出这类融合物，并在下节中更详细地提及。

在某些实施例中，该NRG1融合物在编码该EGF样结构域的序列的3’处可包含另外的下游融合配偶体。

VAPB-NRG1多核苷酸融合物

根据本公开，也提供一种包含VAPB核酸序列(或VAPB核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸。所述融合物中也包括VAPB和NRG1核酸序列的等位基因变体。

优选地，该VAPB核酸序列(或其一部分)包含SEQ ID NO:17-23中的任一者或SEQID NO:17-23中的任一者的等位基因变体，或是由其组成，而该NRG1核酸序列(或其一部分)包含SEQ ID NO:125-138中的任一者或SEQ ID NO:125-138中的任一者的等位基因变体，或是由其组成。更优选地，该VAPB核酸序列包含SEQ ID NO:23或SEQ ID NO:23的等位基因变体的一部分，或是由其组成，而该NRG1核酸序列包含SEQ ID NO:138或SEQ ID NO:138的等位基因变体的一部分，或是由其组成。SEQ ID NO:17-22分别对应于根据NM_004738.4的VAPB的个别外显子1-6。SEQ ID NO:23对应于根据NM_004738.4的VAPB的外显子1-5。SEQ IDNO:125-137分别对应于根据NM_001159999的NRG1的个别外显子1-13。SEQ ID NO:138对应于根据NM_001159999的NRG1的外显子1-13。

在一个优选实施方式中，该VAPB核酸序列部分包含来自SEQ ID NO:17-23中的任一者(或SEQ ID NO:17-23中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，而该NRG1核酸序列部分包含来自SEQ ID NO:125-138中的任一者(或SEQ ID NO:125-138中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸。

优选地，该VAPB核酸序列或其一部分位于NRG1核酸序列或其一部分的5’处。

优选地，该包含VAPB的VAPB核酸序列(或所述序列的一部分)与NRG1核酸序列(或所述序列的一部分)融合的多核苷酸包含或编码NRG1的EGF样结构域。包含该VAPB-NRG1多核苷酸融合物或表达该多肽融合物的异常细胞包含或编码NRG1的EGF样结构域。为了检测、诊断或鉴定的目的，只需证明介于VAPB与NRG1之间的融合接点是框内的并且发生在使得所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该VAPB核酸序列的等位基因变体与SEQ ID NO:17-23中的任一者有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性；且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

在一个优选实施方式中，该包含VAPB核酸与NRG1核酸融合的多核苷酸包含来自SEQ ID NO:3的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且优选地包括位置43和44的核酸。连续核酸的数目可为SEQ ID NO:3的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置43和44的核酸。

在一个优选实施方式中，提供了一种根据SEQ ID NO:3的多核苷酸，或一种包含来自SEQ ID NO:3的约20、约30、约40个或全部的连续核酸且优选地包括位置43和44的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:3的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置43和44的核酸。

优选地，该NRG1核酸序列的多核苷酸部分(或其等位基因变体)编码NRG1的EGF样结构域，优选为根据SEQ ID NO:163的EGF样结构域。

在一个替代方面中，提供了一种包含VAPB的外显子1或其等位基因变体的一部分与NRG1的外显子2或其等位基因变体的一部分融合的多核苷酸。优选地，VAPB的外显子1为SEQ ID NO:17的外显子。优选地，NRG1的外显子2为SEQ ID NO:126的外显子。所述VAPB外显子1的部分优选地包含SEQ ID NO:1或其等位基因变体或是由其组成。所述NRG1外显子2的部分优选地包含SEQ ID NO:2或其等位基因变体或是由其组成。当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括NRG1外显子2的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:17和126可能就足够。来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ IDNO:127-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该VAPB的外显子1的等位基因变体与SEQ ID NO:17有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1的外显子2的等位基因变体与SEQ ID NO:126有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

在一个优选实施方式中，VAPB的外显子1的部分包含SEQ ID NO:1或由其组成，且其等位基因变体与SEQ ID NO:1有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此融合物中的NRG1的外显子2的部分包含SEQ ID NO:2或由其组成，且其等位基因变体与SEQ ID NO:2有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。这类短的多核苷酸序列特别有利于检测VAPB与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。更优选地，VAPB的外显子1的部分包含来自SEQ ID NO:1的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置43的核酸。连续核酸的数目可为SEQ ID NO:1的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置43的核酸。更优选地，VAPB的外显子1的部分包含或根据SEQ ID NO:1或其等位基因变体。

替代性地，VAPB外显子1的部分包含SEQ ID NO:17(或SEQ ID NO:17的等位基因变体)或由其组成，至少包括位置399的核酸。优选地，VAPB外显子1的部分包含来自SEQ IDNO:17或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置399的核酸。连续核酸的数目可为SEQ ID NO:17的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置399的核酸。在此替代例中，VAPB外显子1的部分更优选地包含或根据SEQ ID NO:17或其等位基因变体。优选地，在与VAPB的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

在一个替代性优选实施方式中，该包含VAPB外显子1的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:3的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置43和44的核酸。连续核酸的数目可为SEQ ID NO:3的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置43和44的核酸。SEQ ID NO:3包括介于VAPB与NRG1之间的接点，尤其该接点介于源于VAPB的位置43的核酸与源于NRG1的位置44的核酸之间。优选地，该包含VAPB外显子1的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:3的多核苷酸序列或其等位基因变体。

优选地，本文所提供的任一VAPB-NRG1多核苷酸融合物为VAPB与NRG1的框内融合。更优选地所述融合物为包含VAPB的外显子1或外显子1的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:3或其等位基因变体的融合物。

优选地，VAPB外显子1(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有VAPB的N端和NRG1的C端。此外，本文所提供的VAPB-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自VAPB的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供其EGF样结构域。该VAPB-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，包括肺癌或腺癌，特别是肺腺癌或非小细胞肺癌。

CADM1-NRG1多核苷酸融合物

也提供了一种包含CADM1的外显子7的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。CADM1的外显子7优选为SEQ ID NO:39或SEQ ID NO:39的等位基因变体的外显子，而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。

优选地，CADM1外显子7的等位基因变体与SEQ ID NO:39有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，CADM1的外显子7的部分包含或根据SEQ ID NO:5，且其等位基因变体与SEQ ID NO:5有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与CADM1的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:6的序列，且其等位基因变体与SEQ ID NO:6有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。这类短的多核苷酸序列特别有利于检测CADM1与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。更优选地，CADM1的外显子7的部分包含来自SEQ ID NO:5的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置43的核酸。连续核酸的数目可为SEQ ID NO:5的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置53的核酸。更优选地，CADM1的外显子7的部分包含或根据SEQ ID NO:5或其等位基因变体。

替代性地，CADM1外显子7的部分包含SEQ ID NO:39(或SEQ ID NO:39的等位基因变体)或由其组成，至少包括位置173的核酸。优选地，CADM1外显子7的部分包含来自SEQ IDNO:39或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置173的核酸。连续核酸的数目可为SEQ ID NO:39的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置173的核酸。在此替代例中，CADM1外显子7的部分更优选地包含或根据SEQ ID NO:39或其等位基因变体。优选地，在与CADM1的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

在一个替代性优选实施方式中，该包含CADM1外显子7的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:7的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置53和54的核酸。连续核酸的数目可为SEQ ID NO:7的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置53和54的核酸。SEQ ID NO:7包括介于CADM1与NRG1之间的接点，尤其该接点介于源于CADM1的位置53的核酸与源于NRG1的位置54的核酸之间。优选地，该包含CADM1外显子7的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:7的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:7的多核苷酸，或一种包含来自SEQ ID NO:7的约20、约30、约40个或全部的连续核酸且优选地包括位置53和54的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:7的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置53和54的核酸。

优选地，本文所提供的任一CADM1-NRG1多核苷酸融合物为CADM1与NRG1的框内融合。更优选地所述融合物为包含CADM1的外显子7或外显子7的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:7或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:7有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

优选地，该包含CADM1外显子7(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及CADM1或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于CADM1与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该CADM1外显子7(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有CADM1的N端和NRG1的C端。此外，本文所提供的CADM1-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自CADM1的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该CADM1-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，包括肺癌或腺癌，特别是肺腺癌。

当存在于患者或受试者的异常细胞中时，所述CADM1-NRG1多核苷酸融合物优选地进一步包括CADM1外显子7的5’处的任一序列以及NRG1外显子6的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:39和130可能就足够。来自CADM1外显子7的5’处的任一序列包含SEQ ID NO:33-38(或SEQ ID NO:33-38的任一等位基因变体)中的一者或全部，或是由其组成，而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的任一者或全部，或是由其组成。

CD44-NRG1多核苷酸融合物

也提供了一种包含CD44的外显子5的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。CD44的外显子5优选为SEQ ID NO:65或SEQ ID NO:65的等位基因变体的外显子，而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。

优选地，该CD44外显子5的等位基因变体与SEQ ID NO:65有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，CD44的外显子5的部分包含或根据SEQ ID NO:9，且其等位基因变体与SEQID NO:9有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与CD44的融合物中的NRG1的外显子2的部分优选是或包含如SEQID NO:10的序列，且其等位基因变体与SEQ ID NO:10有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，CD44的外显子5的部分包含来自SEQ ID NO:9的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置52的核酸。连续核酸的数目可为SEQ ID NO:9的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置52的核酸。更优选地，CD44的外显子5的部分包含或根据SEQ ID NO:9或其等位基因变体。这类短的多核苷酸序列特别有利于检测CD44与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，CD44外显子5的部分包含SEQ ID NO:65(或SEQ ID NO:65的等位基因变体)或由其组成，至少包括位置231的核酸。优选地，CD44外显子5的部分包含来自SEQ IDNO:65或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置231的核酸。连续核酸的数目可为SEQ ID NO:65的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置231的核酸。在此替代例中，CD44外显子5的部分更优选地包含或根据SEQ ID NO:231或其等位基因变体。优选地，在与CD44的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

在一个替代性优选实施方式中，该包含CD44外显子5的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:11的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置52和53的核酸。连续核酸的数目可为SEQ ID NO:11的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置52和53的核酸。SEQ IDNO:11包括介于CD44与NRG1之间的接点，尤其该接点介于源于CD44的位置52的核酸与源于NRG1的位置53的核酸之间。优选地，该包含CD44外显子5的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:15的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:11的多核苷酸，或一种包含来自SEQ ID NO:11的约20、约30、约40个或全部的连续核酸且优选地包括位置52和53的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:11的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置52和53的核酸。

优选地，本文所提供的任一CD44-NRG1多核苷酸融合物为CD44与NRG1的框内融合。更优选地所述融合物为包含CD44的外显子5(或外显子5的一部分)以及NRG1的外显子2(或NRG1的外显子2的一部分)的框内融合。所述框内融合优选为SEQ ID NO:11或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:11有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

优选地，该包含CD44外显子5(或其等位基因变体)的一部分与NRG1外显子2(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及CD44或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于CD44与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该CD44外显子5(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有CD44的N端和NRG1的C端。此外，本文所提供的CD44-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自CD44的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该CD44-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，包括胰脏癌或胰脏腺癌，特别是胰脏导管腺癌(或PDAC)。

当存在于患者或受试者的异常细胞中时，所述CD44-NRG1多核苷酸融合物优选地进一步包括CD44外显子5的5’处的任一序列以及NRG1外显子2的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:65和126可能就足够。来自CD44外显子5的5’处的任一序列包含SEQ ID NO:61-64(或SEQ ID NO:61-64的任一等位基因变体)中的一者或全部，或是由其组成，而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部，或是由其组成。

进一步地，提供了一种包含CD44的外显子5的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。所述CD44的外显子5优选为SEQ ID NO:65或SEQ ID NO:65的等位基因变体的外显子，而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。

优选地，所述CD44外显子5的等位基因变体与SEQ ID NO:65有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，所述CD44的外显子5的部分包含或根据SEQ ID NO:759，且其等位基因变体与SEQ ID NO:9有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与CD44的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:760的序列，且其等位基因变体与SEQ ID NO:760有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，CD44的外显子5的部分包含来自SEQ ID NO:759的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置75的核酸。连续核酸的数目可为SEQ ID NO:759的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75的核酸。更优选地，所述CD44的外显子5的部分包含或根据SEQ ID NO:759或其等位基因变体。这类短的多核苷酸序列特别有利于检测CD44与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，所述CD44外显子5的部分包含SEQ ID NO:65(或SEQ ID NO:65的等位基因变体)或由其组成，至少包括位置231的核酸。优选地，所述CD44外显子5的部分包含来自SEQ ID NO:65或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置231的核酸。连续核酸的数目可为SEQ ID NO:65的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置231的核酸。在此替代例中，CD44外显子5的部分更优选地包含或根据SEQ ID NO:65或其等位基因变体。优选地，在与CD44的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

优选地，本文所提供的任一CD44-NRG1多核苷酸融合物为CD44与NRG1的框内融合。更优选地所述融合物为包含CD44的外显子5或外显子5的一部分以及NRG1的外显子6或NRG1的外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:761或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:761有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含所述CD44外显子5的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:761的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置75和76的核酸。连续核酸的数目可为SEQ ID NO:761的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75和76的核酸。SEQ IDNO:761包括介于CD44与NRG1之间的接点，尤其该接点介于源于CD44的位置75的核酸与源于NRG1的位置76的核酸之间。优选地，该包含CD44外显子5的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:761的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:761的多核苷酸，或一种包含来自SEQ ID NO:761的约20、约30、约40个或全部的连续核酸且优选地包括位置75和76的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:761的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置75和76的核酸。

优选地，该包含CD44外显子5(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及所述CD44或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于CD44与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该CD44外显子5(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有CD44的N端和NRG1的C端。此外，本文所提供的CD44-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自CD44的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该CD44-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，特别是胰脏癌。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括CD44外显子5的5’处的任一序列以及NRG1外显子6的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:65和130可能就足够。来自CD44外显子5的5’处的任一序列包含SEQ ID NO:61-64(或SEQ ID NO:61-64的任一等位基因变体)中的一者或全部，或是由其组成，而来自NRG1外显子6的3’处的任一序列包含SEQID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部，或是由其组成。

SLC3A2-NRG1多核苷酸融合物

也提供了一种包含SLC3A2转录本6的外显子1的一部分与NRG1的外显子5的一部分融合的多核苷酸融合物。所述SLC3A2的外显子1优选为SEQ ID NO:103或SEQ ID NO:103的等位基因变体的外显子，而NRG1的外显子5优选为SEQ ID NO:129或SEQ ID NO:129的等位基因变体的外显子。

优选地，所述SLC3A2外显子1的等位基因变体与SEQ ID NO:103有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子5的等位基因变体与SEQ ID NO:129有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，所述SLC3A2的外显子1的部分包含或根据SEQ ID NO:13，且其等位基因变体与SEQ ID NO:13有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与SLC3A2的融合物中的NRG1的外显子5的部分优选是或包含如SEQ ID NO:14的序列，且其等位基因变体与SEQ ID NO:14有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，所述SLC3A2的外显子1的部分包含来自SEQ ID NO:13的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置53的核酸。连续核酸的数目可为SEQ ID NO:13的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置53的核酸。更优选地，所述SLC3A2的外显子1的部分包含或根据SEQ ID NO:13或其等位基因变体。这类短的多核苷酸序列特别有利于检测SLC3A2与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，所述SLC3A2外显子1的部分包含SEQ ID NO:103(或SEQ ID NO:103的等位基因变体)或由其组成，至少包括位置552的核酸。优选地，所述SLC3A2外显子1的部分包含来自SEQ ID NO:103或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置552的核酸。连续核酸的数目可为SEQ ID NO:103的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置552的核酸。在此替代例中，SLC3A2外显子1的部分更优选地包含或根据SEQ ID NO:103或其等位基因变体。优选地，在与所述SLC3A2的融合物中的NRG1外显子5的部分包含来自SEQ ID NO:157或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:157的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

优选地，本文所提供的任一SLC3A2-NRG1多核苷酸融合物为SLC3A2与NRG1的框内融合。更优选地所述融合物为包含SLC3A2的转录本6的外显子1或外显子1的一部分以及NRG1的外显子5或外显子5的一部分的框内融合。所述框内融合优选为SEQ ID NO:15或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:15有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含所述SLC3A2外显子1的一部分与NRG1外显子5的一部分融合的多核苷酸包含来自SEQ ID NO:15的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置53和54的核酸。连续核酸的数目可为SEQ ID NO:15的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置53和54的核酸。SEQID NO:15包括介于SLC3A2与NRG1之间的接点，尤其该接点介于源于SLC3A2的位置53的核酸与源于NRG1的位置54的核酸之间。优选地，该包含SLC3A2外显子1的一部分与NRG1外显子5的一部分融合的多核苷酸具有SEQ ID NO:15的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:15的多核苷酸，或一种包含来自SEQ ID NO:15的约20、约30、约40个或全部的连续核酸且优选地包括位置53和54的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:15的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置53和54的核酸。

优选地，该包含SLC3A2转录本6的外显子1(或其等位基因变体)的一部分与NRG1外显子5(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及所述SLC3A2或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于所述SLC3A2与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该SLC3A2转录本6的外显子1(或其等位基因变体)的部分位于NRG1外显子5(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有SLC3A2的N端和NRG1的C端。此外，本文所提供的SLC3A2-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自SLC3A2的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该SLC3A2-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，包括肺癌或腺癌，特别是肺腺癌。

当存在于患者或受试者的异常细胞中时，所述SCL3A2-NRG1多核苷酸融合物优选地进一步包括NRG1外显子5的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:103及129可能就足够。来自NRG1外显子5的3’处的任一序列包含SEQ ID NO:130-137(或SEQ ID NO:130-137的任一等位基因变体)中的一者或全部，或是由其组成。

进一步地，提供了一种包含SLC3A2转录本3的外显子2的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。所述SLC3A2的外显子2优选为SEQ ID NO:457或SEQ IDNO:457的等位基因变体的外显子，而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。

优选地，所述SLC3A2外显子2的等位基因变体与SEQ ID NO:457有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，所述SLC3A2的外显子2的部分包含或根据SEQ ID NO:452，且其等位基因变体与SEQ ID NO:452有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与SLC3A2的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:453的序列，且其等位基因变体与SEQ ID NO:453有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，SLC3A2的外显子2的部分包含来自SEQ ID NO:452的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置93的核酸。连续核酸的数目可为SEQ ID NO:452的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置93的核酸。更优选地，所述SLC3A2的外显子2的部分包含或根据SEQ ID NO:452或其等位基因变体。这类短的多核苷酸序列特别有利于检测SLC3A2与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，所述SLC3A2外显子2的部分包含SEQ ID NO:457(或SEQ ID NO:457的等位基因变体)或由其组成，至少包括位置93的核酸。优选地，所述SLC3A2外显子2的部分包含来自SEQ ID NO:457或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置93的核酸。连续核酸的数目可为SEQ ID NO:39的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置457的核酸。在此替代例中，SLC3A2外显子2的部分更优选地包含或根据SEQ ID NO:457或其等位基因变体。优选地，在与SLC3A2转录本3的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

优选地，本文所提供的任一SLC3A2-NRG1多核苷酸融合物为SLC3A2与NRG1的框内融合。更优选地所述融合物为包含SLC3A2的转录本3的外显子2或外显子2的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:454或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:454有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含所述SLC3A2外显子2的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:454的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置93和94的核酸。连续核酸的数目可为SEQ ID NO:454的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置93和94的核酸。SEQ ID NO:454包括介于所述SLC3A2与NRG1之间的接点，尤其该接点介于源于SLC3A2的位置93的核酸与源于NRG1的位置94的核酸之间。优选地，该包含SLC3A2外显子2的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:454的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:454的多核苷酸，或一种包含来自SEQ ID NO:454的约20、约30、约40个或全部的连续核酸且优选地包括位置93和94的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:454的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置93和94的核酸。

优选地，该包含SLC3A2转录本3的外显子2(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及所述SLC3A2或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于所述SLC3A2与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该SLC3A2转录本3的外显子2(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有SLC3A2的N端和NRG1的C端。此外，本文所提供的SLC3A2-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自SLC3A2的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该CADM1-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，包括肺癌或腺癌，特别是肺腺癌。

当存在于患者或受试者的异常细胞中时，所述SCL3A2-NRG1多核苷酸融合物优选地进一步包括NRG1外显子6的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:457和130可能就足够。来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部，或是由其组成。

VTCN1-NRG1多核苷酸融合物

也提供了一种包含VTCN1的外显子2的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。VTCN1的外显子2优选为SEQ ID NO:169或SEQ ID NO:169的等位基因变体的外显子，而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。

优选地，该VTCN1外显子2的等位基因变体与SEQ ID NO:169有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，VTCN1的外显子2的部分包含或根据SEQ ID NO:164，且其等位基因变体与SEQ ID NO:164有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与VTCN1的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:165的序列，且其等位基因变体与SEQ ID NO:165有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，VTCN1的外显子2的部分包含来自SEQ ID NO:164的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置65的核酸。连续核酸的数目可为SEQ ID NO:164的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置65的核酸。更优选地，VTCN1的外显子2的部分包含或根据SEQ ID NO:164或其等位基因变体。这类短的多核苷酸序列特别有利于检测VTCN1与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

优选地，本文所提供的任一VTCN1-NRG1多核苷酸融合物为VTCN1与NRG1的框内融合。更优选地所述融合物为包含VTCN1的外显子2或外显子2的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:166或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:166有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含VTCN1外显子2的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:166的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置65和66的核酸。连续核酸的数目可为SEQ ID NO:166的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置65和66的核酸。SEQ IDNO:166包括介于VTCN1与NRG1之间的接点，尤其该接点介于源于VTCN1的位置65的核酸与源于NRG1的位置66的核酸之间。优选地，该包含VTCN1外显子2的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:166的多核苷酸序列或其等位基因变体。优选地，在与VTCN1的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

在一个优选实施方式中，提供了一种根据SEQ ID NO:166的多核苷酸，或一种包含来自SEQ ID NO:166的约20、约30、约40个或全部的连续核酸且优选地包括位置65和66的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:166的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置65和66的核酸。

优选地，该包含VTCN1外显子2(或其等位基因变体)的一部分与NRG1外显子2(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及VTCN1或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于VTCN1与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该VTCN1外显子2(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有VTCN1的N端和NRG1的C端。此外，本文所提供的VTCN1-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自VTCN1的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该VTCN1-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，特别是腺癌。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括VTCN1外显子2的5’处的任一序列以及NRG1外显子2的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:169和126可能就足够。来自VTCN1外显子2的5’处的任一序列包含SEQ ID NO:168(或SEQ ID NO:168的任一等位基因变体)或是由其组成，而来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部，或是由其组成。

CDH1-NRG1多核苷酸融合物

也提供了一种包含CDH1的外显子11的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。CDH1的外显子11优选为SEQ ID NO:198或SEQ ID NO:198的等位基因变体的外显子，而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括CDH1外显子11的5’处的任一序列以及NRG1外显子2的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:198和126可能就足够。来自CDH1外显子11的5’处的任一序列包含SEQ ID NO:188-197(或SEQ ID NO:188-197的任一等位基因变体)中的一者或全部，或是由其组成，而来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该CDH1外显子11的等位基因变体与SEQ ID NO:198有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，CDH1的外显子11的部分包含或根据SEQ ID NO:184，且其等位基因变体与SEQ ID NO:184有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与CDH1的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:185的序列，且其等位基因变体与SEQ ID NO:185有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，CDH1的外显子11的部分包含来自SEQ ID NO:184的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置119的核酸。连续核酸的数目可为SEQ ID NO:184的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置119的核酸。更优选地，CDH1的外显子11的部分包含或根据SEQ ID NO:184或其等位基因变体。这类短的多核苷酸序列特别有利于检测CDH1与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，CDH1外显子11的部分包含SEQ ID NO:198(或SEQ ID NO:198的等位基因变体)或由其组成，至少包括位置146的核酸。优选地，CDH1外显子11的部分包含来自SEQID NO:198或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置146的核酸。连续核酸的数目可为SEQ ID NO:198的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置146的核酸。在此替代例中，CDH1外显子11的部分更优选地包含或根据SEQ ID NO:198或其等位基因变体。

优选地，本文所提供的任一CDH1-NRG1多核苷酸融合物为CDH1与NRG1的框内融合。更优选地所述融合物为包含CDH1的外显子11或外显子2的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:186或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:186有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含CDH1外显子11的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:186的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置119和120的核酸。连续核酸的数目可为SEQ ID NO:186的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置119和120的核酸。SEQID NO:186包括介于CDH1与NRG1之间的接点，尤其该接点介于源于CDH1的位置119的核酸与源于NRG1的位置120的核酸之间。优选地，该包含CDH1外显子11的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:186的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:186的多核苷酸，或一种包含来自SEQ ID NO:186的约20、约30、约40个或全部的连续核酸且优选地包括位置119和120的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:186的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置119和120的核酸。

优选地，该包含CDH1外显子11(或其等位基因变体)的一部分与NRG1外显子2(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及CDH1或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于CDH1与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该CDH1外显子11(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有CDH1的N端和NRG1的C端。此外，本文所提供的CDH1-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自CDH1的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该CDH1-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，包括肺癌或腺癌，特别是肺腺癌。

CXADR-NRG1多核苷酸融合物

也提供了一种包含CXADR的外显子1的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。CXADR的外显子1优选为SEQ ID NO:2199或SEQ ID NO:219的等位基因变体的外显子，而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括CXADR外显子1的5’处的任一序列以及NRG1外显子2的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:219和126可能就足够。NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该CXADR外显子1的等位基因变体与SEQ ID NO:219有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，CXADR的外显子1的部分包含或根据SEQ ID NO:215，且其等位基因变体与SEQ ID NO:215有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与CXADR的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:216的序列，且其等位基因变体与SEQ ID NO:216有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，CXADR的外显子1的部分包含来自SEQ ID NO:215的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置43的核酸。连续核酸的数目可为SEQ ID NO:215的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置43的核酸。更优选地，CXADR的外显子1的部分包含或根据SEQ ID NO:215或其等位基因变体。这类短的多核苷酸序列特别有利于检测CXADR与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，CXADR外显子1的部分包含SEQ ID NO:219(或SEQ ID NO:219的等位基因变体)或由其组成，至少包括位置130的核酸。优选地，CXADR外显子1的部分包含来自SEQID NO:219或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置130的核酸。连续核酸的数目可为SEQ ID NO:219的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置130的核酸。在此替代例中，CXADR外显子1的部分更优选地包含或根据SEQ ID NO:219或其等位基因变体。

优选地，本文所提供的任一CXADR-NRG1多核苷酸融合物为CXADR与NRG1的框内融合。更优选地所述融合物为包含CXADR的外显子1或外显子2的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:217或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:217有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含CXADR外显子1的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:217的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置43和44的核酸。连续核酸的数目可为SEQ ID NO:217的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置43和44的核酸。SEQ IDNO:217包括介于CXADR与NRG1之间的接点，尤其该接点介于源于CXADR的位置43的核酸与源于NRG1的位置44的核酸之间。优选地，该包含CXADR外显子1的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:217的多核苷酸序列或其等位基因变体。优选地，在与CXADR的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

在一个优选实施方式中，提供了一种根据SEQ ID NO:217的多核苷酸，或一种包含来自SEQ ID NO:217的约20、约30、约40个或全部的连续核酸且优选地包括位置43和44的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:217的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置43和44的核酸。

优选地，该包含CXADR外显子1(或其等位基因变体)的一部分与NRG1外显子2(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及CXADR或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于CXADR与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该CXADR外显子1(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有CXADR的N端和NRG1的C端。此外，本文所提供的CXADR-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自CXADR的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该CXADR-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，特别是大肠癌。

GTF2E2-NRG1多核苷酸融合物

也提供了一种包含GTF2E2的外显子2的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。GTF2E2的外显子2优选为SEQ ID NO:236或SEQ ID NO:236的等位基因变体的外显子，而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括GTF2E2外显子2的5’处的任一序列以及NRG1外显子2的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:236和126可能就足够。来自GTF2E2外显子2的5’处的任一序列包含SEQ ID NO:235(或SEQ ID NO:235的任一等位基因变体)或是由其组成，而来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该GTF2E2外显子2的等位基因变体与SEQ ID NO:236有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，GTF2E2的外显子2的部分包含或根据SEQ ID NO:231，且其等位基因变体与SEQ ID NO:231有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与GTF2E2的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:232的序列，且其等位基因变体与SEQ ID NO:232有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，GTF2E2的外显子2的部分包含来自SEQ ID NO:231的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置141的核酸。连续核酸的数目可为SEQ ID NO:231的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置141的核酸。更优选地，GTF2E2的外显子2的部分包含或根据SEQ ID NO:231或其等位基因变体。这类短的多核苷酸序列特别有利于检测GTF2E2与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，GTF2E2外显子2的部分包含SEQ ID NO:236(或SEQ ID NO:236的等位基因变体)或由其组成，至少包括位置170的核酸。优选地，GTF2E2外显子2的部分包含来自SEQID NO:236或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置170的核酸。连续核酸的数目可为SEQ ID NO:236的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置170的核酸。在此替代例中，GTF2E2外显子2的部分更优选地包含或根据SEQ ID NO:236或其等位基因变体。优选地，在与GTF2E2的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

优选地，本文所提供的任一GTF2E2-NRG1多核苷酸融合物为GTF2E2与NRG1的框内融合。更优选地所述融合物为包含GTF2E2的外显子2或外显子2的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:233或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:233有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含GTF2E2外显子2的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:233的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置141和142的核酸。连续核酸的数目可为SEQ ID NO:233的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置141和142的核酸。SEQID NO:233包括介于GTF2E2与NRG1之间的接点，尤其该接点介于源于GTF2E2的位置141的核酸与源于NRG1的位置142的核酸之间。优选地，该包含GTF2E2外显子2的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:233的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:233的多核苷酸，或一种包含来自SEQ ID NO:233的约20、约30、约40个或全部的连续核酸且优选地包括位置141和142的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:233的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置141和142的核酸。

优选地，该包含GTF2E2外显子2(或其等位基因变体)的一部分与NRG1外显子2(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及GTF2E2或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于GTF2E2与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该GTF2E2外显子2(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有GTF2E2的N端和NRG1的C端。此外，本文所提供的GTF2E2-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自GTF2E2的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该GTF2E2-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，更特别是(转移性)乳腺癌NOS。

CSMD1-NRG1多核苷酸融合物

也提供了一种包含CSMD1的外显子23的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。CSMD1的外显子23优选为SEQ ID NO:279或SEQ ID NO:279的等位基因变体的外显子，而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括CSMD1外显子23的5’处的任一序列以及NRG1外显子6的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:279和130可能就足够。来自CSMD1外显子23的5’处的任一序列包含SEQ ID NO:257-278(或SEQ ID NO:257-278的任一等位基因变体)中的任一者或全部，或是由其组成，而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该CSMD1外显子23的等位基因变体与SEQ ID NO:279有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，CSMD1的外显子23的部分包含或根据SEQ ID NO:253，且其等位基因变体与SEQ ID NO:253有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与CSMD1的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:254的序列，且其等位基因变体与SEQ ID NO:254有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，CSMD1的外显子23的部分包含来自SEQ ID NO:253的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置88的核酸。连续核酸的数目可为SEQ ID NO:253的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置88的核酸。更优选地，CSMD1的外显子23的部分包含或根据SEQ ID NO:253或其等位基因变体。这类短的多核苷酸序列特别有利于检测CSMD1与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，CSMD1外显子23的部分包含SEQ ID NO:279(或SEQ ID NO:279的等位基因变体)或由其组成，至少包括位置157的核酸。优选地，CSMD1外显子23的部分包含来自SEQID NO:279或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置157的核酸。连续核酸的数目可为SEQ ID NO:279的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置157的核酸。在此替代例中，CSMD1外显子23的部分更优选地包含或根据SEQ ID NO:279或其等位基因变体。优选地，在与CSMD1的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

优选地，本文所提供的任一CSMD1-NRG1多核苷酸融合物为CSMD1与NRG1的框内融合。更优选地所述融合物为包含CSMD1的外显子23或外显子6的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:255或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:255有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含CSMD1外显子23的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:255的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置88和89的核酸。连续核酸的数目可为SEQ ID NO:255的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置88和89的核酸。SEQ IDNO:255包括介于CSMD1与NRG1之间的接点，尤其该接点介于源于CSMD1的位置88的核酸与源于NRG1的位置89的核酸之间。优选地，该包含CSMD1外显子23的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:255的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:255的多核苷酸，或一种包含来自SEQ ID NO:255的约20、约30、约40个或全部的连续核酸且优选地包括位置88和89的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:255的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置88和89的核酸。

优选地，该包含CSMD1外显子23(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及CSMD1或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于CSMD1与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该CSMD1外显子23(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有CSMD1的N端和NRG1的C端。此外，本文所提供的CSMD1-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自CSMD1的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该CSMD1-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，特别是腺癌，更特别是胰脏导管腺癌。

PTN-NRG1多核苷酸融合物

也提供了一种包含PTN的外显子4的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。PTN的外显子4优选为SEQ ID NO:318或SEQ ID NO:318的等位基因变体的外显子，而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括PTN外显子4的5’处的任一序列以及NRG1外显子2的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:318和126可能就足够。来自PTN外显子4的5’处的任一序列包含SEQ ID NO:315-317(或SEQ ID NO:315-317的任一等位基因变体)中的任一者或全部，或是由其组成，而来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该PTN外显子4的等位基因变体与SEQ ID NO:318有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，PTN的外显子4的部分包含或根据SEQ ID NO:311，且其等位基因变体与SEQ ID NO:311有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与PTN的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:312的序列，且其等位基因变体与SEQ ID NO:312有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，PTN的外显子4的部分包含来自SEQ ID NO:311的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置102的核酸。连续核酸的数目可为SEQ IDNO:311的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置102的核酸。更优选地，PTN的外显子4的部分包含或根据SEQ ID NO:311或其等位基因变体。这类短的多核苷酸序列特别有利于检测PTN与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，PTN外显子4的部分包含SEQ ID NO:318(或SEQ ID NO:318的等位基因变体)或由其组成，至少包括位置162的核酸。优选地，PTN外显子4的部分包含来自SEQ IDNO:318或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置162的核酸。连续核酸的数目可为SEQ ID NO:318的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置162的核酸。在此替代例中，PTN外显子4的部分更优选地包含或根据SEQ ID NO:318或其等位基因变体。优选地，在与PTN的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

优选地，本文所提供的任一PTN-NRG1多核苷酸融合物为PTN与NRG1的框内融合。更优选地所述融合物为包含PTN的外显子4或外显子2的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:313或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:313有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含PTN外显子4的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:313的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置102和103的核酸。连续核酸的数目可为SEQ ID NO:313的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置102和103的核酸。SEQID NO:313包括介于PTN与NRG1之间的接点，尤其该接点介于源于PTN的位置102的核酸与源于NRG1的位置103的核酸之间。优选地，该包含PTN外显子4的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:313的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:313的多核苷酸，或一种包含来自SEQ ID NO:313的约20、约30、约40个或全部的连续核酸且优选地包括位置102和103的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:313的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置102和103的核酸。

优选地，该包含PTN外显子4(或其等位基因变体)的一部分与NRG1外显子2(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及PTN或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于PTN与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该PTN外显子4(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有PTN的N端和NRG1的C端。此外，本文所提供的PTN-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自PTN的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该PTN-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，特别是腺癌，更特别是胰脏导管腺癌。

ST14-NRG1多核苷酸融合物

也提供了一种包含ST14的外显子11的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。ST14的外显子11优选为SEQ ID NO:342或SEQ ID NO:342的等位基因变体的外显子，而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括ST14外显子11的5’处的任一序列以及NRG1外显子6的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:324和130可能就足够。来自ST14外显子11的5’处的任一序列包含SEQ ID NO:332-341(或SEQ ID NO:332-341的任一等位基因变体)中的任一者或全部，或是由其组成，而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该ST14外显子11的等位基因变体与SEQ ID NO:342有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，ST14的外显子11的部分包含或根据SEQ ID NO:328，且其等位基因变体与SEQ ID NO:328有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与ST14的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:329的序列，且其等位基因变体与SEQ ID NO:329有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，ST14的外显子11的部分包含来自SEQ ID NO:328的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置95的核酸。连续核酸的数目可为SEQ ID NO:328的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置95的核酸。更优选地，ST14的外显子11的部分包含或根据SEQ ID NO:328或其等位基因变体。这类短的多核苷酸序列特别有利于检测ST14与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，ST14外显子11的部分包含SEQ ID NO:342(或SEQ ID NO:342的等位基因变体)或由其组成，至少包括位置131的核酸。优选地，ST14外显子11的部分包含来自SEQID NO:342或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置131的核酸。连续核酸的数目可为SEQ ID NO:342的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置131的核酸。在此替代例中，ST14外显子11的部分更优选地包含或根据SEQ ID NO:342或其等位基因变体。优选地，在与ST14的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

优选地，本文所提供的任一ST14-NRG1多核苷酸融合物为ST14与NRG1的框内融合。更优选地所述融合物为包含ST14的外显子11或外显子6的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:330或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:330有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含ST14外显子11的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:330的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置95和96的核酸。连续核酸的数目可为SEQ ID NO:330的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置95和96的核酸。SEQ IDNO:330包括介于ST14与NRG1之间的接点，尤其该接点介于源于ST14的位置95的核酸与源于NRG1的位置96的核酸之间。优选地，该包含ST14外显子11的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:330的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:330的多核苷酸，或一种包含来自SEQ ID NO:330的约20、约30、约40个或全部的连续核酸且优选地包括位置95和96的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:330的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置95和96的核酸。

优选地，该包含ST14外显子11(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及ST14或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于ST14与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该ST14外显子11(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有ST14的N端和NRG1的C端。此外，本文所提供的ST14-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自ST14的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该ST14-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，特别是腺癌，更特别是胰脏导管腺癌。

THBS1-NRG1多核苷酸融合物

也提供了一种包含THBS1的外显子9的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。THBS1的外显子9优选为SEQ ID NO:386或SEQ ID NO:386的等位基因变体的外显子，而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括THBS1外显子9的5’处的任一序列以及NRG1外显子6的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:386和130可能就足够。来自THBS1外显子9的5’处的任一序列包含SEQ ID NO:378-385(或SEQ ID NO:378-385的任一等位基因变体)中的任一者或全部，或是由其组成，而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该THBS1外显子9的等位基因变体与SEQ ID NO:386有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，THBS1的外显子9的部分包含或根据SEQ ID NO:374，且其等位基因变体与SEQ ID NO:374有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与THBS1的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:375的序列，且其等位基因变体与SEQ ID NO:375有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，THBS1的外显子9的部分包含来自SEQ ID NO:374的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置56的核酸。连续核酸的数目可为SEQ ID NO:374的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置56的核酸。更优选地，THBS1的外显子9的部分包含或根据SEQ ID NO:374或其等位基因变体。这类短的多核苷酸序列特别有利于检测THBS1与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，THBS1外显子9的部分包含SEQ ID NO:386(或SEQ ID NO:386的等位基因变体)或由其组成，至少包括位置177的核酸。优选地，THBS1外显子9的部分包含来自SEQID NO:386或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置177的核酸。连续核酸的数目可为SEQ ID NO:386的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置177的核酸。在此替代例中，THBS1外显子9的部分更优选地包含或根据SEQ ID NO:386或其等位基因变体。优选地，在与THBS1的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

优选地，本文所提供的任一THBS1-NRG1多核苷酸融合物为THBS1与NRG1的框内融合。更优选地所述融合物为包含THBS1的外显子9或外显子6的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:376或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:376有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含THBS1外显子9的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:376的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置56和57的核酸。连续核酸的数目可为SEQ ID NO:376的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置56和57的核酸。SEQ IDNO:376包括介于THBS1与NRG1之间的接点，尤其该接点介于源于THBS1的位置56的核酸与源于NRG1的位置57的核酸之间。优选地，该包含THBS1外显子9的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:376的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:376的多核苷酸，或一种包含来自SEQ ID NO:376的约20、约30、约40个或全部的连续核酸且优选地包括位置56和57的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:376的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置56和57的核酸。

优选地，该包含THBS1外显子9(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及THBS1或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于THBS1与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该THBS1外显子9(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有THBS1的N端和NRG1的C端。此外，本文所提供的THBS1-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自THBS1的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该THBS1-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，特别是腺癌，更特别是胰脏导管腺癌。

AGRN-NRG1多核苷酸融合物

也提供了一种包含AGRN的外显子12的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。AGRN的外显子12优选为SEQ ID NO:416或SEQ ID NO:416的等位基因变体的外显子，而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括AGRN外显子12的5’处的任一序列以及NRG1外显子6的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:416和130可能就足够。来自AGRN外显子12的5’处的任一序列包含SEQ ID NO:405-415(或SEQ ID NO:405-415的任一等位基因变体)中的任一者或全部，或是由其组成，而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该AGRN外显子12的等位基因变体与SEQ ID NO:416有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，AGRN的外显子12的部分包含或根据SEQ ID NO:401，且其等位基因变体与SEQ ID NO:401有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与AGRN的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:402的序列，且其等位基因变体与SEQ ID NO:402有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，AGRN的外显子12的部分包含来自SEQ ID NO:401的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置106的核酸。连续核酸的数目可为SEQ ID NO:401的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置106的核酸。更优选地，AGRN的外显子12的部分包含或根据SEQ ID NO:401或其等位基因变体。这类短的多核苷酸序列特别有利于检测AGRN与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，AGRN外显子12的部分包含SEQ ID NO:416(或SEQ ID NO:416的等位基因变体)或由其组成，至少包括位置106的核酸。优选地，AGRN外显子12的部分包含来自SEQID NO:416或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置106的核酸。连续核酸的数目可为SEQ ID NO:416的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置106的核酸。在此替代例中，AGRN外显子12的部分更优选地包含或根据SEQ ID NO:416或其等位基因变体。优选地，在与AGRN的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

优选地，本文所提供的任一AGRN-NRG1多核苷酸融合物为AGRN与NRG1的框内融合。更优选地所述融合物为包含AGRN的外显子12或外显子12的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:403或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:403有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含AGRN外显子12的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:403的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置106和107的核酸。连续核酸的数目可为SEQ ID NO:403的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置106和107的核酸。SEQID NO:403包括介于AGRN与NRG1之间的接点，尤其该接点介于源于AGRN的位置106的核酸与源于NRG1的位置107的核酸之间。优选地，该包含AGRN外显子12的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:403的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:403的多核苷酸，或一种包含来自SEQ ID NO:403的约20、约30、约40个或全部的连续核酸且优选地包括位置106和107的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:403的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置106和107的核酸。

优选地，该包含AGRN外显子12(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及AGRN或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于AGRN与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该AGRN外显子12(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有AGRN的N端和NRG1的C端。此外，本文所提供的AGRN-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自AGRN的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该AGRN-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，特别是腺癌，更特别是胰脏导管腺癌。

PVALB-NRG1多核苷酸融合物

根据本公开，也提供一种包含PVALB核酸序列(或PVALB核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸。所述融合物中也包括PVALB和NRG1核酸序列的等位基因变体。

优选地，该PVALB核酸序列(或其一部分)包含SEQ ID NO:439-444中的任一者或SEQ ID NO:439-444中的任一者的等位基因变体，或是由其组成，而该NRG1核酸序列(或其一部分)包含SEQ ID NO:125-138中的任一者或SEQ ID NO:125-138中的任一者的等位基因变体，或是由其组成。更优选地，该PVALB核酸序列包含SEQ ID NO:444或SEQ ID NO:444的等位基因变体的一部分，或是由其组成，而该NRG1核酸序列包含SEQ ID NO:138或SEQ IDNO:138的等位基因变体的一部分，或是由其组成。SEQ ID NO:439-443分别对应于根据NM_002854.3的PVALB的个别外显子1-5。SEQ ID NO:444对应于根据NM_002854.3的PVALB的外显子1-5。SEQ ID NO:125-137分别对应于根据NM_001159999的NRG1的个别外显子1-13。SEQID NO:138对应于根据NM_001159999的NRG1的外显子1-13。

在一个优选实施方式中，该PVALB核酸序列部分包含来自SEQ ID NO:439-444中的任一者(或SEQ ID NO:439-444中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，而该NRG1核酸序列部分包含来自SEQ ID NO:125-138中的任一者(或SEQ ID NO:125-138中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸。

也提供了一种包含PVALB的外显子4的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。PVALB的外显子4优选为SEQ ID NO:442或SEQ ID NO:442的等位基因变体的外显子，而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括PVALB外显子4的5’处的任一序列以及NRG1外显子6的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:422和130可能就足够。来自PVALB外显子4的5’处的任一序列包含SEQ ID NO:439-441(或SEQ ID NO:439-441的任一等位基因变体)中的任一者或全部，或是由其组成，而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该PVALB外显子4的等位基因变体与SEQ ID NO:442有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，PVALB的外显子4的部分包含或根据SEQ ID NO:435，且其等位基因变体与SEQ ID NO:435有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与PVALB的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:436的序列，且其等位基因变体与SEQ ID NO:436有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，PVALB的外显子4的部分包含来自SEQ ID NO:435的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置102的核酸。连续核酸的数目可为SEQ ID NO:435的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置102的核酸。更优选地，PVALB的外显子4的部分包含或根据SEQ ID NO:435或其等位基因变体。这类短的多核苷酸序列特别有利于检测PVALB与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，PVALB外显子4的部分包含SEQ ID NO:442(或SEQ ID NO:442的等位基因变体)或由其组成，至少包括位置110的核酸。优选地，PVALB外显子4的部分包含来自SEQID NO:442或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置110的核酸。连续核酸的数目可为SEQ ID NO:442的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置110的核酸。在此替代例中，PVALB外显子4的部分更优选地包含或根据SEQ ID NO:442或其等位基因变体。优选地，在与PVALB的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

优选地，本文所提供的任一PVALB-NRG1多核苷酸融合物为PVALB与NRG1的框内融合。更优选地所述融合物为包含PVALB的外显子4或外显子4的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:437或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:437有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含PVALB外显子4的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:437的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置102和103的核酸。连续核酸的数目可为SEQ ID NO:437的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置102和103的核酸。SEQID NO:437包括介于PVALB与NRG1之间的接点，尤其该接点介于源于PVALB的位置102的核酸与源于NRG1的位置103的核酸之间。优选地，该包含PVALB外显子4的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:437的多核苷酸序列或其等位基因变体。

优选地，该包含PVALB外显子4(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及PVALB或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于PVALB与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该PVALB外显子4(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有PVALB的N端和NRG1的C端。此外，本文所提供的PVALB-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自PVALB的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该PVALB-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，特别是腺癌，更特别是胰脏导管腺癌。

APP-NRG1多核苷酸融合物

也提供了一种包含APP的外显子14的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。APP的外显子14优选为SEQ ID NO:501或SEQ ID NO:501的等位基因变体的外显子，而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括APP外显子14的5’处的任一序列以及NRG1外显子6的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:501和130可能就足够。来自APP外显子14的5’处的任一序列包含SEQ ID NO:488-500(或SEQ ID NO:488-500的任一等位基因变体)中的任一者或全部，或是由其组成，而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该APP外显子14的等位基因变体与SEQ ID NO:501有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，APP的外显子14的部分包含或根据SEQ ID NO:484，且其等位基因变体与SEQ ID NO:484有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与APP的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:485的序列，且其等位基因变体与SEQ ID NO:485有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，APP的外显子14的部分包含来自SEQ ID NO:484的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置54的核酸。连续核酸的数目可为SEQID NO:484的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置54的核酸。更优选地，APP的外显子14的部分包含或根据SEQ ID NO:484或其等位基因变体。这类短的多核苷酸序列特别有利于检测APP与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，APP外显子14的部分包含SEQ ID NO:501(或SEQ ID NO:501的等位基因变体)或由其组成，至少包括位置54的核酸。优选地，APP外显子14的部分包含来自SEQ IDNO:501或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置54的核酸。连续核酸的数目可为SEQ ID NO:501的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置54的核酸。在此替代例中，APP外显子14的部分更优选地包含或根据SEQ ID NO:501或其等位基因变体。优选地，在与APP的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

优选地，本文所提供的任一APP-NRG1多核苷酸融合物为APP与NRG1的框内融合。更优选地所述融合物为包含APP的外显子14或外显子14的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:486或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:486有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含APP外显子14的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:486的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置54和55的核酸。连续核酸的数目可为SEQ ID NO:486的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置54和55的核酸。SEQ IDNO:486包括介于APP与NRG1之间的接点，尤其该接点介于源于APP的位置54的核酸与源于NRG1的位置54的核酸之间。优选地，该包含APP外显子14的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:486的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:486的多核苷酸，或一种包含来自SEQ ID NO:486的约20、约30、约40个或全部的连续核酸且优选地包括位置54和55的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:486的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置54和55的核酸。

优选地，该包含APP外显子14(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及APP或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于APP与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该APP外显子14(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有APP的N端和NRG1的C端。此外，本文所提供的APP-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自APP的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该APP-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，特别是腺癌，更特别是胰脏导管腺癌。

WRN-NRG1多核苷酸融合物

也提供了一种包含WRN的外显子33的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。WRN的外显子33优选为SEQ ID NO:562或SEQ ID NO:562的等位基因变体的外显子，而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括WRN外显子33的5’处的任一序列以及NRG1外显子6的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:562和130可能就足够。来自WRN外显子33的5’处的任一序列包含SEQ ID NO:530-561(或SEQ ID NO:530-561的任一等位基因变体)中的任一者或全部，或是由其组成，而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该WRN外显子33的等位基因变体与SEQ ID NO:562有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，WRN的外显子33的部分包含或根据SEQ ID NO:526，且其等位基因变体与SEQ ID NO:526有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与WRN的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:527的序列，且其等位基因变体与SEQ ID NO:527有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，WRN的外显子33的部分包含来自SEQ ID NO:526的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置96的核酸。连续核酸的数目可为SEQID NO:526的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置96的核酸。更优选地，WRN的外显子33的部分包含或根据SEQ ID NO:526或其等位基因变体。这类短的多核苷酸序列特别有利于检测WRN与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，WRN外显子33的部分包含SEQ ID NO:562(或SEQ ID NO:562的等位基因变体)或由其组成，至少包括位置163的核酸。优选地，WRN外显子33的部分包含来自SEQ IDNO:562或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置163的核酸。连续核酸的数目可为SEQ ID NO:562的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置163的核酸。在此替代例中，WRN外显子33的部分更优选地包含或根据SEQ ID NO:562或其等位基因变体。优选地，在与WRN的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

优选地，本文所提供的任一WRN-NRG1多核苷酸融合物为WRN与NRG1的框内融合。更优选地所述融合物为包含WRN的外显子33或外显子33的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:528或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:528有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含WRN外显子33的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:528的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置96和97的核酸。连续核酸的数目可为SEQ ID NO:528的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置96和97的核酸。SEQ IDNO:528包括介于WRN与NRG1之间的接点，尤其该接点介于源于WRN的位置96的核酸与源于NRG1的位置97的核酸之间。优选地，该包含WRN外显子33的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:528的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:528的多核苷酸，或一种包含来自SEQ ID NO:528的约20、约30、约40个或全部的连续核酸且优选地包括位置96和97的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:528的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置96和97的核酸。

优选地，该包含WRN外显子33(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及WRN或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于WRN与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该WRN外显子33(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有WRN的N端和NRG1的C端。此外，本文所提供的WRN-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自WRN的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该WRN-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，特别是乳癌。

DAAM1-NRG1多核苷酸融合物

根据本公开，也提供一种包含DAAM1核酸序列(或DAAM1核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸。所述融合物中也包括DAAM1和NRG1核酸序列的等位基因变体。

优选地，该DAAM1核酸序列(或其一部分)包含SEQ ID NO:606-631中的任一者或SEQ ID NO:606-631中的任一者的等位基因变体，或是由其组成，而该NRG1核酸序列(或其一部分)包含SEQ ID NO:125-138中的任一者或SEQ ID NO:125-138中的任一者的等位基因变体，或是由其组成。更优选地，该DAAM1核酸序列包含SEQ ID NO:631或SEQ ID NO:631的等位基因变体的一部分，或是由其组成，而该NRG1核酸序列包含SEQ ID NO:138或SEQ IDNO:138的等位基因变体的一部分，或是由其组成。SEQ ID NO:606-630分别对应于根据NM_001270520.2的DAAM1的个别外显子1-25。SEQ ID NO:631对应于根据NM_001270520.2的DAAM1的外显子1-25。SEQ ID NO:125-137分别对应于根据NM_001159999.3的NRG1的个别外显子1-13。SEQ ID NO:138对应于根据NM_001159999.3的NRG1的外显子1-13。

在一个优选实施方式中，该DAAM1核酸序列部分包含来自SEQ ID NO:606-631中的任一者(或SEQ ID NO:606-631中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，而该NRG1核酸序列部分包含来自SEQ ID NO:125-138中的任一者(或SEQ ID NO:125-138中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸。

优选地，该DAAM1核酸序列的等位基因变体与SEQ ID NO:606-631中的任一者有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性；且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该DAAM1核酸序列或其一部分位于NRG1核酸序列或其一部分的5’处。

优选地，该包含DAAM1的DAAM1核酸序列(或所述序列的一部分)与NRG1核酸序列(或所述序列的一部分)融合的多核苷酸包含或编码NRG1的EGF样结构域。包含该DAAM1-NRG1多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了检测、诊断或鉴定的目的，只需证明介于DAAM1与NRG1之间的融合接点是框内的并且发生在可使得所得融合核酸编码NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

也提供了一种包含DAAM1的外显子1的一部分与NRG1的外显子1的一部分融合的多核苷酸融合物。DAAM1的外显子1优选为SEQ ID NO:606或SEQ ID NO:606的等位基因变体的外显子，而NRG1的外显子1优选为SEQ ID NO:125或SEQ ID NO:125的等位基因变体的外显子。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括DAAM1外显子1的5’处的任一序列以及NRG1外显子1的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:606及125可能就足够。来自DAAM1外显子1的5’处的任一序列包含SEQ ID NO:606(或SEQ ID NO:606的任一等位基因变体)或是由其组成，而来自NRG1外显子1的3’处的任一序列包含SEQ ID NO:126-137(或SEQ ID NO:126-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该DAAM1外显子1的等位基因变体与SEQ ID NO:606有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子1的等位基因变体与SEQ ID NO:125有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，DAAM1的外显子1的部分包含或根据SEQ ID NO:603，且其等位基因变体与SEQ ID NO:603有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与DAAM1的融合物中的NRG1的外显子1的部分优选是或包含如SEQ ID NO:604的序列，且其等位基因变体与SEQ ID NO:604有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，DAAM1的外显子1的部分包含来自SEQ ID NO:603的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置75的核酸。连续核酸的数目可为SEQ ID NO:603的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75的核酸。更优选地，DAAM1的外显子1的部分包含或根据SEQ ID NO:603或其等位基因变体。这类短的多核苷酸序列特别有利于检测DAAM1与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，DAAM1外显子1的部分包含SEQ ID NO:606(或SEQ ID NO:606的等位基因变体)或由其组成，至少包括位置102的核酸。优选地，DAAM1外显子1的部分包含来自SEQID NO:606或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置102的核酸。连续核酸的数目可为SEQ ID NO:606的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置102的核酸。在此替代例中，DAAM1外显子1的部分更优选地包含或根据SEQ ID NO:606或其等位基因变体。优选地，在与DAAM1的融合物中的NRG1外显子1的部分包含来自SEQ ID NO:125或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:125的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

在一个替代性优选实施方式中，该包含DAAM1外显子1的一部分与NRG1外显子1的一部分融合的多核苷酸包含来自SEQ ID NO:605的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置75和76的核酸。连续核酸的数目可为SEQ ID NO:605的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75和76的核酸。SEQ IDNO:605包括介于DAAM1与NRG1之间的接点，尤其该接点介于源于DAAM1的位置75的核酸与源于NRG1的位置76的核酸之间。优选地，该包含DAAM1外显子1的一部分与NRG1外显子1的一部分融合的多核苷酸具有SEQ ID NO:605的多核苷酸序列或其等位基因变体。

优选地，本文提供的任一DAAM1-NRG1多核苷酸融合物为DAAM1的未翻译区域的一部分与NRG1的未翻译区域的一部分的融合物。更优选地，所述融合物为一种包含DAAM1的外显子1(或外显子1的一部分)与NRG1的外显子1(或NRG1外显子1的一部分)的融合物。所述融合物优选为SEQ ID NO:605或其等位基因变体的融合物，且与SEQ ID NO:605有至少85％的一致性，优选地与其至少90％、92％、94％、96％或甚至98％的一致性。

优选地，DAAM1外显子1(或其等位基因变体)的部分位于NRG1外显子1(或其等位基因变体)的5’处。该NRG1蛋白因而变成了位于DAAM1启动子的下游并且期望能在转录上受所述启动子的控制。所得融合物因而导致非蛋白质融合的NRG1蛋白质表达，且因此含有EGF样结构域。随之而来的是驱动一小群人类癌症增生及存活的能力，特别是乳癌。

ASPH-NRG1多核苷酸融合物

根据本公开，也提供一种包含ASPH核酸序列(或ASPH核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸。所述融合物中也包括ASPH和NRG1核酸序列的等位基因变体。

优选地，该ASPH核酸序列(或其一部分)包含SEQ ID NO:637-662中的任一者或SEQID NO:637-662中的任一者的等位基因变体，或是由其组成，而该NRG1核酸序列(或其一部分)包含SEQ ID NO:125-138中的任一者或SEQ ID NO:125-138中的任一者的等位基因变体，或是由其组成。更优选地，该ASPH核酸序列包含SEQ ID NO:662或SEQ ID NO:662的等位基因变体的一部分，或是由其组成，而该NRG1核酸序列包含SEQ ID NO:138或SEQ ID NO:138的等位基因变体的一部分，或是由其组成。SEQ ID NO:637-661分别对应于根据NM_001164750.2的ASPH的个别外显子1-25。SEQ ID NO:662对应于根据NM_001164750.2的ASPH的外显子1-25。SEQ ID NO:125-137分别对应于根据NM_001159999.3的NRG1的个别外显子1-13。SEQ ID NO:138对应于根据NM_001159999.3的NRG1的外显子1-13。

在一个优选实施方式中，该ASPH核酸序列部分包含来自SEQ ID NO:637-662中的任一者(或SEQ ID NO:637-662中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，而该NRG1核酸序列部分包含来自SEQ ID NO:125-138中的任一者(或SEQ ID NO:125-138中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸。

优选地，该ASPH核酸序列的等位基因变体与SEQ ID NO:637-662中的任一者有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性；且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该ASPH核酸序列或其一部分位于NRG1核酸序列或其一部分的5’处。

优选地，该包含ASPH的ASPH核酸序列(或所述序列的一部分)与NRG1核酸序列(或所述序列的一部分)融合的多核苷酸包含或编码NRG1的EGF样结构域。包含该ASPH-NRG1多核苷酸融合物或表达该多肽融合物的异常细胞包含或编码NRG1的EGF样结构域。为了检测、诊断或鉴定的目的，只需证明介于ASPH与NRG1之间的融合接点是框内的并且发生在可使得所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

也提供了一种包含ASPH的外显子22的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。ASPH的外显子22优选为SEQ ID NO:658或SEQ ID NO:658的等位基因变体的外显子，而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括ASPH外显子22的5’处的任一序列以及NRG1外显子2的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:658和126可能就足够。来自ASPH外显子22的5’处的任一序列包含SEQ ID NO:637-657(或SEQ ID NO:637-657的任一等位基因变体)中的一者或全部，而来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该ASPH外显子22的等位基因变体与SEQ ID NO:658有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，ASPH的外显子22的部分包含或根据SEQ ID NO:633，且其等位基因变体与SEQ ID NO:633有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与ASPH的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:634的序列，且其等位基因变体与SEQ ID NO:634有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，ASPH的外显子22的部分包含来自SEQ ID NO:633的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置75的核酸。连续核酸的数目可为SEQ ID NO:633的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75的核酸。更优选地，ASPH的外显子22的部分包含或根据SEQ ID NO:633或其等位基因变体。这类短的多核苷酸序列特别有利于检测ASPH与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，ASPH外显子22的部分包含SEQ ID NO:658(或SEQ ID NO:658的等位基因变体)或由其组成，至少包括位置136的核酸。优选地，ASPH外显子22的部分包含来自SEQID NO:658或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置136的核酸。连续核酸的数目可为SEQ ID NO:658的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置136的核酸。在此替代例中，ASPH外显子22的部分更优选地包含或根据SEQ ID NO:658或其等位基因变体。优选地，在与ASPH的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

在一个替代性优选实施方式中，该包含ASPH外显子22的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:635的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置75和76的核酸。连续核酸的数目可为SEQ ID NO:635的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75和76的核酸。SEQ IDNO:635包括介于ASPH与NRG1之间的接点，尤其该接点介于源于ASPH的位置75的核酸与源于NRG1的位置76的核酸之间。优选地，该包含ASPH外显子22的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:635的多核苷酸序列或其等位基因变体。

优选地，本文所提供的任一ASPH-NRG1多核苷酸融合物为ASPH与NRG1的框内融合。更优选地所述融合物为包含ASPH的外显子22或外显子22的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:635或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:635有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

优选地，ASPH外显子2(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有ASPH的N端和NRG1的C端。此外，本文所提供的ASPH-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自ASPH的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该ASPH-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，特别是腺癌，更特别是大肠直肠腺癌。

NOTCH2-NRG1多核苷酸融合物

也提供了一种包含NOTCH2的外显子6的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。NOTCH2的外显子6优选为SEQ ID NO:700或SEQ ID NO:700的等位基因变体的外显子，而NRG1的外显子1优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括NOTCH2外显子6的5’处的任一序列以及NRG1外显子6的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:700和130可能就足够。来自NOTCH2外显子6的5’处的任一序列包含SEQ ID NO:695-699(或SEQ ID NO:695-699的任一等位基因变体)中的一者或全部，或是由其组成，而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该NOTCH2外显子6的等位基因变体与SEQ ID NO:700有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，NOTCH2的外显子6的部分包含或根据SEQ ID NO:691，且其等位基因变体与SEQ ID NO:691有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与NOTCH2的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:692的序列，且其等位基因变体与SEQ ID NO:692有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，NOTCH2的外显子6的部分包含来自SEQ ID NO:691的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置75的核酸。连续核酸的数目可为SEQ ID NO:691的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75的核酸。更优选地，NOTCH2的外显子6的部分包含或根据SEQ ID NO:691或其等位基因变体。这类短的多核苷酸序列特别有利于检测NOTCH2与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，NOTCH2外显子6的部分包含SEQ ID NO:700(或SEQ ID NO:700的等位基因变体)或由其组成，至少包括位置234的核酸。优选地，NOTCH2外显子6的部分包含来自SEQID NO:700或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置234的核酸。连续核酸的数目可为SEQ ID NO:700的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置234的核酸。在此替代例中，NOTCH2外显子6的部分更优选地包含或根据SEQ ID NO:700或其等位基因变体。优选地，在与NOTCH2的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

优选地，本文所提供的任一NOTCH2-NRG1多核苷酸融合物为NOTCH2与NRG1的框内融合。更优选地所述融合物为包含NOTCH2的外显子6或外显子6的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:693或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:693有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含NOTCH2外显子6的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:693的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置75和76的核酸。连续核酸的数目可为SEQ ID NO:693的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75和76的核酸。SEQ IDNO:693包括介于NOTCH2与NRG1之间的接点，尤其该接点介于源于NOTCH2的位置75的核酸与源于NRG1的位置76的核酸之间。优选地，该包含NOTCH2外显子6的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:693的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:693的多核苷酸，或一种包含来自SEQ ID NO:693的约20、约30、约40个或全部的连续核酸且优选地包括位置75和76的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:693的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置75和76的核酸。

优选地，该包含NOTCH2外显子6(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及NOTCH2或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于NOTCH2与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该NOTCH2外显子6(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有NOTCH2的N端和NRG1的C端。此外，本文所提供的NOTCH2-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自NOTCH2的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该NOTCH2-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，特别是腺癌，更特别是胰脏导管腺癌。

CD74-NRG1多核苷酸融合物

也提供了一种包含CD74的外显子2的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。CD74的外显子2优选为SEQ ID NO:720或SEQ ID NO:720的等位基因变体的外显子，而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括CD74外显子2的5’处的任一序列以及NRG1外显子2的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:720和126可能就足够。来自CD74外显子2的5’处的任一序列包含SEQ ID NO:719(或SEQ ID NO:719的任一等位基因变体)或是由其组成，而来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该CD74外显子2的等位基因变体与SEQ ID NO:720有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，CD74的外显子2的部分包含或根据SEQ ID NO:715，且其等位基因变体与SEQ ID NO:715有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与CD74的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:716的序列，且其等位基因变体与SEQ ID NO:716有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，CD74的外显子2的部分包含来自SEQ ID NO:715的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置75的核酸。连续核酸的数目可为SEQID NO:715的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75的核酸。更优选地，CD74的外显子2的部分包含或根据SEQ ID NO:715或其等位基因变体。这类短的多核苷酸序列特别有利于检测CD74与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，CD74外显子2的部分包含SEQ ID NO:720(或SEQ ID NO:720的等位基因变体)或由其组成，至少包括位置173的核酸。优选地，CD74外显子2的部分包含来自SEQ IDNO:720或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置173的核酸。连续核酸的数目可为SEQ ID NO:720的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置173的核酸。在此替代例中，CD74外显子2的部分更优选地包含或根据SEQ ID NO:720或其等位基因变体。优选地，在与CD74的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

优选地，本文所提供的任一CD74-NRG1多核苷酸融合物为CD74与NRG1的框内融合。更优选地所述融合物为包含CD74的外显子2或外显子2的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:717或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:717有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含CD74外显子2的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:717的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置53和54的核酸。连续核酸的数目可为SEQ ID NO:7的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75和76的核酸。SEQ ID NO:717包括介于CD74与NRG1之间的接点，尤其该接点介于源于CD74的位置75的核酸与源于NRG1的位置76的核酸之间。优选地，该包含CD74外显子2的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:717的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:717的多核苷酸，或一种包含来自SEQ ID NO:717的约20、约30、约40个或全部的连续核酸且优选地包括位置75和76的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:717的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置75和76的核酸。

优选地，该包含CD74外显子2(或其等位基因变体)的一部分与NRG1外显子2(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及CD74或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于CD74与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该CD74外显子2(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有CD74的N端和NRG1的C端。此外，本文所提供的CD74-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自CD74的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该CD74-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，特别是肺癌。

SDC4-NRG1多核苷酸融合物

也提供了一种包含SDC4的外显子2的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。所述SDC4的外显子2优选为SEQ ID NO:746或SEQ ID NO:746的等位基因变体的外显子，而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。

优选地，所述SDC4外显子2的等位基因变体与SEQ ID NO:746有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，所述SDC4的外显子2的部分包含或根据SEQ ID NO:741，且其等位基因变体与SEQ ID NO:741有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与SDC4的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:742的序列，且其等位基因变体与SEQ ID NO:742有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，SDC4的外显子2的部分包含来自SEQ ID NO:741的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置75的核酸。连续核酸的数目可为SEQ ID NO:741的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75的核酸。更优选地，所述SDC4的外显子2的部分包含或根据SEQ ID NO:741或其等位基因变体。这类短的多核苷酸序列特别有利于检测SDC4与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，所述SDC4外显子2的部分包含SEQ ID NO:746(或SEQ ID NO:746的等位基因变体)或由其组成，至少包括位置139的核酸。优选地，所述SDC4外显子2的部分包含来自SEQ ID NO:746或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置139的核酸。连续核酸的数目可为SEQ ID NO:746的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置139的核酸。在此替代例中，SDC4外显子2的部分更优选地包含或根据SEQ ID NO:746或其等位基因变体。优选地，在与SDC4的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

优选地，本文所提供的任一SDC4-NRG1多核苷酸融合物为SDC4与NRG1的框内融合。更优选地所述融合物为包含SDC4的外显子2或外显子2的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:743或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:743有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含所述SDC4外显子2的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:743的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置75和76的核酸。连续核酸的数目可为SEQ ID NO:743的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75和76的核酸。SEQ IDNO:743包括介于SDC4与NRG1之间的接点，尤其该接点介于源于SDC4的位置75的核酸与源于NRG1的位置76的核酸之间。优选地，该包含SDC4外显子2的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:743的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:743的多核苷酸，或一种包含来自SEQ ID NO:743的约20、约30、约40个或全部的连续核酸且优选地包括位置75和76的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:743的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置75和76的核酸。

优选地，该包含SDC4外显子2(或其等位基因变体)的一部分与NRG1外显子2(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及所述SDC4或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于SDC4与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该SDC4外显子2(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有SDC4的N端和NRG1的C端。此外，本文所提供的SDC4-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自SDC4的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该SDC4-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，特别是肺癌。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括SDC4外显子2的5’处的任一序列以及NRG1外显子2的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:746和126可能就足够。来自SDC4外显子2的5’处的任一序列包含SEQ ID NO:745(或SEQ ID NO:745的任一等位基因变体)或是由其组成，而来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部，或是由其组成。

进一步地，提供了一种包含SDC4的外显子4的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。所述SDC4的外显子4优选为SEQ ID NO:748或SEQ ID NO:748的等位基因变体的外显子，而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。

优选地，所述SDC4外显子4的等位基因变体与SEQ ID NO:748有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，所述SDC4的外显子4的部分包含或根据SEQ ID NO:822，且其等位基因变体与SEQ ID NO:822有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与SDC4的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:823的序列，且其等位基因变体与SEQ ID NO:823有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，SDC4的外显子4的部分包含来自SEQ ID NO:822的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置75的核酸。连续核酸的数目可为SEQ ID NO:822的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75的核酸。更优选地，所述SDC4的外显子4的部分包含或根据SEQ ID NO:822或其等位基因变体。这类短的多核苷酸序列特别有利于检测SDC4与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，所述SDC4外显子4的部分包含SEQ ID NO:748(或SEQ ID NO:748的等位基因变体)或由其组成，至少包括位置199的核酸。优选地，所述SDC4外显子4的部分包含来自SEQ ID NO:748或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置199的核酸。连续核酸的数目可为SEQ ID NO:748的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置199的核酸。在此替代例中，SDC4外显子4的部分更优选地包含或根据SEQ ID NO:748或其等位基因变体。优选地，在与SDC4的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

优选地，本文所提供的任一SDC4-NRG1多核苷酸融合物为SDC4与NRG1的框内融合。更优选地所述融合物为包含SDC4的外显子4或外显子4的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:824或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:824有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含所述SDC4外显子4的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:824的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置75和76的核酸。连续核酸的数目可为SEQ ID NO:824的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75和76的核酸。SEQ IDNO:824包括介于SDC4与NRG1之间的接点，尤其该接点介于源于SDC4的位置75的核酸与源于NRG1的位置76的核酸之间。优选地，该包含SDC4外显子4的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:824的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:824的多核苷酸，或一种包含来自SEQ ID NO:824的约20、约30、约40个或全部的连续核酸且优选地包括位置53和54的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:824的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置75和76的核酸。

优选地，该包含SDC4外显子4(或其等位基因变体)的一部分与NRG1外显子2(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及所述SDC4或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于SDC4与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该SDC4外显子4(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有SDC4的N端和NRG1的C端。此外，本文所提供的SDC4-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自SDC4的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该SDC4-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，包括肺癌，特别是非小细胞肺癌。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括SDC4外显子4的5’处的任一序列以及NRG1外显子2的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:748和126可能就足够。来自SDC4外显子4的5’处的任一序列包含SEQ ID NO:745-747(或SEQ ID NO:745-747的任一等位基因变体)中的一者或全部，或是由其组成，而来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部，或是由其组成。

SLC4A4-NRG1多核苷酸融合物

也提供了一种包含SLC4A4的外显子14的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。SLC4A4的外显子14优选为SEQ ID NO:780或SEQ ID NO:780的等位基因变体的外显子，而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括SLC4A4外显子14的5’处的任一序列以及NRG1外显子6的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:780和130可能就足够。来自SLC4A4外显子14的5’处的任一序列包含SEQ ID NO:767-779(或SEQ ID NO:767-779的任一等位基因变体)中的一者或全部，或是由其组成，而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该SLC4A4外显子14的等位基因变体与SEQ ID NO:780有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，SLC4A4的外显子14的部分包含或根据SEQ ID NO:763，且其等位基因变体与SEQ ID NO:763有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与SLC4A4的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:764的序列，且其等位基因变体与SEQ ID NO:764有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，SLC4A4的外显子14的部分包含来自SEQ ID NO:763的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置75的核酸。连续核酸的数目可为SEQ ID NO:763的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75的核酸。更优选地，SLC4A4的外显子14的部分包含或根据SEQ ID NO:763或其等位基因变体。这类短的多核苷酸序列特别有利于检测SLC4A4与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，SLC4A4外显子14的部分包含SEQ ID NO:780(或SEQ ID NO:780的等位基因变体)或由其组成，至少包括位置272的核酸。优选地，SLC4A4外显子14的部分包含来自SEQ ID NO:780或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置272的核酸。连续核酸的数目可为SEQ ID NO:780的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置272的核酸。在此替代例中，SLC4A4外显子14的部分更优选地包含或根据SEQ ID NO:780或其等位基因变体。优选地，在与SLC4A4的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

优选地，本文所提供的任一SLC4A4-NRG1多核苷酸融合物为SLC4A4与NRG1的框内融合。更优选地所述融合物为包含SLC4A4的外显子14或外显子14的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:765或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:765有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

在一个替代性优选实施方式中，该包含SLC4A4外显子14的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:765的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置75和76的核酸。连续核酸的数目可为SEQ ID NO:765的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75和76的核酸。SEQ IDNO:765包括介于SLC4A4与NRG1之间的接点，尤其该接点介于源于SLC4A4的位置75的核酸与源于NRG1的位置76的核酸之间。优选地，该包含SLC4A4外显子14的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:765的多核苷酸序列或其等位基因变体。

在一个优选实施方式中，提供了一种根据SEQ ID NO:765的多核苷酸，或一种包含来自SEQ ID NO:765的约20、约30、约40个或全部的连续核酸且优选地包括位置75和76的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:765的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且优选地至少包括位置75和76的核酸。

优选地，该包含SLC4A4外显子14(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及SLC4A4或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的，只需证明介于SLC4A4与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该SLC4A4外显子14(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有SLC4A4的N端和NRG1的C端。此外，本文所提供的SLC4A4-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自SLC4A4的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该SLC4A4-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，特别是胰脏癌。

ZFAT-NRG1多核苷酸融合物

根据本公开，也提供一种包含ZFAT核酸序列(或ZFAT核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸。所述融合物中也包括ZFAT和NRG1核酸序列的等位基因变体。

优选地，该ZFAT核酸序列(或其一部分)包含SEQ ID NO:830-846中的任一者或SEQID NO:830-846中的任一者的等位基因变体，或是由其组成，而该NRG1核酸序列(或其一部分)包含SEQ ID NO:125-138中的任一者或SEQ ID NO:125-138中的任一者的等位基因变体，或是由其组成。更优选地，该ZFAT核酸序列包含SEQ ID NO:846或SEQ ID NO:846的等位基因变体的一部分，或是由其组成，而该NRG1核酸序列包含SEQ ID NO:138或SEQ ID NO:138的等位基因变体的一部分，或是由其组成。SEQ ID NO:830-845分别对应于根据NM_020863.4的ZFAT的个别外显子1-16。SEQ ID NO:846对应于根据NM_020863.4的ZFAT的外显子1-16。SEQ ID NO:125-137分别对应于根据NM_001159999.3的NRG1的个别外显子1-13。SEQ ID NO:138对应于根据NM_001159999.3的NRG1的外显子1-13。

在一个优选实施方式中，该ZFAT核酸序列部分包含来自SEQ ID NO:830-846中的任一者(或SEQ ID NO:830-846中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，而该NRG1核酸序列部分包含来自SEQ ID NO:125-138中的任一者(或SEQ ID NO:125-138中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸。

优选地，该ZFAT核酸序列的等位基因变体与SEQ ID NO:830-846中的任一者有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性；且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该ZFAT核酸序列或其一部分位于NRG1核酸序列或其一部分的5’处。

优选地，该包含ZFAT的ZFAT核酸序列(或所述序列的一部分)与NRG1核酸序列(或所述序列的一部分)融合的多核苷酸包含或编码NRG1的EGF样结构域。

包含该ZFAT-NRG1多核苷酸融合物或表达该多肽融合物的异常细胞包含或编码NRG1的EGF样结构域。为了检测、诊断或鉴定的目的，只需证明介于ZFAT与NRG1之间的融合接点是框内的并且发生在可使得所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

也提供了一种包含ZFAT的外显子12的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。ZFAT的外显子12优选为SEQ ID NO:841或SEQ ID NO:841的等位基因变体的外显子，而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括ZFAT外显子12的5’处的任一序列以及NRG1外显子6的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:841和130可能就足够。来自ZFAT外显子12的5’处的任一序列包含SEQ ID NO:830-840(或SEQ ID NO:830-840的任一等位基因变体)中的一者或全部，或是由其组成，而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该ZFAT外显子12的等位基因变体与SEQ ID NO:841有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，ZFAT的外显子12的部分包含或根据SEQ ID NO:826，且其等位基因变体与SEQ ID NO:826有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与ZFAT的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:827的序列，且其等位基因变体与SEQ ID NO:827有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，ZFAT的外显子12的部分包含来自SEQ ID NO:826的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置75的核酸。连续核酸的数目可为SEQ ID NO:826的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75的核酸。更优选地，ZFAT的外显子12的部分包含或根据SEQ ID NO:826或其等位基因变体。这类短的多核苷酸序列特别有利于检测ZFAT与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，ZFAT外显子12的部分包含SEQ ID NO:841(或SEQ ID NO:841的等位基因变体)或由其组成，至少包括位置139的核酸。优选地，ZFAT外显子12的部分包含来自SEQID NO:841或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置139的核酸。连续核酸的数目可为SEQ ID NO:841的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置139的核酸。在此替代例中，ZFAT外显子12的部分更优选地包含或根据SEQ ID NO:841或其等位基因变体。优选地，在与ZFAT的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

在一个替代性优选实施方式中，该包含ZFAT外显子12的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:828的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置75和76的核酸。连续核酸的数目可为SEQ ID NO:828的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75和76的核酸。SEQ IDNO:828包括介于ZFAT与NRG1之间的接点，尤其该接点介于源于ZFAT的位置75的核酸与源于NRG1的位置76的核酸之间。优选地，该包含ZFAT外显子12的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:828的多核苷酸序列或其等位基因变体。

优选地，本文所提供的任一ZFAT-NRG1多核苷酸融合物为ZFAT与NRG1的框内融合。更优选地所述融合物为包含ZFAT的外显子12或外显子12的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:828或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:828有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

优选地，该ZFAT外显子12(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有ZFAT的N端和NRG1的C端。此外，本文所提供的ZFAT-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自ZFAT的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该ZFAT-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，特别是非小细胞肺癌。

DSCAML1-NRG1多核苷酸融合物

根据本公开，也提供一种包含DSCAML1核酸序列(或DSCAML1核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸。所述融合物中也包括DSCAML1和NRG1核酸序列的等位基因变体。

优选地，该DSCAML1核酸序列(或其一部分)包含SEQ ID NO:870-903中的任一者或SEQ ID NO:870-903中的任一者的等位基因变体，或是由其组成，而该NRG1核酸序列(或其一部分)包含SEQ ID NO:125-138中的任一者或SEQ ID NO:125-138中的任一者的等位基因变体，或是由其组成。更优选地，该DSCAML1核酸序列包含SEQ ID NO:903或SEQ ID NO:903的等位基因变体的一部分，或是由其组成，而该NRG1核酸序列包含SEQ ID NO:138或SEQ IDNO:138的等位基因变体的一部分，或是由其组成。SEQ ID NO:870-902分别对应于根据NM_020693.4的DSCAML1的个别外显子1-33。SEQ ID NO:903对应于根据NM_020693.4的DSCAML1的外显子1-33。SEQ ID NO:125-137分别对应于根据NM_001159999.3的NRG1的个别外显子1-13。SEQ ID NO:138对应于根据NM_001159999.3的NRG1的外显子1-13。

在一个优选实施方式中，该DSCAML1核酸序列部分包含来自SEQ ID NO:870-903中的任一者(或SEQ ID NO:870-903中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，而该NRG1核酸序列部分包含来自SEQ ID NO:125-138中的任一者(或SEQ ID NO:125-138中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸。

优选地，该DSCAML1核酸序列的等位基因变体与SEQ ID NO:870-903中的任一者有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性；且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，该DSCAML1核酸序列或其一部分位于NRG1核酸序列或其一部分的5’处。

优选地，该包含DSCAML1的DSCAML1核酸序列(或所述序列的一部分)与NRG1核酸序列(或所述序列的一部分)融合的多核苷酸包含或编码NRG1的EGF样结构域。

包含该DSCAML1-NRG1多核苷酸融合物或表达该多肽融合物的异常细胞包含或编码NRG1的EGF样结构域。为了检测、诊断或鉴定的目的，只需证明介于DSCAML1与NRG1之间的融合接点是框内的并且发生在可使得所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

也提供了一种包含DSCAML1的外显子3的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。DSCAML1的外显子3优选为SEQ ID NO:872或SEQ ID NO:872的等位基因变体的外显子，而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。

当存在于患者或受试者的异常细胞中时，所述多核苷酸融合物优选地进一步包括DSCAML1外显子3的5’处的任一序列以及NRG1外显子2的3’处的任一序列，但为了能使用以多核苷酸为基础的检测测定法来检测融合接点，至少存在SEQ ID NO:872和126可能就足够。来自DSCAML1外显子3的5’处的任一序列包含SEQ ID NO:870-871(或SEQ ID NO:870-871的任一等位基因变体)中的一者或全部，或是由其组成，而来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部，或是由其组成。

优选地，该DSCAML1外显子3的等位基因变体与SEQ ID NO:872有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性，而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，DSCAML1的外显子3的部分包含或根据SEQ ID NO:866，且其等位基因变体与SEQ ID NO:866有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在与DSCAML1的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:867的序列，且其等位基因变体与SEQ ID NO:867有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。更优选地，DSCAML1的外显子3的部分包含来自SEQ ID NO:866的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置75的核酸。连续核酸的数目可为SEQ ID NO:826的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75的核酸。更优选地，DSCAML1的外显子3的部分包含或根据SEQ ID NO:866或其等位基因变体。这类短的多核苷酸序列特别有利于检测DSCAML1与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。

替代性地，DSCAML1外显子3的部分包含SEQ ID NO:872(或SEQ ID NO:872的等位基因变体)或由其组成，至少包括位置147的核酸。优选地，DSCAML1外显子3的部分包含来自SEQ ID NO:872或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置147的核酸。连续核酸的数目可为SEQ ID NO:872的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置147的核酸。在此替代例中，DSCAML1外显子3的部分更优选地包含或根据SEQ ID NO:872或其等位基因变体。优选地，在与DSCAML1的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成，且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置1的核酸。

在一个替代性优选实施方式中，该包含DSCAML1外显子3的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:868的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸，且包括位置75和76的核酸。连续核酸的数目可为SEQ ID NO:868的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸，且至少包括位置75和76的核酸。SEQ IDNO:868包括介于DSCAML1与NRG1之间的接点，尤其该接点介于源于DSCAML1的位置75的核酸与源于NRG1的位置76的核酸之间。优选地，该包含DSCAML1外显子3的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:868的多核苷酸序列或其等位基因变体。

优选地，本文所提供的任一DSCAML1-NRG1多核苷酸融合物为DSCAML1与NRG1的框内融合。更优选地所述融合物为包含DSCAML1的外显子3或外显子3的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:868或其等位基因变体的融合物，且该等位基因变体与SEQ ID NO:868有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

优选地，该DSCAML1外显子3(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有DSCAML1的N端和NRG1的C端。此外，本文所提供的DSCAML1-NRG1多核苷酸融合物产生了一种蛋白质融合物，其中从N端到该融合接点的部分是来自DSCAML1的多肽序列，而从该接点到C端的部分为NRG1多肽序列，其中该NRG1部分也提供了其EGF样结构域。该DSCAML1-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力，特别是腺癌，更特别是胰脏导管腺癌。

本文所提及的每个包含NRG1的多核苷酸融合物，包括VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、DAAM1-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1或DSCAML1-NRG1，优选地被分离出来。本发明的任一方法优选地包括从样本分离出一种或多种含有多核苷酸的组分。该一种或多种含有多核苷酸的组分通常从样本中的任一细胞或细胞材料中分离出来。

NRG1多肽融合物

根据本公开，现在提供了包含NRG1的多肽融合物，包括VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1和DSCAML1-NRG1。特别地，在被诊断患有癌症的人类患者中存在或已鉴定出这类融合物，并在下节中更详细地提及。

VAPB-NRG1多肽融合物

根据本公开，也提供一种由包含VAPB核酸序列(或VAPB核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸所编码的多肽融合物。该VAPB核酸序列(或其一部分)优选地编码包含SEQ ID NO:24-30中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。该NRG1核酸序列(或其一部分)优选地编码包含SEQ ID NO:139-152中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。

SEQ ID NO:24-30中的任一者的VAPB等位基因变体优选地与其具有至少85％的序列一致性，更优选地与其具有90％、92％、94％、96％或甚至更优选地至少98％的序列一致性。SEQ ID NO:139-152中的任一者的NRG1等位基因变体优选地与其具有至少85％的序列一致性，更优选地与其具有90％、92％、94％、96％或甚至更优选地至少98％的序列一致性。

优选地，所述融合物的VAPB核酸序列部分编码VAPB的多肽部分，此多肽部分包含来自SEQ ID NO:24-30中的任一者(或SEQ ID NO:24-30中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。优选地，所述融合物的NRG1核酸序列部分编码NRG1的多肽部分，此多肽部分包含来自SEQ ID NO:139-152中的任一者(或SEQ IDNO:139-152中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。

优选地，本公开的任一VAPB-NRG1多肽融合物包括SEQ ID NO:24-30中的任一者的多肽序列，此多肽序列具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变添加、删除或取代SEQ ID NO:24-30的多肽的任一氨基酸。优选地，所述多肽融合物包括SEQ ID NO:24-30中的任一者的多肽序列，此多肽序列具有1、2、3、4或5个点突变添加、删除或取代SEQ IDNO:24-30的多肽的任一氨基酸。更优选地，所述多核苷酸融合物包括SEQ ID NO:24-30中的任一者的多肽序列，此多肽序列具有1、2或3个点突变添加、删除或取代SEQ ID NO:24-30的多肽的任一氨基酸。

在一个优选实施方式中，也提供一种由包含VAPB的外显子1(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该VAPB的外显子1所编码的多肽优选地包含SEQ ID NO:24或SEQ ID NO:24的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ IDNO:140的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:141-151中的任一者或全部，或SEQ ID NO:141-151的任一等位基因变体。SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可根据SEQ ID NO:154或SEQ ID NO:154的等位基因变体，其序列对应于外显子2-13全部所编码的多肽序列。

优选地，该VAPB的外显子1部分所编码的多肽包含来自SEQ ID NO:24或SEQ IDNO:24的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:24有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:140有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一VAPB-NRG1多肽融合物包括如SEQ ID NO:4或其等位基因变体的多肽序列。SEQ ID NO:4含有在VAPB与NRG1之间的融合接点，该融合位于位置14的氨基酸(其与VAPB的茎位置1-13处的氨基酸一起)与位置16的氨基酸(其与NRG1的茎位置17-31处的氨基酸一起)之间。在位置15处，因为NRG1与VAPB出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该VAPB-NRG1多肽融合物包括来自SEQ ID NO:4或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括位置14、15和16的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:4的多肽序列，或是一种包含来自SEQ ID NO:4或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置14、15和16处的氨基酸。所述多肽序列与SEQ ID NO:4有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一VAPB-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:4的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:4的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:4的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:4的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:4的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:4的多肽的任一氨基酸。

优选地，本文所提供的介于NRG1与VAPB之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自VAPB的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有VAPB-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

CADM1-NRG1多肽融合物

也提供一种由包含CADM1的外显子7(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该CADM1的外显子7所编码的多肽优选地包含SEQ ID NO:51或SEQ ID NO:51的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:45-50中的任一者或全部，或是SEQ ID NO:45-50中的任一者的任一等位基因变体，且优选地进一步包括SEQ ID NO:145-151中的任一者，或是SEQ ID NO:145-151中的任一者的任一等位基因变体。SEQ IDNO:45-50分别对应CADM1的外显子1-7所编码的个别多肽序列。SEQ ID NO:145-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成，其序列对应于外显子6-13全部所编码的多肽序列。

优选地，该CADM1的外显子7部分所编码的多肽包含来自SEQ ID NO:51或SEQ IDNO:51的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:51有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:144有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一CADM1-NRG1多肽融合物包括如SEQ ID NO:8或其等位基因变体的多肽序列。SEQ ID NO:8含有在CADM1与NRG1之间的融合接点，该融合位于位置17的氨基酸(其与CADM1的茎位置1-16处的氨基酸一起)与位置19的氨基酸(其与NRG1的茎位置20-28处的氨基酸一起)之间。在位置18处，因为NRG1与CADM1出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该CADM1-NRG1多肽融合物包括来自SEQ ID NO:8或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括其位置17、18和19的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:8的多肽序列，或是一种包含来自SEQ ID NO:8或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置17、18和19处的氨基酸。所述多肽序列与SEQ ID NO:8有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一CADM1-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:8的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:8的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:8的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:8的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:8的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:8的多肽的任一氨基酸。

优选地，本文所提供的介于NRG1与CADM1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自CADM1的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有CADM1-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

CD44-NRG1多肽融合物

也提供一种由包含CD44的外显子5(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该CD44的外显子5所编码的多肽优选地包含SEQ ID NO:84或SEQ ID NO:84的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:80-83中的任一者或全部，或是SEQ ID NO:80-83中的任一者的任一等位基因变体，且优选地进一步包括SEQ ID NO:141-151中的任一者，或是SEQ ID NO:141-151中的任一者的任一等位基因变体。SEQ ID NO:80-83分别对应CD44的外显子1-4所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可由SEQ ID NO:154或SEQID NO:154的等位基因变体所组成，其序列对应于外显子2-13全部所编码的多肽序列。

优选地，该CD44的外显子5部分所编码的多肽包含来自SEQ ID NO:84或SEQ IDNO:84的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:84有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:140有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一CD44-NRG1多肽融合物包括如SEQ ID NO:12或其等位基因变体的多肽序列。SEQ ID NO:12含有在CD44与NRG1之间的融合接点，该融合位于位置17的氨基酸(其与CD44的茎位置1-16处的氨基酸一起)与位置19的氨基酸(其与NRG1的茎位置20-36处的氨基酸一起)之间。在位置18处，因为NRG1与CD44出乎意料产生框内融合而使苏氨酸(T,Thr)残基存在。优选地，该CD44-NRG1多肽融合物包括来自SEQ IDNO:12或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括其位置17、18和19的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:12的多肽序列，或是一种包含来自SEQ ID NO:12或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置17、18和19处的氨基酸。所述多肽序列与SEQ ID NO:12有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一CD44-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:12的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:12的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:12的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:12的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:12的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:12的多肽的任一氨基酸。

优选地，本文所提供的介于NRG1与CD44之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自CD44的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有CD44-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

也提供一种由包含CD44的外显子5(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该CD44的外显子5所编码的多肽优选地包含SEQ ID NO:84或SEQ ID NO:84的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:80-83中的任一者，或是SEQ IDNO:80-83的任一等位基因变体，且优选地进一步包括SEQ ID NO:145-151或SEQ ID NO:145-151的任一等位基因变体。SEQ ID NO:80-83分别对应CD44的外显子1-4所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成，其序列对应于外显子6-13全部所编码的多肽序列。

优选地，该CD44的外显子5部分所编码的多肽包含来自SEQ ID NO:84或SEQ IDNO:84的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:84有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:144有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一CD44-NRG1多肽融合物包括如SEQ ID NO:762或其等位基因变体的多肽序列。SEQ ID NO:762含有在CD44-与NRG1之间的融合接点，该融合位于位置24的氨基酸(其与CD44-的茎位置1-23处的氨基酸一起)与位置26的氨基酸(其与NRG1的茎位置27-49处的氨基酸一起)之间。在位置25处，因为NRG1与CD44-出乎意料产生框内融合而使苏氨酸(T,Thr)残基存在。优选地，该CD44-NRG1多肽融合物包括来自SEQ ID NO:762或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括其位置24、25和26的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:762的多肽序列，或是一种包含来自SEQ ID NO:762或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置24、25和26处的氨基酸。所述多肽序列与SEQ ID NO:762有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一CD44-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:762的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:762的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:762的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:762的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:762的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:762的多肽的任一氨基酸。

优选地，本文所提供的介于CD44与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自CD44的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有CD44-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

SLC3A2-NRG1多肽融合物

也提供一种由包含SLC3A2的转录本6的外显子1(或其等位基因变体)的一部分以及NRG1的外显子5(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。所述SLC3A2外显子1所编码的多肽优选地包含SEQ ID NO:113或SEQ ID NO:113的等位基因变体或是由其组成。该NRG1的外显子5所编码的多肽优选地包含SEQ ID NO:143或SEQ ID NO:143的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:144-151中的任一者，或是SEQ ID NO:144-151中的任一者的任一等位基因变体。SEQ ID NO:144-151分别对应NRG1的外显子6-13所编码的个别多肽序列。所述NRG1的外显子5部分也可由SEQ ID NO:158或SEQ ID NO:158的等位基因变体所组成，其序列对应于外显子6-13全部所编码的多肽序列且包括一个由外显子5的最3’框内的三联体所编码的额外丝氨酸残基。

优选地，该SLC3A2的转录本6的外显子1部分所编码的多肽包含来自SEQ ID NO:113或SEQ ID NO:113的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:113有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在一个优选实施方式中，该SLC3A2-NRG1融合物中的NRG1的外显子5部分至少包含SEQ ID NO:143位置16的氨基酸，或SEQ ID NO:143的等位基因变体的对应氨基酸。该等位基因变体与SEQ ID NO:143有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的SLC3A2-NRG1多肽融合物的任一转录本6包括如SEQ ID NO:16或其等位基因变体的多肽序列。SEQ ID NO:16含有在SLC3A2与NRG1之间的融合接点，该融合位于位置17的氨基酸(其与SLC3A2的茎位置1-16处的氨基酸一起)与位置19的氨基酸(其与NRG1的茎位置20-29处的氨基酸一起)之间。在位置18处，因为NRG1与该SLC3A2转录本出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该SLC3A2-NRG1多肽融合物包括来自SEQ ID NO:16或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括位置17、18和19的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:16的多肽序列，或是一种包含来自SEQ ID NO:16或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置17、18和19处的氨基酸。所述多肽序列与SEQ ID NO:16有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的SLC3A2-NRG1多肽融合物的任一转录本6包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:16的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:16的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:16的多肽序列，且所述点突变添加、删除或取代该包含SEQID NO:16的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQID NO:16的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:16的多肽的任一氨基酸。

优选地，本文所提供的介于NRG1与SLC3A2的转录本6之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自SLC3A2的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有SLC3A2-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

也提供一种由包含SLC3A2的转录本3的外显子2(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。所述SLC3A2外显子2所编码的多肽优选地包含SEQ ID NO:470或SEQ ID NO:470的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:469或145-151中的任一者，或是SEQ ID NO:469或145-151的任一等位基因变体。SEQ ID NO:145-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成，其序列对应于外显子6-13全部所编码的多肽序列。

优选地，该SLC3A2的转录本3的外显子2部分所编码的多肽包含来自SEQ ID NO:470或SEQ ID NO:470的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:470有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。在一个优选实施方式中，该SLC3A2-NRG1融合物中的NRG1的外显子6部分包含或者是根据SEQ ID NO:144或SEQ ID NO:144的等位基因变体的序列。该等位基因变体与SEQ ID NO:144有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的SLC3A2-NRG1多肽融合物的任一转录本3包括如SEQ ID NO:455或其等位基因变体的多肽序列。SEQ ID NO:455含有在SLC3A2与NRG1之间的融合接点，该融合位于位置30的氨基酸(其与SLC3A2的茎位置1-29处的氨基酸一起)与位置32的氨基酸(其与NRG1的茎位置33-39处的氨基酸一起)之间。在位置31处，因为NRG1与该SLC3A2转录本出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该SLC3A2-NRG1多肽融合物包括来自SEQ ID NO:455或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括位置30、31和32的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:455的多肽序列，或是一种包含来自SEQ ID NO:455或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置30、31和32处的氨基酸。所述多肽序列与SEQ ID NO:455有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的SLC3A2-NRG1多肽融合物的任一转录本3包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:455的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:455的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:455的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:455的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:455的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:455的多肽的任一氨基酸。

VTCN1-NRG1多肽融合物

也提供一种由包含VTCN1的外显子2(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该VTCN1的外显子2所编码的多肽优选地包含SEQ ID NO:176或SEQ ID NO:176的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:175或SEQ ID NO:175的等位基因变体，且优选地进一步包括SEQ ID NO:141-151中的任一者，或是SEQ ID NO:141-151中的任一者的任一等位基因变体。SEQ ID NO:175对应VTCN1的外显子1所编码的多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可由SEQ ID NO:154或SEQ ID NO:154的等位基因变体所组成，其序列对应于外显子2-13全部所编码的多肽序列。

优选地，该VTCN1的外显子2部分所编码的多肽包含来自SEQ ID NO:176或SEQ IDNO:176的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:176有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:140有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一VTCN1-NRG1多肽融合物包括如SEQ ID NO:167或其等位基因变体的多肽序列。SEQ ID NO:167含有在VTCN1与NRG1之间的融合接点，该融合位于位置21的氨基酸(其与VTCN1的茎位置1-20处的氨基酸一起)与位置23的氨基酸(其与NRG1的茎位置24-30处的氨基酸一起)之间。在位置22处，因为NRG1与VTCN1出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该VTCN1-NRG1多肽融合物包括来自SEQ ID NO:167或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括其位置21、22和23的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:167的多肽序列，或是一种包含来自SEQ ID NO:167或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置21、22和23处的氨基酸。所述多肽序列与SEQ ID NO:167有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一VTCN1-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:167的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:167的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:167的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:167的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ IDNO:167的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:167的多肽的任一氨基酸。

优选地，本文所提供的介于VTCN1与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自VTCN1的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有VTCN1-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

CDH1-NRG1多肽融合物

也提供一种由包含CDH1的外显子11(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该CDH1的外显子11所编码的多肽优选地包含SEQ ID NO:206或SEQ ID NO:206的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:205或SEQ ID NO:205的等位基因变体，且优选地进一步包括SEQ ID NO:141-151中的任一者，或是SEQ ID NO:141-151中的任一者的任一等位基因变体。SEQ ID NO:205对应CDH1的外显子10所编码的多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可由SEQ ID NO:154或SEQ ID NO:154的等位基因变体所组成，其序列对应于外显子2-13全部所编码的多肽序列。

优选地，该CDH1的外显子11部分所编码的多肽包含来自SEQ ID NO:206或SEQ IDNO:206的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:206有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:140有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一CDH1-NRG1多肽融合物包括如SEQ ID NO:187或其等位基因变体的多肽序列。SEQ ID NO:187含有在CDH1与NRG1之间的融合接点，该融合位于位置39的氨基酸(其与CDH1的茎位置1-38处的氨基酸一起)与位置41的氨基酸(其与NRG1的茎位置42-49处的氨基酸一起)之间。在位置40处，因为NRG1与CDH1出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该CDH1-NRG1多肽融合物包括来自SEQ ID NO:187或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括其位置39、40和41的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:187的多肽序列，或是一种包含来自SEQ ID NO:187或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置39、40和41处的氨基酸。所述多肽序列与SEQ ID NO:187有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一CDH1-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:187的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:187的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:187的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:187的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:187的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:187的多肽的任一氨基酸。

优选地，本文所提供的介于CDH1与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自CDH1的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有CDH1-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

CXADR-NRG1多肽融合物

也提供一种由包含CXADR的外显子1(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该CXADR的外显子1所编码的多肽优选地包含SEQ ID NO:225或SEQ ID NO:225的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:141-151，或SEQ ID NO:141-151的任一等位基因变体。SEQ ID NO:225对应CXADR的外显子1所编码的多肽序列。SEQID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可由SEQ ID NO:154或SEQ ID NO:154的等位基因变体所组成，其序列对应于外显子2-13全部所编码的多肽序列。

优选地，该CXADR的外显子1部分所编码的多肽包含来自SEQ ID NO:225或SEQ IDNO:225的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:225有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:140有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一CXADR-NRG1多肽融合物包括如SEQ ID NO:218或其等位基因变体的多肽序列。SEQ ID NO:218含有在CXADR与NRG1之间的融合接点，该融合位于位置14的氨基酸(其与CXADR的茎位置1-13处的氨基酸一起)与位置16的氨基酸(其与NRG1的茎位置17-33处的氨基酸一起)之间。在位置15处，因为NRG1与CXADR出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该CXADR-NRG1多肽融合物包括来自SEQ ID NO:218或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括其位置14、15和16的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:218的多肽序列，或是一种包含来自SEQ ID NO:218或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置14、15和16处的氨基酸。所述多肽序列与SEQ ID NO:218有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一CXADR-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:218的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:218的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:218的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:218的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ IDNO:218的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:218的多肽的任一氨基酸。

优选地，本文所提供的介于CXADR与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自CXADR的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有CXADR-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

GTF2E2-NRG1多肽融合物

也提供一种由包含GTF2E2的外显子2(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该GTF2E2的外显子2所编码的多肽优选地包含SEQ ID NO:244或SEQ ID NO:244的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:141-151，或SEQ ID NO:141-151的任一等位基因变体。SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可由SEQ ID NO:154或SEQ ID NO:154的等位基因变体所组成，其序列对应于外显子2-13全部所编码的多肽序列。

优选地，该GTF2E2的外显子2部分所编码的多肽包含来自SEQ ID NO:244或SEQ IDNO:244的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:244有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:140有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一GTF2E2-NRG1多肽融合物包括如SEQ ID NO:234或其等位基因变体的多肽序列。SEQ ID NO:234含有在GTF2E2与NRG1之间的融合接点，该融合位于位置46的氨基酸(其与GTF2E2的茎位置1-45处的氨基酸一起)与位置48的氨基酸(其与NRG1的茎位置49-88处的氨基酸一起)之间。在位置47处，因为NRG1与GTF2E2出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该GTF2E2-NRG1多肽融合物包括来自SEQ ID NO:234或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括其位置46、47及48的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:234的多肽序列，或是一种包含来自SEQ ID NO:234或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置46、47及48处的氨基酸。所述多肽序列与SEQ ID NO:234有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一GTF2E2-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:234的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:234的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:234的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:234的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ IDNO:234的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:234的多肽的任一氨基酸。

优选地，本文所提供的介于GTF2E2与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自GTF2E2的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有GTF2E2-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

CSMD1-NRG1多肽融合物

也提供一种由包含CSMD1的外显子23(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该CSMD1的外显子23所编码的多肽优选地包含SEQ ID NO:305或SEQ ID NO:305的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:283-304中的任一者，或SEQ ID NO:283-304的任一等位基因变体，且优选地进一步包括SEQ ID NO:145-151，或SEQID NO:145-151的任一等位基因变体。SEQ ID NO:283-304分别对应CSMD1的外显子1-22所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成，其序列对应于外显子6-13全部所编码的多肽序列。

优选地，该CSMD1的外显子23部分所编码的多肽包含来自SEQ ID NO:305或SEQ IDNO:305的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:305有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:144有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一CSMD1-NRG1多肽融合物包括如SEQ ID NO:256或其等位基因变体的多肽序列。SEQ ID NO:256含有在CSMD1与NRG1之间的融合接点，该融合位于位置29的氨基酸(其与CSMD1的茎位置1-28处的氨基酸一起)与位置31的氨基酸(其与NRG1的茎位置32-50处的氨基酸一起)之间。在位置30处，因为NRG1与CSMD1出乎意料产生框内融合而使苏氨酸(T,Thr)残基存在。优选地，该CSMD1-NRG1多肽融合物包括来自SEQ ID NO:256或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括其位置29、30和31的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:256的多肽序列，或是一种包含来自SEQ ID NO:256或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置29、30和31处的氨基酸。所述多肽序列与SEQ ID NO:256有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一CSMD1-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:256的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:256的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:218的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:256的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ IDNO:256的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:256的多肽的任一氨基酸。

优选地，本文所提供的介于CSMD1与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自CSMD1的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有CSMD1-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

PTN-NRG1多肽融合物

也提供一种由包含PTN的外显子4(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该PTN的外显子4所编码的多肽优选地包含SEQ ID NO:323或SEQ ID NO:323的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:321和/或322或是SEQ IDNO:321和/或322的等位基因变体，且优选地进一步包括SEQ ID NO:141-151，或是SEQ IDNO:141-151的任一等位基因变体。SEQ ID NO:321、322和323分别对应PTN的外显子2、3、4所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可由SEQ ID NO:154或SEQ ID NO:154的等位基因变体所组成，其序列对应于外显子2-13全部所编码的多肽序列。

优选地，该PTN的外显子4部分所编码的多肽包含来自SEQ ID NO:323或SEQ IDNO:323的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:323有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:140有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一PTN-NRG1多肽融合物包括如SEQ ID NO:314或其等位基因变体的多肽序列。SEQ ID NO:314含有在PTN与NRG1之间的融合接点，该融合位于位置33的氨基酸(其与PTN的茎位置1-32处的氨基酸一起)与位置35的氨基酸(其与NRG1的茎位置36-67处的氨基酸一起)之间。在位置34处，因为NRG1与PTN出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该PTN-NRG1多肽融合物包括来自SEQ ID NO:314或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括位置33、34和35的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:314的多肽序列，或是一种包含来自SEQ ID NO:314或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置33、34和35处的氨基酸。所述多肽序列与SEQ ID NO:314有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一PTN-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:314的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:314的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:314的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:314的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:314的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:314的多肽的任一氨基酸。

优选地，本文所提供的介于PTN与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自PTN的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有PTN-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

ST14-NRG1多肽融合物

也提供一种由包含ST14的外显子11(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该ST14的外显子11所编码的多肽优选地包含SEQ ID NO:362或SEQ ID NO:362的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:352-361中的任一者，或是SEQ ID NO:352-361的任一等位基因变体，且优选地进一步包括SEQ ID NO:145-151或SEQ ID NO:145-151的任一等位基因变体。SEQ ID NO:352-361分别对应ST14的外显子1-10所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成，其序列对应于外显子6-13全部所编码的多肽序列。

优选地，该ST14的外显子11部分所编码的多肽包含来自SEQ ID NO:362或SEQ IDNO:362的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:362有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:144有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一ST14-NRG1多肽融合物包括如SEQ ID NO:331或其等位基因变体的多肽序列。SEQ ID NO:331含有在ST14与NRG1之间的融合接点，该融合位于位置31的氨基酸(其与ST14的茎位置1-30处的氨基酸一起)与位置33的氨基酸(其与NRG1的茎位置34-60处的氨基酸一起)之间。在位置32处，因为NRG1与ST14出乎意料产生框内融合而使脯氨酸(P,pro)残基存在。优选地，该ST14-NRG1多肽融合物包括来自SEQ ID NO:331或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括其位置31、32和33的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:331的多肽序列，或是一种包含来自SEQ ID NO:331或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置31、32和33处的氨基酸。所述多肽序列与SEQ ID NO:455有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一ST14-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:331的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:331的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:331的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:331的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:331的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:331的多肽的任一氨基酸。

优选地，本文所提供的介于ST14与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自ST14的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有ST14-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

THBS1-NRG1多肽融合物

也提供一种由包含THBS1的外显子9(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该THBS1的外显子9所编码的多肽优选地包含SEQ ID NO:396或SEQ ID NO:396的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:389-395中的任一者，或是SEQ ID NO:389-395的任一等位基因变体，且优选地进一步包括SEQ ID NO:145-151或SEQ ID NO:145-151的任一等位基因变体。SEQ ID NO:389-395分别对应THBS1的外显子2-8所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成，其序列对应于外显子6-13全部所编码的多肽序列。

优选地，该THBS1的外显子9部分所编码的多肽包含来自SEQ ID NO:396或SEQ IDNO:396的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:396有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:144有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一THBS1-NRG1多肽融合物包括如SEQ ID NO:377或其等位基因变体的多肽序列。SEQ ID NO:377含有在THBS1与NRG1之间的融合接点，该融合位于位置18的氨基酸(其与THBS1的茎位置1-16处的氨基酸一起)与位置20的氨基酸(其与NRG1的茎位置20-48处的氨基酸一起)之间。在位置19处，因为NRG1与THBS1出乎意料产生框内融合而使苏氨酸(T,Thr)残基存在。优选地，该THBS1-NRG1多肽融合物包括来自SEQ ID NO:377或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括其位置18、19和20的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:377的多肽序列，或是一种包含来自SEQ ID NO:377或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置18、19和20处的氨基酸。所述多肽序列与SEQ ID NO:377有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一THBS1-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:377的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:377的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:377的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:377的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ IDNO:377的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:377的多肽的任一氨基酸。

优选地，本文所提供的介于THBS1与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自THBS1的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有THBS1-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

AGRN-NRG1多肽融合物

也提供一种由包含AGRN的外显子12(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该AGRN的外显子12所编码的多肽优选地包含SEQ ID NO:430或SEQ ID NO:430的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:419-429中的任一者，或是SEQ ID NO:419-429的任一等位基因变体，且优选地进一步包括SEQ ID NO:145-151或SEQ ID NO:145-151的任一等位基因变体。SEQ ID NO:419-429分别对应AGRN的外显子1-11所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成，其序列对应于外显子6-13全部所编码的多肽序列。

优选地，该AGRN的外显子12部分所编码的多肽包含来自SEQ ID NO:430或SEQ IDNO:430的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:430有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:144有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一AGRN-NRG1多肽融合物包括如SEQ ID NO:404或其等位基因变体的多肽序列。SEQ ID NO:404含有在AGRN与NRG1之间的融合接点，该融合位于位置35的氨基酸(其与AGRN的茎位置1-34处的氨基酸一起)与位置37的氨基酸(其与NRG1的茎位置38-69处的氨基酸一起)之间。在位置36处，因为NRG1与AGRN出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该AGRN-NRG1多肽融合物包括来自SEQ ID NO:404或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括其位置35、36和37的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:404的多肽序列，或是一种包含来自SEQ ID NO:404或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置35、36和37处的氨基酸。所述多肽序列与SEQ ID NO:404有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一AGRN-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:404的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:404的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:404的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:404的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:404的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:404的多肽的任一氨基酸。

优选地，本文所提供的介于AGRN与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自AGRN的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有AGRN-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

PVALB-NRG1多肽融合物

根据本公开，也提供一种由包含PVALB核酸序列(或PVALB核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸所编码的多肽融合物。该PVALB核酸序列(或其一部分)优选地编码包含SEQ ID NO:445-449中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。该NRG1核酸序列(或其一部分)优选地编码包含SEQ ID NO:139-152中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。

SEQ ID NO:445-449中的任一者的PVALB等位基因变体优选地与其具有至少85％的序列一致性，更优选地与其具有90％、92％、94％、96％或甚至更优选地至少98％的序列一致性。SEQ ID NO:139-152中的任一者的NRG1等位基因变体优选地与其具有至少85％的序列一致性，更优选地与其具有90％、92％、94％、96％或甚至更优选地至少98％的序列一致性。

优选地，所述融合物的PVALB核酸序列部分编码PVALB的多肽部分，此多肽部分包含来自SEQ ID NO:445-449中的任一者(或SEQ ID NO:445-449中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。优选地，所述融合物的NRG1核酸序列部分编码NRG1的多肽部分，此多肽部分包含来自SEQ ID NO:139-152中的任一者(或SEQ ID NO:139-152中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。

优选地，本公开的任一PVALB-NRG1多肽融合物包括SEQ ID NO:445-449中的任一者的多肽序列，此多肽序列具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变添加、删除或取代SEQ ID NO:445-449的多肽的任一氨基酸。优选地，所述多肽融合物包括SEQ IDNO:445-449中的任一者的多肽序列，此多肽序列具有1、2、3、4或5个点突变添加、删除或取代SEQ ID NO:445-449的多肽的任一氨基酸。更优选地，所述多核苷酸融合物包括SEQ IDNO:445-449中的任一者的多肽序列，此多肽序列具有1、2或3个点突变添加、删除或取代SEQID NO:445-449的多肽的任一氨基酸。

在一个优选实施方式中，也提供一种由包含PVALB的外显子4(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该PVALB的外显子4所编码的多肽优选地包含SEQ ID NO:447或SEQ ID NO:447的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ IDNO:144的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:445及446中的任一者，以及SEQ ID NO:141-151中的任一者，或SEQ ID NO:141-151的任一等位基因变体。SEQ ID NO:145-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可根据SEQ ID NO:156或SEQ ID NO:156的等位基因变体，其序列对应于外显子6-13全部所编码的多肽序列。

优选地，该PVALB的外显子4部分所编码的多肽包含来自SEQ ID NO:447或SEQ IDNO:447的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:447有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:144有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一PVALB-NRG1多肽融合物包括如SEQ ID NO:438或其等位基因变体的多肽序列。SEQ ID NO:438含有在PVALB与NRG1之间的融合接点，该融合位于位置33的氨基酸(其与PVALB的茎位置1-32处的氨基酸一起)与位置35的氨基酸(其与NRG1的茎位置36-75处的氨基酸一起)之间。在位置34处，因为NRG1与PVALB出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该PVALB-NRG1多肽融合物包括来自SEQ ID NO:438或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括位置33、34和35的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:438的多肽序列，或是一种包含来自SEQ ID NO:438或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置33、34和35处的氨基酸。所述多肽序列与SEQ ID NO:438有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一PVALB-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:438的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:438的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:438的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:438的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ IDNO:438的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:438的多肽的任一氨基酸。

优选地，本文所提供的介于NRG1与PVALB之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自PVALB的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有PVALB-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

APP-NRG1多肽融合物

也提供一种由包含APP的外显子14(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该APP的外显子14所编码的多肽优选地包含SEQ ID NO:519或SEQ ID NO:519的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:506-518中的任一者，或是SEQ ID NO:506-518的任一等位基因变体，且优选地进一步包括SEQ ID NO:145-151或SEQID NO:145-151的任一等位基因变体。SEQ ID NO:506-518分别对应APP的外显子1-3所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成，其序列对应于外显子6-13全部所编码的多肽序列。

优选地，该APP的外显子14部分所编码的多肽包含来自SEQ ID NO:519或SEQ IDNO:519的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:519有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:144有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一APP-NRG1多肽融合物包括如SEQ ID NO:487或其等位基因变体的多肽序列。SEQ ID NO:487含有在APP与NRG1之间的融合接点，该融合位于位置17的氨基酸(其与APP的茎位置1-16处的氨基酸一起)与位置19的氨基酸(其与NRG1的茎位置20-46处的氨基酸一起)之间。在位置18处，因为NRG1与APP出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该APP-NRG1多肽融合物包括来自SEQ ID NO:487或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括其位置17、18和19的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:487的多肽序列，或是一种包含来自SEQ ID NO:487或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置17、18和19处的氨基酸。所述多肽序列与SEQ ID NO:487有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一APP-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:487的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:487的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:487的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:487的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:487的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:487的多肽的任一氨基酸。

优选地，本文所提供的介于APP与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自APP的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有APP-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

WRN-NRG1多肽融合物

也提供一种由包含WRN的外显子33(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该WRN的外显子33所编码的多肽优选地包含SEQ ID NO:597或SEQ ID NO:597的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:566-596中的任一者，或是SEQ ID NO:566-596的任一等位基因变体，且优选地进一步包括SEQ ID NO:145-151或SEQID NO:145-151的任一等位基因变体。SEQ ID NO:566-596对应WRN的外显子2-32所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成，其序列对应于外显子6-13全部所编码的多肽序列。

优选地，该WRN的外显子33部分所编码的多肽包含来自SEQ ID NO:597或SEQ IDNO:597的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:597有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:144有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一WRN-NRG1多肽融合物包括如SEQ ID NO:528或其等位基因变体的多肽序列。SEQ ID NO:528含有在WRN与NRG1之间的融合接点，该融合位于位置31的氨基酸(其与WRN的茎位置1-30处的氨基酸一起)与位置33的氨基酸(其与NRG1的茎位置34-60处的氨基酸一起)之间。在位置32处，因为NRG1与WRN出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该WRN-NRG1多肽融合物包括来自SEQ ID NO:528或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括其位置31、32和33的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:528的多肽序列，或是一种包含来自SEQ ID NO:528或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置31、32和33处的氨基酸。所述多肽序列与SEQ ID NO:528有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一WRN-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:528的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:528的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:528的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:528的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:528的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:528的多肽的任一氨基酸。

优选地，本文所提供的介于WRN与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自WRN的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有WRN-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

ASPH-NRG1多肽融合物

根据本公开，也提供一种由包含ASPH核酸序列(或ASPH核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸所编码的多肽融合物。该ASPH核酸序列(或其一部分)优选地编码包含SEQ ID NO:663-688中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。该NRG1核酸序列(或其一部分)优选地编码包含SEQ ID NO:139-152中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。

SEQ ID NO:663-688中的任一者的ASPH等位基因变体优选地与其具有至少85％的序列一致性，更优选地与其具有90％、92％、94％、96％或甚至更优选地至少98％的序列一致性。SEQ ID NO:139-152中的任一者的NRG1等位基因变体优选地与其具有至少85％的序列一致性，更优选地与其具有90％、92％、94％、96％或甚至更优选地至少98％的序列一致性。

优选地，所述融合物的ASPH核酸序列部分编码ASPH的多肽部分，此多肽部分包含来自SEQ ID NO:663-688中的任一者(或SEQ ID NO:663-688中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。优选地，所述融合物的NRG1核酸序列部分编码NRG1的多肽部分，此多肽部分包含来自SEQ ID NO:139-152中的任一者(或SEQID NO:139-152中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。

优选地，本公开的任一ASPH-NRG1多肽融合物包括SEQ ID NO:663-688中的任一者的多肽序列，此多肽序列具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变添加、删除或取代SEQ ID NO:663-688的多肽的任一氨基酸。优选地，所述多肽融合物包括SEQ ID NO:663-688中的任一者的多肽序列，此多肽序列具有1、2、3、4或5个点突变添加、删除或取代SEQ ID NO:663-688的多肽的任一氨基酸。更优选地，所述多核苷酸融合物包括SEQ ID NO:663-688中的任一者的多肽序列，此多肽序列具有1、2或3个点突变添加、删除或取代SEQ IDNO:663-688的多肽的任一氨基酸。

在一个优选实施方式中，也提供一种由包含ASPH的外显子22(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该ASPH的外显子22所编码的多肽优选地包含SEQ ID NO:684或SEQ ID NO:684的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ IDNO:140的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:663-683中的任一者以及SEQ ID NO:141-151中的任一者，或是SEQ ID NO:663-683或SEQID NO:141-151的任一等位基因变体。SEQ ID NO:663-683分别对应ASPH的外显子1-21所编码的个别多肽序列，而SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可根据SEQ ID NO:154或SEQ ID NO:154的等位基因变体，其序列对应于外显子3-13全部所编码的多肽序列。

优选地，该ASPH的外显子22部分所编码的多肽包含来自SEQ ID NO:684或SEQ IDNO:684的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:684有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:140有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一ASPH-NRG1多肽融合物包括如SEQ ID NO:636或其等位基因变体的多肽序列。SEQ ID NO:636含有在ASPH与NRG1之间的融合接点，该融合位于位置24的氨基酸(其与ASPH的茎位置1-23处的氨基酸一起)与位置26的氨基酸(其与NRG1的茎位置27-49处的氨基酸一起)之间。在位置25处，因为NRG1与ASPH出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该ASPH-NRG1多肽融合物包括来自SEQ ID NO:636或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括位置24、25和26的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:636的多肽序列，或是一种包含来自SEQ ID NO:636或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置24、25和26处的氨基酸。所述多肽序列与SEQ ID NO:636有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一ASPH-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:636的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:636的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:636的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:636的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:636的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:636的多肽的任一氨基酸。

优选地，本文所提供的介于NRG1与ASPH之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自ASPH的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有ASPH-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

NOTCH2-NRG1多肽融合物

也提供一种由包含NOTCH2的外显子6(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该NOTCH2的外显子6所编码的多肽优选地包含SEQ ID NO:709或SEQ ID NO:709的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:704-708中的任一者，或是SEQ ID NO:704-708的任一等位基因变体，且优选地进一步包括SEQ ID NO:145-151或SEQ ID NO:145-151的任一等位基因变体。SEQ ID NO:566-596对应NOTCH2的外显子1-5所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成，其序列对应于外显子6-13全部所编码的多肽序列。

优选地，该NOTCH2的外显子6部分所编码的多肽包含来自SEQ ID NO:709或SEQ IDNO:709的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:709有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:144有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一NOTCH2-NRG1多肽融合物包括如SEQ ID NO:694或其等位基因变体的多肽序列。SEQ ID NO:694含有在NOTCH2与NRG1之间的融合接点，该融合位于位置24的氨基酸(其与NOTCH2的茎位置1-23处的氨基酸一起)与位置26的氨基酸(其与NRG1的茎位置27-49处的氨基酸一起)之间。在位置25处，因为NRG1与NOTCH2出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该NOTCH2-NRG1多肽融合物包括来自SEQ ID NO:694或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括其位置24、25和26的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:694的多肽序列，或是一种包含来自SEQ ID NO:694或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置24、25和26处的氨基酸。所述多肽序列与SEQ ID NO:694有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一NOTCH2-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:694的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:694的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:694的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:694的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ IDNO:694的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:694的多肽的任一氨基酸。

优选地，本文所提供的介于NOTCH2与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自NOTCH2的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有NOTCH2-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

CD74-NRG1多肽融合物

也提供一种由包含CD74的外显子2(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该CD74的外显子2所编码的多肽优选地包含SEQ ID NO:730或SEQ ID NO:730的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:729或SEQ ID NO:141-151中的任一者，或是SEQ ID NO:729或SEQ ID NO:141-151的任一等位基因变体。SEQ ID NO:729对应CD74的外显子1所编码的多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可由SEQ ID NO:154或SEQ ID NO:154的等位基因变体所组成，其序列对应于外显子2-13全部所编码的多肽序列。

优选地，该CD74的外显子2部分所编码的多肽包含来自SEQ ID NO:730或SEQ IDNO:730的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:730有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:140有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一CD74-NRG1多肽融合物包括如SEQ ID NO:718或其等位基因变体的多肽序列。SEQ ID NO:718含有在CD74与NRG1之间的融合接点，该融合位于位置24的氨基酸(其与CD74的茎位置1-23处的氨基酸一起)与位置26的氨基酸(其与NRG1的茎位置27-49处的氨基酸一起)之间。在位置25处，因为NRG1与CD74出乎意料产生框内融合而使脯氨酸(P,pro)残基存在。优选地，该CD74-NRG1多肽融合物包括来自SEQ ID NO:718或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括其位置24、25和26的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:718的多肽序列，或是一种包含来自SEQ ID NO:718或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置24、25和26处的氨基酸。所述多肽序列与SEQ ID NO:718有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一CD74-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:718的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:718的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:718的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:718的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:718的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:718的多肽的任一氨基酸。

优选地，本文所提供的介于CD74与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自CD74的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有CD74-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

SDC4-NRG1多肽融合物

也提供一种由包含SDC4的外显子2(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该SDC4的外显子2所编码的多肽优选地包含SEQ ID NO:752或SEQ ID NO:752的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:751或SEQ ID NO:141-151中的任一者，或是SEQ ID NO:751或SEQ ID NO:141-151的任一等位基因变体。SEQ ID NO:751对应SDC4的外显子1所编码的多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可由SEQ ID NO:154或SEQ ID NO:154的等位基因变体所组成，其序列对应于外显子2-13全部所编码的多肽序列。

优选地，该SDC4的外显子2部分所编码的多肽包含来自SEQ ID NO:752或SEQ IDNO:752的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:752有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:140有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一SDC4-NRG1多肽融合物包括如SEQ ID NO:744或其等位基因变体的多肽序列。SEQ ID NO:744含有在SDC4与NRG1之间的融合接点，该融合位于位置24的氨基酸(其与SDC4的茎位置1-23处的氨基酸一起)与位置26的氨基酸(其与NRG1的茎位置27-49处的氨基酸一起)之间。在位置25处，因为NRG1与SDC4出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该SDC4-NRG1多肽融合物包括来自SEQ ID NO:744或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括其位置24、25和26的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:744的多肽序列，或是一种包含来自SEQ ID NO:744或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置24、25和26处的氨基酸。所述多肽序列与SEQ ID NO:744有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一SDC4-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:744的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:744的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:744的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:744的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:744的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:744的多肽的任一氨基酸。

优选地，本文所提供的介于SDC4与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自SDC4的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有SDC4-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

也提供一种由包含SDC4的外显子4(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该SDC4的外显子4所编码的多肽优选地包含SEQ ID NO:754或SEQ ID NO:754的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:751-753或SEQ ID NO:141-151中的任一者，或是SEQ ID NO:751-753或SEQ ID NO:141-151的任一等位基因变体。SEQID NO:751-753对应SDC4的外显子1-3所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可由SEQ ID NO:154或SEQ ID NO:154的等位基因变体所组成，其序列对应于外显子2-13全部所编码的多肽序列。

优选地，该SDC4的外显子4部分所编码的多肽包含来自SEQ ID NO:754或SEQ IDNO:754的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:754有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:140有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一SDC4-NRG1多肽融合物包括如SEQ ID NO:825或其等位基因变体的多肽序列。SEQ ID NO:825含有在SDC4与NRG1之间的融合接点，该融合位于位置24的氨基酸(其与SDC4的茎位置1-23处的氨基酸一起)与位置26的氨基酸(其与NRG1的茎位置27-49处的氨基酸一起)之间。在位置25处，因为NRG1与SDC4出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该SDC4-NRG1多肽融合物包括来自SEQ ID NO:825或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括其位置24、25和26的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:825的多肽序列，或是一种包含来自SEQ ID NO:825或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置24、25和26处的氨基酸。所述多肽序列与SEQ ID NO:825有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一SDC4-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:825的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:825的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:825的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:825的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:825的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:825的多肽的任一氨基酸。

SLC4A4-NRG1多肽融合物

也提供一种由包含SLC4A4的外显子14(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该SLC4A4的外显子14所编码的多肽优选地包含SEQ ID NO:806或SEQ ID NO:806的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:794-805中的任一者或SEQ ID NO:794-805的任一等位基因变体，且优选地进一步包括SEQ ID NO:145-151或SEQ ID NO:145-151的任一等位基因变体。SEQ ID NO:794-805对应SLC4A4的外显子2-13所编码的个别多肽序列。SEQ ID NO:145-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成，其序列对应于外显子6-13全部所编码的多肽序列。

优选地，该SLC4A4的外显子14部分所编码的多肽包含来自SEQ ID NO:806或SEQID NO:806的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:806有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:144有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一SLC4A4-NRG1多肽融合物包括如SEQ ID NO:766或其等位基因变体的多肽序列。SEQ ID NO:766含有在SLC4A4与NRG1之间的融合接点，该融合位于位置24的氨基酸(其与SLC4A4的茎位置1-23处的氨基酸一起)与位置26的氨基酸(其与NRG1的茎位置27-49处的氨基酸一起)之间。在位置25处，因为NRG1与SLC4A4出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该SLC4A4-NRG1多肽融合物包括来自SEQ ID NO:766或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括其位置24、25和26的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:766的多肽序列，或是一种包含来自SEQ ID NO:766或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置24、25和26处的氨基酸。所述多肽序列与SEQ ID NO:766有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一SLC4A4-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:766的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:766的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:766的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:766的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ IDNO:766的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:766的多肽的任一氨基酸。

优选地，本文所提供的介于SLC4A4与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自SLC4A4的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有SLC4A4-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

ZFAT-NRG1多肽融合物

根据本公开，也提供一种由包含ZFAT核酸序列(或ZFAT核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸所编码的多肽融合物。该ZFAT核酸序列(或其一部分)优选地编码包含SEQ ID NO:847-863中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。该NRG1核酸序列(或其一部分)优选地编码包含SEQ ID NO:139-152中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。

SEQ ID NO:847-863中的任一者的ZFAT等位基因变体优选地与其具有至少85％的序列一致性，更优选地与其具有90％、92％、94％、96％或甚至更优选地至少98％的序列一致性。SEQ ID NO:139-152中的任一者的NRG1等位基因变体优选地与其具有至少85％的序列一致性，更优选地与其具有90％、92％、94％、96％或甚至更优选地至少98％的序列一致性。

优选地，所述融合物的ZFAT核酸序列部分编码ZFAT的多肽部分，此多肽部分包含来自SEQ ID NO:847-863中的任一者(或SEQ ID NO:847-863中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。优选地，所述融合物的NRG1核酸序列部分编码NRG1的多肽部分，此多肽部分包含来自SEQ ID NO:139-152中的任一者(或SEQID NO:139-152中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。

优选地，本公开的任一ZFAT-NRG1多肽融合物包括SEQ ID NO:847-863中的任一者的多肽序列，此多肽序列具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变添加、删除或取代SEQ ID NO:847-863的多肽的任一氨基酸。优选地，所述多肽融合物包括SEQ ID NO:847-863中的任一者的多肽序列，此多肽序列具有1、2、3、4或5个点突变添加、删除或取代SEQ ID NO:847-863的多肽的任一氨基酸。更优选地，所述多核苷酸融合物包括SEQ ID NO:847-863中的任一者的多肽序列，此多肽序列具有1、2或3个点突变添加、删除或取代SEQ IDNO:847-863的多肽的任一氨基酸。

在一个优选实施方式中，也提供一种由包含ZFAT的外显子12(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该ZFAT的外显子12所编码的多肽优选地包含SEQ ID NO:858或SEQ ID NO:858的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ IDNO:144的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:847-857中的任一者以及SEQ ID NO:145-151中的任一者，或是SEQ ID NO:847-857或SEQID NO:145-151的任一等位基因变体。SEQ ID NO:847-857分别对应ZFAT的外显子1-11所编码的个别多肽序列，而SEQ ID NO:145-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可根据SEQ ID NO:156或SEQ ID NO:156的等位基因变体，其序列对应于外显子6-13全部所编码的多肽序列。

优选地，该ZFAT的外显子12部分所编码的多肽包含来自SEQ ID NO:858或SEQ IDNO:858的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:858有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:144有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一ZFAT-NRG1多肽融合物包括如SEQ ID NO:829或其等位基因变体的多肽序列。SEQ ID NO:829含有在ZFAT与NRG1之间的融合接点，该融合位于位置24的氨基酸(其与ZFAT的茎位置1-23处的氨基酸一起)与位置26的氨基酸(其与NRG1的茎位置27-49处的氨基酸一起)之间。在位置25处，因为NRG1与ZFAT出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该ZFAT-NRG1多肽融合物包括来自SEQ ID NO:829或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括位置24、25和26的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:829的多肽序列，或是一种包含来自SEQ ID NO:829或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置24、25和26处的氨基酸。所述多肽序列与SEQ ID NO:829有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一ZFAT-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:829的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:829的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:829的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:829的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:829的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:829的多肽的任一氨基酸。

优选地，本文所提供的介于NRG1与ZFAT之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自ZFAT的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有ZFAT-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

DSCAML1-NRG1多肽融合物

根据本公开，也提供一种由包含DSCAML1核酸序列(或DSCAML1核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸所编码的多肽融合物。该DSCAML1核酸序列(或其一部分)优选地编码包含SEQ ID NO:904-937中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。该NRG1核酸序列(或其一部分)优选地编码包含SEQ ID NO:139-152中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。

SEQ ID NO:904-937中的任一者的DSCAML1等位基因变体优选地与其具有至少85％的序列一致性，更优选地与其具有90％、92％、94％、96％或甚至更优选地至少98％的序列一致性。SEQ ID NO:139-152中的任一者的NRG1等位基因变体优选地与其具有至少85％的序列一致性，更优选地与其具有90％、92％、94％、96％或甚至更优选地至少98％的序列一致性。

优选地，所述融合物的DSCAML1核酸序列部分编码DSCAML1的多肽部分，此多肽部分包含来自SEQ ID NO:904-937中的任一者(或SEQ ID NO:904-937中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。优选地，所述融合物的NRG1核酸序列部分编码NRG1的多肽部分，此多肽部分包含来自SEQ ID NO:139-152中的任一者(或SEQ ID NO:139-152中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。

优选地，本公开的任一DSCAML1-NRG1多肽融合物包括SEQ ID NO:904-937中的任一者的多肽序列，此多肽序列具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变添加、删除或取代SEQ ID NO:904-937的多肽的任一氨基酸。优选地，所述多肽融合物包括SEQ IDNO:904-937中的任一者的多肽序列，此多肽序列具有1、2、3、4或5个点突变添加、删除或取代SEQ ID NO:904-937的多肽的任一氨基酸。更优选地，所述多核苷酸融合物包括SEQ IDNO:904-937中的任一者的多肽序列，此多肽序列具有1、2或3个点突变添加、删除或取代SEQID NO:904-937的多肽的任一氨基酸。

在一个优选实施方式中，也提供一种由包含DSCAML1的外显子3(或其等位基因变体)的一部分以及NRG1或其的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该DSCAML1的外显子3所编码的多肽优选地包含SEQ ID NO:906或SEQ ID NO:906的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地，所述多肽融合物进一步包括SEQ ID NO:904-905中的任一者以及SEQ ID NO:141-151中的任一者，或是SEQ ID NO:904-905或SEQ ID NO:141-151的任一等位基因变体。SEQ ID NO:904-905分别对应DSCAML1的外显子1-2所编码的个别多肽序列，而SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可根据SEQ ID NO:154或SEQ ID NO:154的等位基因变体，其序列对应于外显子2-13全部所编码的多肽序列。

优选地，该DSCAML1的外显子3部分所编码的多肽包含来自SEQ ID NO:906或SEQID NO:906的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:906有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。此外，该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸，或是由其组成。该等位基因变体与SEQ ID NO:140有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一DSCAML1-NRG1多肽融合物包括如SEQ ID NO:869或其等位基因变体的多肽序列。SEQ ID NO:869含有在DSCAML1与NRG1之间的融合接点，该融合位于位置24的氨基酸(其与DSCAML1的茎位置1-23处的氨基酸一起)与位置26的氨基酸(其与NRG1的茎位置27-49处的氨基酸一起)之间。在位置25处，因为NRG1与DSCAML1出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地，该DSCAML1-NRG1多肽融合物包括来自SEQID NO:869或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸，至少包括位置24、25和26的氨基酸。

在一个优选实施方式中，其提供了一种根据SEQ ID NO:869的多肽序列，或是一种包含来自SEQ ID NO:869或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽，至少包括位置24、25和26处的氨基酸。所述多肽序列与SEQ ID NO:869有至少85％的一致性，优选地与其至少90％的一致性，92％、94％、96％或更优选地至少98％的序列一致性。

优选地，本公开的任一DSCAML1-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:869的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:869的多肽的任一氨基酸。优选地，所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:869的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:869的多肽的任一氨基酸。更优选地，所述多肽融合物包括具有1、2或3个点突变的SEQ IDNO:869的多肽序列，且所述点突变添加、删除或取代该包含SEQ ID NO:869的多肽的任一氨基酸。

优选地，本文所提供的介于NRG1与DSCAML1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自DSCAML1的多肽序列，而跨越该融合接点至C端的部分为NRG1多肽序列。优选地，该NRG1多肽序列包含或编码EGF样结构域。所述含有DSCAML1-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。

本文所提及的每个包含NRG1的多核苷酸融合物，包括VAPB-NRG1,CADM1-NRG1,CD44-NRG1,SLC3A2-NRG1,VTCN1-NRG1,CDH1-NRG1,CXADR-NRG1,GTF2E2-NRG1,CSMD1-NRG1,PTN-NRG1,ST14-NRG1,THBS1-NRG1,AGRN-NRG1,PVALB-NRG1,APP-NRG1,WRN-NRG1,DAAM1-NRG1,ASPH-NRG1,NOTCH2-NRG1,CD74-NRG1,SDC4-NRG1,SLC4A4-NRG1,ZFAT-NRG1和DSCAML1-NRG1，优选地被分离出来。本发明的任一方法优选地包含从样本分离出一种或多种含有多肽的组分。该一种或多种含有多肽的组分通常从样本中的任一细胞或细胞材料中分离出来。

用于检测或鉴定NRG1融合物的测定法

一般来说，待检测的任一多核苷酸或多肽融合物获自或衍生自表达包含NRG1的EGF样结构域的多核苷酸融合物的异常细胞。检测测定法可以不是针对鉴定EGF样结构域是否存在，因为其只需仅检测实际的融合接点以指示出进一步含有NRG1的EGF样结构域的多核苷酸或多肽的存在即可。EGF样结构域的存在可以从特异性地检测或鉴定NRG1与任一融合配偶体之间为框内的多核苷酸融合而推断出，这样的融合接合会在NRG1的EGF样结构域的5’处发现。

技术人员可采用多种不同技术来检测获自人类受试者样本中的已知多核苷酸或多肽融合物，其各自通常包括会与感兴趣的目标特异性地结合的结合剂。这类结合剂是指一种可选择性地与目标序列结合以达到特异性地检测该目标的试剂，诸如引物、引物对、探针或抗体。所述结合包括与多核苷酸序列杂交或退火，通常是为了扩增和/或检测该目标，或通过具高亲合性和特异性的抗体结合表位以致使目标的检测。

基于特异性地与多核苷酸融合物结合的引物、引物对或探针的使用的技术在本领域中是众所周知的。同样地，基于结合剂来检测多肽的技术在本领域中是众所周知的，特别是可以使用特异性地结合多肽的多肽。

其他使用本公开的引物、引物对或探针的方式包括下一代测序(NGS)，或是使用包含多重免疫检测技术的套组(例如利用Anchored Multiplex PCR(AMP^TM)技术靶向已知外显子的Archer FusionPlex^TMCustom Solid Panel)来检测融合物，或例如使用QX200^TMAutoDG^TM微滴式数字PCR系统(由BioRad提供)的微滴式数字PCR(ddPCR^TM)。其他手段包括使用分子信标或是使用TaqMan^TM探针或嵌合型荧光染料(诸如SYBR^TMGreen)的定量PCR(Q-PCR)、荧光原位杂交(FISH)、下一代测序(NGS)、ddPCR^TM、Anchored Multiplex PCR、半定量PCR或定量PCR。

还有其他使用本公开的探针来检测本文所提及的NRG1与融合配偶体的多核苷酸融合物的方法，如IHC或FISH(诸如断裂分离FISH)，其中感兴趣的基因的两端以不同颜色标记。为检测包含本文所提及融合物的NRG1，使用正链hg38 chr8:31,639,222-32,764,405来设计适宜探针以标记NRG1基因的两端以致使任何融合物的检测。

本公开提供一种用于检测本文所提及的多核苷酸融合物的核酸探针、引物或引物对。也提供一种包含所述核酸探针、引物或引物对以用于检测本文所提及的多核苷酸融合物的存在的检测测定法。这类核酸探针、引物或引物对的长度使其可检测感兴趣的多核苷酸，但优选的长度为约10至约40个核苷酸。

优选地，用于检测多核苷酸融合物的任一核酸探针、引物或引物对包括本文所述的可检测标记。

优选地，于检测选自VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、DAAM1-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1或DSCAML1-NRG1的多核苷酸融合物是否存在的测定法中使用任一核酸探针、引物或引物对，特别是检测本文所公开的该等多核苷酸融合物中的融合接点是否存在的测定法。

优选地，通过使用所述跨越NRG1与其融合配偶体之间的核酸接点的探针、引物或引物对致使该融合接合物的扩增和检测，以检测本文所提及的任一多核苷酸融合物是否存在。

用于检测VAPB-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含VAPB核酸序列(或VAPB核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部份)融合的多核苷酸融合物的核酸引物、引物对或探针。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:23的多核苷酸(或SEQ IDNO:23的等位基因变体)和根据SEQ ID NO:138的多核苷酸(或SEQ ID NO:138的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸。

此外，本公开提供一种用于检测包含SEQ ID NO:3或由其组成的VAPB-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置43和44的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:3的多核苷酸(或SEQ ID NO:3的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸，且该序列优选地包括位置43和44的核酸。

优选地，该用于检测VAPB与NRG1的融合物的核酸探针、引物或引物对特异性地与由VAPB的外显子1组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子1的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测VAPB与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:17组成的序列(或SEQ ID NO:17的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自VAPB的外显子1包含SEQ ID NO:17或其等位基因变体，或是由其组成。

用于检测CADM1-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:7或由其组成的CADM1-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置53和54的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:7的多核苷酸(或SEQ ID NO:7的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置53和54的核酸。

优选地，该用于检测CADM1与NRG1的融合物的核酸探针、引物或引物对特异性地与由CADM1的外显子7组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子7的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测CADM1与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:57组成的序列(或SEQ ID NO:57的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自CADM1的外显子7包含SEQ ID NO:39或其等位基因变体，或是由其组成。

用于检测CD44-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:11或由其组成的CD44-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置52和53的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:11的多核苷酸(或SEQ ID NO:11的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置52和53的核酸。

优选地，该用于检测CD44与NRG1的融合物的核酸探针、引物或引物对特异性地与由CD44的外显子5组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子5的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测CD44与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:99组成的序列(或SEQ ID NO:99的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自CD44的外显子5包含SEQ ID NO:65或其等位基因变体，或是由其组成。

本公开提供一种用于检测包含SEQ ID NO:761或由其组成的CD44-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置75和76的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:761的多核苷酸(或SEQ ID NO:761的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置75和76的核酸。

优选地，该用于检测CD44与NRG1的融合物的核酸探针、引物或引物对特异性地与由CD44的外显子5组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子5的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测CD44与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:99组成的序列(或SEQ ID NO:99的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

用于检测SLC3A2-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:15或由其组成的SLC3A2转录本6-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置53和54的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:15的多核苷酸(或SEQ ID NO:15的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置53和54的核酸。

优选地，该用于检测SLC3A2转录本6与NRG1的融合物的核酸探针、引物或引物对特异性地与由所述SLC3A2的外显子1组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子1的5’处的序列和/或由NRG1的外显子5组成的序列、或位于外显子5的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测所述SLC3A2与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:103组成的序列(或SEQ IDNO:103的等位基因变体)、和/或SEQ ID NO:157组成的序列(或SEQ ID NO:157的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自SLC3A2转录本6的外显子1包含SEQ ID NO:103或其等位基因变体，或是由其组成。

本公开提供一种用于检测包含SEQ ID NO:454或由其组成的SLC3A2转录本6-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置93和94的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:454的多核苷酸(或SEQ ID NO:454的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置93和94的核酸。

优选地，该用于检测SLC3A2转录本3与NRG1的融合物的核酸探针、引物或引物对特异性地与由所述SLC3A2的外显子2组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子2的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测所述SLC3A2与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:482组成的序列(或SEQ IDNO:482的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自SLC3A2转录本3的外显子2包含SEQ ID NO:457或其等位基因变体，或是由其组成。

用于检测VTCN1-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:166或由其组成的VTCN1-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置65和66的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:166的多核苷酸(或SEQ ID NO:166的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置65和66的核酸。

优选地，该用于检测VTCN1与NRG1的融合物的核酸探针、引物或引物对特异性地与由VTCN1的外显子2组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子2的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测VTCN1与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:181组成的序列(或SEQ ID NO:181的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自VTCN1的外显子2包含SEQ ID NO:169或其等位基因变体，或是由其组成。

用于检测CDH1-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:186或由其组成的CDH1-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置119和120的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:186的多核苷酸(或SEQ ID NO:186的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置119和120的核酸。

优选地，该用于检测CDH1与NRG1的融合物的核酸探针、引物或引物对特异性地与由CDH1的外显子11组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子11的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测CDH1与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:213组成的序列(或SEQ ID NO:213的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自CDH1的外显子11包含SEQ ID NO:198或其等位基因变体，或是由其组成。

用于检测CXADR-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:217或由其组成的CXADR-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置43和44的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:217的多核苷酸(或SEQ ID NO:217的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置43和44的核酸。

优选地，该用于检测CXADR与NRG1的融合物的核酸探针、引物或引物对特异性地与由CXADR的外显子1组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子1的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测CXADR与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:219组成的序列(或SEQ ID NO:219的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自CXADR的外显子1包含SEQ ID NO:219或其等位基因变体，或是由其组成。

用于检测GTF2E2-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:233或由其组成的GTF2E2-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置141和142的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:233的多核苷酸(或SEQ ID NO:233的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置141和142的核酸。

优选地，该用于检测GTF2E2与NRG1的融合物的核酸探针、引物或引物对特异性地与由GTF2E2的外显子2组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子2的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测GTF2E2与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:252组成的序列(或SEQ ID NO:252的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自GTF2E2的外显子2包含SEQ ID NO:236或其等位基因变体，或是由其组成。

用于检测CSMD1-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:255或由其组成的CSMD1-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置88和89的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:255的多核苷酸(或SEQ ID NO:255的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置88和89的核酸。

优选地，该用于检测CSMD1与NRG1的融合物的核酸探针、引物或引物对特异性地与由CSMD1的外显子23组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子23的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测CSMD1与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:309组成的序列(或SEQ ID NO:309的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自CSMD1的外显子23包含SEQ ID NO:279或其等位基因变体，或是由其组成。

用于检测PTN-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:313或由其组成的PTN-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置102和103的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:313的多核苷酸(或SEQ ID NO:313的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置102和103的核酸。

优选地，该用于检测PTN与NRG1的融合物的核酸探针、引物或引物对特异性地与由PTN的外显子4组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子4的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测PTN与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:326组成的序列(或SEQ ID NO:326的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自PTN的外显子4包含SEQ ID NO:318或其等位基因变体，或是由其组成。

用于检测ST14-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:330或由其组成的ST14-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置95和96的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:330的多核苷酸(或SEQ ID NO:330的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置95和96的核酸。

优选地，该用于检测ST14与NRG1的融合物的核酸探针、引物或引物对特异性地与由ST14的外显子11组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子11的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测ST14与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:372组成的序列(或SEQ ID NO:372的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自ST14的外显子11包含SEQ ID NO:362或其等位基因变体，或是由其组成。

用于检测THBS1-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:376或由其组成的THBS1-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置56和57的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:376的多核苷酸(或SEQ ID NO:376的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置56和57的核酸。

优选地，该用于检测THBS1与NRG1的融合物的核酸探针、引物或引物对特异性地与由THBS1的外显子9组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子9的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测THBS1与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:399组成的序列(或SEQ ID NO:399的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自THBS1的外显子9包含SEQ ID NO:386或其等位基因变体，或是由其组成。

用于检测AGRN-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:403或由其组成的AGRN-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置106和107的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:403的多核苷酸(或SEQ ID NO:403的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置106和107的核酸。

优选地，该用于检测AGRN与NRG1的融合物的核酸探针、引物或引物对特异性地与由AGRN的外显子12组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子12的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测AGRN与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:433组成的序列(或SEQ ID NO:433的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自AGRN的外显子12包含SEQ ID NO:416或其等位基因变体，或是由其组成。

用于检测PVALB-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含PVALB核酸序列(或PVALB核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部份)融合的多核苷酸融合物的核酸引物、引物对或探针。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:444的多核苷酸(或SEQID NO:444的等位基因变体)和根据SEQ ID NO:138的多核苷酸(或SEQ ID NO:138的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。

此外，本公开提供一种用于检测包含SEQ ID NO:437或由其组成的PVALB-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置102和103的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:437的多核苷酸(或SEQ ID NO:437的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置102和103的核酸。

优选地，该用于检测PVALB与NRG1的融合物的核酸探针、引物或引物对特异性地与由PVALB的外显子4组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子4的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测PVALB与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:450组成的序列(或SEQ ID NO:450的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自PVALB的外显子4包含SEQ ID NO:442或其等位基因变体，或是由其组成。

用于检测APP-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:486或由其组成的APP-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置54和55的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:486的多核苷酸(或SEQ ID NO:486的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置54和55的核酸。

优选地，该用于检测APP与NRG1的融合物的核酸探针、引物或引物对特异性地与由APP的外显子14组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子14的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测APP与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:524组成的序列(或SEQ ID NO:524的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自APP的外显子14包含SEQ ID NO:501或其等位基因变体，或是由其组成。

用于检测WRN-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:528或由其组成的WRN-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置96和97的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:528的多核苷酸(或SEQ ID NO:528的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置96和97的核酸。

优选地，该用于检测WRN与NRG1的融合物的核酸探针、引物或引物对特异性地与由WRN的外显子33组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子33的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测WRN与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:601组成的序列(或SEQ ID NO:601的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自WRN的外显子33包含SEQ ID NO:562或其等位基因变体，或是由其组成。

用于检测DAAM1-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:605或由其组成的DAAM1-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置75和76的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:605的多核苷酸(或SEQ ID NO:605的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置75和76的核酸。

优选地，该用于检测DAAM1与NRG1的融合物的核酸探针、引物或引物对特异性地与由DAAM1的外显子1组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子1的5’处的序列和/或由NRG1的外显子1组成的序列、或位于外显子1的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测DAAM1与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:606组成的序列(或SEQ ID NO:606的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自DAAM1的外显子1包含SEQ ID NO:606或其等位基因变体，或是由其组成。

用于检测ASPH-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含ASPH核酸序列(或ASPH核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部份)融合的多核苷酸融合物的核酸引物、引物对或探针。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:662的多核苷酸(或SEQ IDNO:662的等位基因变体)和根据SEQ ID NO:138的多核苷酸(或SEQ ID NO:138的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。

此外，本公开提供一种用于检测包含SEQ ID NO:635或由其组成的ASPH-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置75和76的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:635的多核苷酸(或SEQ ID NO:635的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置75和76的核酸。

优选地，该用于检测ASPH与NRG1的融合物的核酸探针、引物或引物对特异性地与由ASPH的外显子22组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子22的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测ASPH与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:689组成的序列(或SEQ ID NO:689的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自ASPH的外显子22包含SEQ ID NO:658或其等位基因变体，或是由其组成。

用于检测NOTCH2-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:693或由其组成的NOTCH2-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置75和76的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:693的多核苷酸(或SEQ ID NO:693的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置75和76的核酸。

优选地，该用于检测NOTCH2与NRG1的融合物的核酸探针、引物或引物对特异性地与由NOTCH2的外显子6组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子6的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测NOTCH2与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:713组成的序列(或SEQ ID NO:713的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自NOTCH2的外显子6包含SEQ ID NO:700或其等位基因变体，或是由其组成。

用于检测CD74-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:717或由其组成的CD74-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置75和76的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:717的多核苷酸(或SEQ ID NO:717的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置75和76的核酸。

优选地，该用于检测CD74与NRG1的融合物的核酸探针、引物或引物对特异性地与由CD74的外显子2组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子2的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测CD74与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:739组成的序列(或SEQ ID NO:739的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自CD74的外显子2包含SEQ ID NO:720或其等位基因变体，或是由其组成。

用于检测SDC4-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:743或由其组成的SDC4-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置75和76的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:743的多核苷酸(或SEQ ID NO:743的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置75和76的核酸。

优选地，该用于检测SDC4与NRG1的融合物的核酸探针、引物或引物对特异性地与由SDC4的外显子2组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子2的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测SDC4与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:757组成的序列(或SEQ ID NO:757的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自SDC4的外显子2包含SEQ ID NO:746或其等位基因变体，或是由其组成。

本公开提供一种用于检测包含SEQ ID NO:824或由其组成的SDC4-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置75和76的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:824的多核苷酸(或SEQ ID NO:824的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置75和76的核酸。

优选地，该用于检测SDC4与NRG1的融合物的核酸探针、引物或引物对特异性地与由SDC4的外显子4组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子4的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测SDC4与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:940组成的序列(或SEQ ID NO:940的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自SDC4的外显子2包含SEQ ID NO:748或其等位基因变体，或是由其组成。

用于检测SLC4A4-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含SEQ ID NO:765或由其组成的SLC4A4-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置75和76的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:765的多核苷酸(或SEQ ID NO:765的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置75和76的核酸。

优选地，该用于检测SLC4A4与NRG1的融合物的核酸探针、引物或引物对特异性地与由SLC4A4的外显子14组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子14的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测SLC4A4与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:820组成的序列(或SEQ ID NO:820的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自SLC4A4的外显子14包含SEQ ID NO:780或其等位基因变体，或是由其组成。

用于检测ZFAT-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含ZFAT核酸序列(或ZFAT核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部份)融合的多核苷酸融合物的核酸引物、引物对或探针。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:846的多核苷酸(或SEQ IDNO:846的等位基因变体)和根据SEQ ID NO:138的多核苷酸(或SEQ ID NO:138的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。

此外，本公开提供一种用于检测包含SEQ ID NO:828或由其组成的ZFAT-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置75和76的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:828的多核苷酸(或SEQ ID NO:828的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置75和76的核酸。

优选地，该用于检测ZFAT与NRG1的融合物的核酸探针、引物或引物对特异性地与由ZFAT的外显子12组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子12的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测ZFAT与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:864组成的序列(或SEQ ID NO:864的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自ZFAT的外显子12包含SEQ ID NO:841或其等位基因变体，或是由其组成。

用于检测DSCAML1-NRG1融合物的测定法中的引物或探针

本公开提供一种用于检测包含DSCAML1核酸序列(或DSCAML1核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部份)融合的多核苷酸融合物的核酸引物、引物对或探针。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:903的多核苷酸(或SEQ ID NO:903的等位基因变体)和根据SEQ ID NO:138的多核苷酸(或SEQ ID NO:138的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。

此外，本公开提供一种用于检测包含SEQ ID NO:868或由其组成的DSCAML1-NRG1多核苷酸融合物的核酸引物、引物对或探针，且该序列包括位置75和76的核酸。优选地，该核酸探针、引物或引物对特异性地与根据SEQ ID NO:868的多核苷酸(或SEQ ID NO:868的等位基因变体)杂合，或是与该序列有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至40个核苷酸，且该序列优选地包括位置75和76的核酸。

优选地，该用于检测DSCAML1与NRG1的融合物的核酸探针、引物或引物对特异性地与由DSCAML1的外显子3组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子3的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸)。优选地，该用于检测DSCAML1与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:938组成的序列(或SEQ ID NO:938的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合，或是与其具有95％、96％、97％、98％、99％或优选地有100％的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。

优选地，来自DSCAML1的外显子3包含SEQ ID NO:872或其等位基因变体，或是由其组成。

用于原位杂交的探针

也提用于原位杂交(ISH)测定法的探针以检测涉及VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的任何基因重排。特别地，该探针用于荧光原位杂交(FISH)或断裂分离FISH。该基因重排优选为VAPB、CADM1、CD44、SLC3A2、VTCN1 CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1与NRG1的基因融合物，但因为这些ISH测定法靶向本文所公开的融合接点的5’和3’侧，可使用该ISH测定法来检测涉及所述基因的任何基因重排。

因此，特别提供第一核酸探针和第二核酸探针，其用于原位杂交测定法中，以检测VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的基因重排，其中：

-用于检测VAPB的基因重排的第一探针特异性地与位于SEQ ID NO:1的位置42或43的核酸5’处的VAPB序列杂交，且该第二探针特异性地与位于SEQ ID NO:1的位置42或43的核酸3’处的VAPB序列杂交；

-用于检测CADM1的基因重排的第一探针特异性地与位于SEQ ID NO:5的位置53的核酸5’处的CADM1序列杂交，且该第二探针特异性地与位于SEQ ID NO:5的位置53的核酸3’处的CADM1序列杂交；

-用于检测CD44的基因重排的第一探针特异性地与位于SEQ ID NO:9的位置52的核酸5’处的CD44序列杂交，且该第二探针特异性地与位于SEQ ID NO:9的位置52的核酸3’处的CD44序列杂交；

-用于检测CD44的基因重排的第一探针特异性地与位于SEQ ID NO:759的位置75的核酸5’处的CD44序列杂交，且该第二探针特异性地与位于SEQ ID NO:759的位置75的核酸3’处的CD44序列杂交；

-用于检测SLC3A2的基因重排的第一探针特异性地与位于SEQ ID NO:13的位置53的核酸5’处的SLC3A2序列杂交，且该第二探针特异性地与位于SEQ ID NO:13的位置53的核酸3’处的SLC3A2序列杂交；

-用于检测VTCN1的基因重排的第一探针特异性地与位于SEQ ID NO:164的位置65的核酸5’处的VTCN1序列杂交，且该第二探针特异性地与位于SEQ ID NO:164的位置65的核酸3’处的VTCN1序列杂交；

-用于检测CDH1的基因重排的第一探针特异性地与位于SEQ ID NO:184的位置119的核酸5’处的CDH1序列杂交，且该第二探针特异性地与位于SEQ ID NO:184的位置119的核酸3’处的CDH1序列杂交；

-用于检测CXADR的基因重排的第一探针特异性地与位于SEQ ID NO:215的位置43的核酸5’处的CXADR序列杂交，且该第二探针特异性地与位于SEQ ID NO:215的位置43的核酸3’处的CXADR序列杂交；

-用于检测GTF2E2的基因重排的第一探针特异性地与位于SEQ ID NO:231的位置141的核酸5’处的GTF2E2序列杂交，且该第二探针特异性地与位于SEQ ID NO:231的位置141的核酸3’处的GTF2E2序列杂交；

-用于检测CSMD1的基因重排的第一探针特异性地与位于SEQ ID NO:253的位置88的核酸5’处的CSMD1序列杂交，且该第二探针特异性地与位于SEQ ID NO:253的位置88的核酸3’处的CSMD1序列杂交；

-用于检测PTN的基因重排的第一探针特异性地与位于SEQ ID NO:311的位置102的核酸5’处的PTN序列杂交，且该第二探针特异性地与位于SEQ ID NO:311的位置102的核酸3’处的PTN序列杂交；

-用于检测ST14的基因重排的第一探针特异性地与位于SEQ ID NO:328的位置95的核酸5’处的ST14序列杂交，且该第二探针特异性地与位于SEQ ID NO:328的位置95的核酸3’处的ST14序列杂交；

-用于检测THBS1的基因重排的第一探针特异性地与位于SEQ ID NO:374的位置56的核酸5’处的THBS1序列杂交，且该第二探针特异性地与位于SEQ ID NO:374的位置56的核酸3’处的THBS1序列杂交；

-用于检测AGRN的基因重排的第一探针特异性地与位于SEQ ID NO:401的位置106的核酸5’处的AGRN序列杂交，且该第二探针特异性地与位于SEQ ID NO:401的位置106的核酸3’处的AGRN序列杂交；

-用于检测PVALB的基因重排的第一探针特异性地与位于SEQ ID NO:435的位置102的核酸5’处的PVALB序列杂交，且该第二探针特异性地与位于SEQ ID NO:435的位置102的核酸3’处的PVALB序列杂交；

-用于检测SLC3A2的基因重排的第一探针特异性地与位于SEQ ID NO:452的位置93的核酸5’处的SLC3A2序列杂交，且该第二探针特异性地与位于SEQ ID NO:452的位置93的核酸3’处的SLC3A2序列杂交；

-用于检测APP的基因重排的第一探针特异性地与位于SEQ ID NO:484的位置54的核酸5’处的APP序列杂交，且该第二探针特异性地与位于SEQ ID NO:484的位置54的核酸3’处的APP序列杂交；

-用于检测WRN的基因重排的第一探针特异性地与位于SEQ ID NO:526的位置96的核酸5’处的WRN序列杂交，且该第二探针特异性地与位于SEQ ID NO:526的位置96的核酸3’处的WRN序列杂交；

-用于检测DAAM1的基因重排的第一探针特异性地与位于SEQ ID NO:603的位置75的核酸5’处的DAAM1序列杂交，且该第二探针特异性地与位于SEQ ID NO:603的位置75的核酸3’处的DAAM1序列杂交；

-用于检测ASPH的基因重排的第一探针特异性地与位于SEQ ID NO:633的位置75的核酸5’处的ASPH序列杂交，且该第二探针特异性地与位于SEQ ID NO:633的位置75的核酸3’处的ASPH序列杂交；

-用于检测NOTCH2的基因重排的第一探针特异性地与位于SEQ ID NO:691的位置75的核酸5’处的NOTCH2序列杂交，且该第二探针特异性地与位于SEQ ID NO:691的位置75的核酸3’处的NOTCH2序列杂交；

-用于检测CD74的基因重排的第一探针特异性地与位于SEQ ID NO:715的位置75的核酸5’处的CD74序列杂交，且该第二探针特异性地与位于SEQ ID NO:715的位置75的核酸3’处的CD74序列杂交；

-用于检测SDC4的基因重排的第一探针特异性地与位于SEQ ID NO:741的位置75的核酸5’处的SDC4序列杂交，且该第二探针特异性地与位于SEQ ID NO:741的位置75的核酸3’处的SDC4序列杂交；

-用于检测SDC4的基因重排的第一探针特异性地与位于SEQ ID NO:822的位置75的核酸5’处的SDC4序列杂交，且该第二探针特异性地与位于SEQ ID NO:822的位置75的核酸3’处的SDC4序列杂交；

-用于检测SLC4A4的基因重排的第一探针特异性地与位于SEQ ID NO:763的位置75的核酸5’处的SLC4A4序列杂交，且该第二探针特异性地与位于SEQ ID NO:763的位置75的核酸3’处的SLC4A4序列杂交；

-用于检测ZFAT的基因重排的第一探针特异性地与位于SEQ ID NO:826的位置75的核酸5’处的ZFAT序列杂交，且该第二探针特异性地与位于SEQ ID NO:826的位置75的核酸3’处的ZFAT序列杂交；或

-用于检测DSCAML1的基因重排的第一探针特异性地与位于SEQ ID NO:866的位置75的核酸5’处的DSCAML1序列杂交，且该第二探针特异性地与位于SEQ ID NO:866的位置75的核酸3’处的DSCAML1序列杂交。

替代性地，提供了一种优选的ISH测定法，其中检测选自VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、DAAM1-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1或DSCAML1-NRG1的任一多核苷酸融合物。所述测定法使用第一探针和第二探针，其中若该第一探针与该融合接点5’侧的序列杂交，该第二探针则与另一侧的序列杂交，或者是若该第一探针与该融合接点3’侧的序列杂交，该第二探针则与另一侧的序列杂交，且其中该第一探针与选自VAPB,CADM1,CD44,SLC3A2,VTCN1,CDH1,CXADR,GTF2E2,CSMD1,PTN,ST14,THBS1,AGRN,PVALB,APP,WRN,DAAM1,ASPH,NOTCH2,CD74,SDC4,SLC4A4,ZFAT或DSCAML1的序列杂交，而该第二探针系与NRG1序列杂交且优选为诸如本文所提及的EGF样结构域序列。包括与EGF样结构域杂交的探针时，将所述结构域置于该NRG1融合配偶体序列的附近。

特别提供了一种用于原位杂交测定法以检测VAPB-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:3的位置42或43的核酸5’处的VAPB序列杂交，且该第二探针特异性地与位于SEQ ID NO:3的位置43或44的核酸3’处的NRG1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测CADM1-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:7的位置53的核酸5’处的CADM1序列杂交，且该第二探针特异性地与位于SEQ ID NO:7的位置54的核酸3’处的NRG1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测CD44-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:11的位置52的核酸5’处的CD44序列杂交，且该第二探针特异性地与位于SEQ ID NO:11的位置53的核酸3’处的NRG1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测CD44-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:761的位置75的核酸5’处的CD44序列杂交，且该第二探针特异性地与位于SEQ ID NO:761的位置76的核酸3’处的NRG1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测SLC3A2-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:15的位置53的核酸5’处的SLC3A2序列杂交，且该第二探针特异性地与位于SEQ ID NO:15的位置54的核酸3’处的NRG1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测VTCN1-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:166的位置65的核酸5’处的VTCN1序列杂交，且该第二探针特异性地与位于SEQ ID NO:166的位置66的核酸3’处的VTCN1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测CDH1-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:186的位置119的核酸5’处的CDH1序列杂交，且该第二探针特异性地与位于SEQ ID NO:186的位置120的核酸3’处的CDH1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测CXADR-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:217的位置43的核酸5’处的CXADR序列杂交，且该第二探针特异性地与位于SEQ ID NO:217的位置44的核酸3’处的CXADR序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测GTF2E2-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:233的位置141的核酸5’处的GTF2E2序列杂交，且该第二探针特异性地与位于SEQ ID NO:233的位置142的核酸3’处的GTF2E2序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测CSMD1-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:255的位置88的核酸5’处的CSMD1序列杂交，且该第二探针特异性地与位于SEQ ID NO:255的位置89的核酸3’处的CSMD1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测PTN-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:313的位置102的核酸5’处的PTN序列杂交，且该第二探针特异性地与位于SEQ ID NO:313的位置103的核酸3’处的PTN序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测ST14-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:330的位置95的核酸5’处的ST14序列杂交，且该第二探针特异性地与位于SEQ ID NO:330的位置96的核酸3’处的ST14序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测THBS1-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:376的位置56的核酸5’处的THBS1序列杂交，且该第二探针特异性地与位于SEQ ID NO:376的位置57的核酸3’处的THBS1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测AGRN-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:403的位置106的核酸5’处的AGRN序列杂交，且该第二探针特异性地与位于SEQ ID NO:403的位置107的核酸3’处的AGRN序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测PVALB-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:437的位置102的核酸5’处的PVALB序列杂交，且该第二探针特异性地与位于SEQ ID NO:437的位置103的核酸3’处的PVALB序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测SLC3A2-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:454的位置93的核酸5’处的SLC3A2序列杂交，且该第二探针特异性地与位于SEQ ID NO:454的位置94的核酸3’处的SLC3A2序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测APP-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:486的位置54的核酸5’处的APP序列杂交，且该第二探针特异性地与位于SEQ ID NO:486的位置55的核酸3’处的NRG1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测WRN-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:528的位置96的核酸5’处的WRN序列杂交，且该第二探针特异性地与位于SEQ ID NO:528的位置97的核酸3’处的NRG1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测DAAM1-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:605的位置75的核酸5’处的DAAM1序列杂交，且该第二探针特异性地与位于SEQ ID NO:605的位置76的核酸3’处的NRG1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测ASPH-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:635的位置75的核酸5’处的ASPH序列杂交，且该第二探针特异性地与位于SEQ ID NO:635的位置76的核酸3’处的NRG1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测NOTCH2-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:693的位置75的核酸5’处的NOTCH2序列杂交，且该第二探针特异性地与位于SEQ ID NO:693的位置76的核酸3’处的NRG1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测CD74-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:717的位置75的核酸5’处的CD74序列杂交，且该第二探针特异性地与位于SEQ ID NO:717的位置76的核酸3’处的NRG1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测SDC4-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:743的位置75的核酸5’处的SDC4序列杂交，且该第二探针特异性地与位于SEQ ID NO:743的位置76的核酸3’处的NRG1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测SDC4-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:824的位置75的核酸5’处的SDC4序列杂交，且该第二探针特异性地与位于SEQ ID NO:824的位置76的核酸3’处的NRG1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测SLC4A4-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:765的位置75的核酸5’处的SLC4A4序列杂交，且该第二探针特异性地与位于SEQ ID NO:765的位置76的核酸3’处的NRG1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测ZFAT-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:828的位置75的核酸5’处的ZFAT序列杂交，且该第二探针特异性地与位于SEQ ID NO:828的位置76的核酸3’处的NRG1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

也特别提供了一种用于原位杂交测定法以检测DSCAML1-NRG1融合物的第一核酸探针和第二核酸探针，其中该第一探针特异性地与位于SEQ ID NO:868的位置75的核酸5’处的DSCAML1序列杂交，且该第二探针特异性地与位于SEQ ID NO:868的位置76的核酸3’处的NRG1序列杂交，诸如本公开的EGF样结构域所包含的序列，特别是SEQ ID NO:163的序列。

本文所提及的核酸探针、引物或引物对中的任一者优选地用于以下鉴定或检测方法中，以检测选自VAPB-NRG1、CADM1-NRG1 CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、DAAM1-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1和DSCAML1-NRG1的多核苷酸、多肽融合物、其部分或等位基因变体中的任一者。

用于检测NRG多核苷酸融合物的测定法

根据本公开，其提供一种在样本中鉴定如本文所提及的多核苷酸融合物、或由其所编码的多肽的方法，所述方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。

也提供一种在样本中检测多核苷酸融合物、或由其所编码的多肽是否存在的方法，所述方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。

也提供一种确定来自受试者的异常细胞是否包含多核苷酸融合物、或由其所编码的多肽的方法，所述方法包括检验获自该受试者的异常细胞的多核苷酸或多肽内容物是否在样本中存在该融合物。

也提供一种鉴定受试者携带多核苷酸融合物、或由其所编码的多肽的方法，所述方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。优选地在该检验之后为是将该样本中检测到的融合物与携带该融合物的受试者联系在一起的步骤。

优选地，所述检验包含利用结合剂特异性地结合所述多核苷酸，诸如本文所提及的任一核酸探针、引物或引物对，或特异性地与本文所提及的任一多核苷酸融合物所编码的多肽结合，或是替代性地利用结合剂与包含该多核苷酸融合物的多核苷酸结合，来检测本文所提及的任一多核苷酸或多肽融合物。该结合剂被利用作为检测步骤的一部分或是使检测成为后续步骤。因此，在本公开的任一方法中的检验优选地包含利用结合剂特异性地结合任一多核苷酸融合物或由其所编码的任一多肽，以检测这类融合物。所述结合剂优选地包含引物、引物对、探针或抗体或是由其组成。此外，该结合剂优选地包含可检测标记。

替代性地，所述检验包含利用结合剂与包含该多核苷酸融合物的多核苷酸结合以检测该融合物。在此替代例中，该结合剂与位于该多核苷酸接点5’和/或3’处的多核苷酸结合且该多核苷酸接点含有NRG1与其融合配偶体之间的实际接点。该结合剂退火或杂交的多核苷酸系作为转接子来连接或以其他方式附接到该多核苷酸融合物，之后检测该融合物。这类转接子优选地含有标签或分子条形码(barcode)，诸如在测序方法学(包括下一代测序)中所用的。优选地包含条形码或标签的这类转接子附接至该多核苷酸融合物，以在扩增之后可检测所述融合物。特别地，该结合剂可使用在Anchored Multiplex PCR(或AMP)中，其中在从mRNA产生cDNA之后获得用于NGS的富含目标样本库。

优选地，所述结合剂特异性地与根据SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:164、SEQ ID NO:165、SEQ ID NO:166、SEQ ID NO:184、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:215、SEQ ID NO:216、SEQ IDNO:217、SEQ ID NO:231、SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:253、SEQ ID NO:254、SEQ ID NO:255、SEQ ID NO:311、SEQ ID NO:312、SEQ ID NO:313、SEQ ID NO:328、SEQ IDNO:329、SEQ ID NO:330、SEQ ID NO:374、SEQ ID NO:375、SEQ ID NO:376、SEQ ID NO:401、SEQ ID NO:402、SEQ ID NO:403、SEQ ID NO:435、SEQ ID NO:436、SEQ ID NO:437、SEQ IDNO:452、SEQ ID NO:453、SEQ ID NO:454、SEQ ID NO:484、SEQ ID NO:485、SEQ ID NO:486、SEQ ID NO:526、SEQ ID NO:527、SEQ ID NO:528、SEQ ID NO:603、SEQ ID NO:604、SEQ IDNO:605、SEQ ID NO:633、SEQ ID NO:634、SEQ ID NO:635、SEQ ID NO:691、SEQ ID NO:692、SEQ ID NO:693、SEQ ID NO:715、SEQ ID NO:716、SEQ ID NO:717、SEQ ID NO:741、SEQ IDNO:742、SEQ ID NO:743、SEQ ID NO:759、SEQ ID NO:760、SEQ ID NO:761、SEQ ID NO:763、SEQ ID NO:764、SEQ ID NO:765、SEQ ID NO:822、SEQ ID NO:823、SEQ ID NO:824、SEQ IDNO:826、SEQ ID NO:827、SEQ ID NO:828、SEQ ID NO:866、SEQ ID NO:867或SEQ ID NO:868中的任一者的多核苷酸序列结合。这些序列致使在感兴趣的融合接点紧靠进行特异性杂交，或甚至含有该融合接点，使其成为被所述结合剂结合的良好候选序列。

替代性地，该结合剂特异性地与包含根据SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:164、SEQ ID NO:165、SEQ ID NO:166、SEQ ID NO:184、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:215、SEQ ID NO:216、SEQID NO:217、SEQ ID NO:231、SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:253、SEQ ID NO:254、SEQ ID NO:255、SEQ ID NO:311、SEQ ID NO:312、SEQ ID NO:313、SEQ ID NO:328、SEQID NO:329、SEQ ID NO:330、SEQ ID NO:374、SEQ ID NO:375、SEQ ID NO:376、SEQ ID NO:401、SEQ ID NO:402、SEQ ID NO:403、SEQ ID NO:435、SEQ ID NO:436、SEQ ID NO:437、SEQID NO:452、SEQ ID NO:453、SEQ ID NO:454、SEQ ID NO:484、SEQ ID NO:485、SEQ ID NO:486、SEQ ID NO:526、SEQ ID NO:527、SEQ ID NO:528、SEQ ID NO:603、SEQ ID NO:604、SEQID NO:605、SEQ ID NO:633、SEQ ID NO:634、SEQ ID NO:635、SEQ ID NO:691、SEQ ID NO:692、SEQ ID NO:693、SEQ ID NO:715、SEQ ID NO:716、SEQ ID NO:717、SEQ ID NO:741、SEQID NO:742、SEQ ID NO:743、SEQ ID NO:759、SEQ ID NO:760、SEQ ID NO:761、SEQ ID NO:763、SEQ ID NO:764、SEQ ID NO:765、SEQ ID NO:822、SEQ ID NO:823、SEQ ID NO:824、SEQID NO:826、SEQ ID NO:827、SEQ ID NO:828、SEQ ID NO:866、SEQ ID NO:867或SEQ ID NO:868中的任一者的序列的多核苷酸序列。在此替代例的一个优选方面中，该结合剂优选地退火或杂交至转接子序列来附接(优选地以连接方式)至该多核苷酸融合序列。优选地包含条形码或标签的这类转接子附接至该多核苷酸融合物，以在扩增之后可检测所述融合物。另外地或替代性地，该结合剂包含基因特异性引物、引物对、或探针，其任一者结合至位于融合断点5’或3’处的核苷酸序列，而可扩增NRG1与VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的接点。

此外，检验任何本公开的多核苷酸融合物是否存在优选地包含扩增带有NRG1融合物或其一部分的多核苷酸，且优选地使用DNA聚合酶，更优选地使用热稳定DNA聚合酶或Taq聚合酶。

优选地，该结合剂包含第一引物和第二引物以扩增包含NRG1序列与VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1序列的核苷酸序列，进而检测本文所提及的任一多核苷酸融合物。更优选地，提供了与对于该融合物的NRG1序列部分具有特异性的核苷酸序列杂交或退火的第一引物，以及与对于选自VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的融合配偶体具有特异性的核苷酸序列杂交或退火的第二引物。优选地，该第一和第二引物紧靠融合接点结合，以扩增包含NRG1序列的一部分与VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1序列的一部分的序列。该第一或第二引物也可结合至跨越了该融合接点的位点。一般地，经扩增的序列包含多达1000、900、800、700、600、500、400或300个碱基对。一般地，经扩增的序列会跨越该NRG1融合接点。

因此也提供一种结合剂，其是或包含长度为10-40个核苷酸的核酸探针或引物以用于检测本公开的VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1与NRG1的多核苷酸融合物，其中该融合物分别包含SEQ ID NO:3位置43和44的核酸、SEQ ID NO:7位置53和54的核酸、SEQ ID NO:11位置52和53的核酸、SEQ ID NO:15位置53和54的核酸、SEQ ID NO:166位置65和66的核酸、SEQ ID NO:186位置119和120的核酸、SEQ ID NO:217位置43和44的核酸、SEQ ID NO:233位置141和142的核酸、SEQ ID NO:255位置88和89的核酸、SEQ ID NO:313位置102和103的核酸、SEQ ID NO:330位置95和96的核酸、SEQ ID NO:376位置56和57的核酸、SEQ ID NO:403位置106和107的核酸、SEQ ID NO:437位置102和103的核酸、或SEQ ID NO:454位置93和94的核酸、SEQ ID NO:486位置54和55的核酸、SEQ ID NO:528位置96和97的核酸、SEQ ID NO:605位置75和76的核酸、SEQ ID NO:635位置75和76的核酸、SEQ ID NO:693位置75和76的核酸、SEQ ID NO:717位置75和76的核酸、SEQ ID NO:743位置75和76的核酸、SEQ ID NO:761位置75和76的核酸、SEQ ID NO:765位置75和76的核酸、SEQ ID NO:824位置75和76的核酸、SEQ ID NO:828位置75和76的核酸、SEQID NO:868位置75和76的核酸。这些位置的核酸界定了NRG1与其融合配偶体之间的断点或融合接点。

优选地，本文所提及的所述检验包含扩增或检测用于区别该多核苷酸融合物或由其所编码的多肽是否存在的序列。

在一个优选实施方式中，该结合剂为多肽且优选地通过流式细胞仪(FC)、荧光原位杂交法(FISH)、免疫细胞化学染色法(ICC)、免疫荧光染色法(IF)来检测其是否存在。技术人员可采用多种不同技术，使用FC、IHC、FISH、ICC或IF在样本中检测本公开的NRG1融合物。例如，可使用靶向NRG1的第一抗体以及靶向选自VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的NRG1融合配偶体的第二抗体来进行ICC。该第一与第二抗体的信号共定位，或是使用蛋白大小为基础的区别测定法来检测具有期望大小的多肽产物是否存在，可显示出各别NRG1融合产物是否存在。优选地，该抗NRG1抗体靶向NRG1的EGF样结构域，而该第二抗体靶向诸如VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的融合配偶体的细胞外结构域。Frithiof等人于OncoTargets andtherapy第9卷,7095-7103,2016年11月16日中提供了FISH实验方案的一个例子。另外，可使用两种不同的荧光检测系统并结合在荧光显微镜中使用两种不同通道来检测抗体。基于两个荧光信号的重叠或未重叠外观来说明结果。针对已知结构及序列的多肽来开发抗体，这完全属于技术人员的工作范围内。

优选地，所要检测的多核苷酸或多肽融合物获自于表达包含多核苷酸融合物的NRG1EGF样结构域的异常细胞。优选地，本公开的任何检测方法包含从受试者获得样本的步骤，以及随后从该样本分离该多核苷酸或其所编码的多肽的步骤。此外，所述方法优选地包含从该样本纯化或分离出该核苷酸或多肽的步骤。

优选地，该样本获自罹患癌症或肿瘤、或是怀疑罹患癌症或肿瘤并且带有异常细胞的受试者。该样本可为液态活检样本，或是采自实体癌或实体瘤的样本。该实体样本优选为经福尔马林包埋及石蜡固定的含有异常细胞、一部分癌症或一部分肿瘤中的任一者的样本。从实体癌或实体瘤采取样本会严重破坏皮肤的物理完整性，可能还有内部器官，以触及被调查的肿瘤。使用诸如选自血液、血清、血浆、胸腔积液、唾液、尿液、精液、痰、阴道液、羊水、腹膜液、脑脊液、骨髓、无细胞灌洗液或另一生物流体的液态活检，可以有比这些方法更实惠、更快速、更可靠且侵入性更小的采样。因此，优选地，该样本为液态活检样本。

检测或鉴定NRG1融合物的基于抗体的测定法

也提供一种以多肽为基础的检测测定法以及用于其中的抗体。该检测测定法的目标在于检测本公开的多肽NRG1融合物，特别是本公开的VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1和DSCAML1-NRG1融合物。

特别提供了一种适于检测本文所提到的任何多肽融合物(优选为本文所提到的任何多核苷酸融合物所编码的任何多肽融合物)的第一抗体或第一与第二抗体组。技术人员完全有能力设计、研发及生产能够且适于与本文所公开的多肽融合物特异性地结合的抗体。

在使用第一抗体而没有第二抗体的情况下，该第一抗体会特异性地检测NRG1多肽融合物的独特表位。这类表位包括跨越了介于NRG1与其融合配偶体之间的多肽融合物的表位。替代性地，在使用第一抗体而不使用第二抗体、并且在检测测定法中使用该第一抗体(诸如下文进一步讨论)的情况下，所述测定法包括辨别出非融合多肽的步骤(例如基于大小或电荷之分离步骤，诸如CIEX或HPLC)。在使用第一和第二抗体的情况下，该第一抗体会检测该多肽融合物的一部分(即VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1)，而该第二抗体会检测该多肽融合物中包含NRG1的部分。

更特别是本公开提供一种第一抗体或第一和第二抗体组，用于检测由多核苷酸融合物所编码的多肽，且该多核苷酸融合物包含编码VAPB(或VAPB的等位基因变体)蛋白序列的核酸与编码NRG1(或NRG1的等位基因变体)蛋白序列的核酸融合。

优选地，该第一抗体、或第一与第二抗体组用于检测包含VAPB外显子1或外显子1的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测涉及VAPB和NRG1的多核苷酸融合物所编码的多肽的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合VAPB-NRG1多肽融合物，而该第一与第二抗体组优选地结合VAPB和NRG1。

也提供一种第一抗体、或第一与第二抗体组，用于检测包含CADM1外显子7或外显子7的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含CADM1外显子7或外显子7的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合CADM1-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合CADM1和NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含CD44外显子5或外显子5的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含CD44外显子5或外显子5的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合CD44-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合CD44和NRG1。

也提供一种第一抗体、或第一与第二抗体组，用于检测包含CD44外显子5或外显子5的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含CD44外显子5或外显子5的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合CD44-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合CD44和NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含SLC3A2的转录本6的外显子1或外显子1的等位基因变体所编码的多肽的一部分与NRG1外显子5或外显子5的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含所述SLC3A2外显子1或外显子1的等位基因变体所编码的多肽的一部分与NRG1外显子5或外显子5的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合SLC3A2转录本6的SLC3A2-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合所述SLC3A2和NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含VTCN1外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含VTCN1外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合VTCN1-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合VTCN1和NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含CDH1外显子11或外显子11的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含CDH1外显子11或外显子11的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合CDH1-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合CDH1和NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含CXADR外显子1或外显子1的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含CXADR外显子1或外显子1的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合CXADR-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合CXADR和NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含GFT2E2外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含GFT2E2外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合GFT2E2-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合GFT2E2和NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含CSMD1外显子23或外显子23的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含CSMD1外显子23或外显子23的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合CSMD1-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合CSMD1和NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含PTN外显子4或外显子4的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含PTN外显子4或外显子4的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合PTN-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合PTN和NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含ST14外显子11或外显子11的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含ST14外显子11或外显子11的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合ST14-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合ST14和NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含THBS1外显子9或外显子9的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含THBS1外显子9或外显子9的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合THBS1-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合THBS1和NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含AGRN外显子12或外显子12的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含AGRN外显子12或外显子12的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合AGRN-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合AGRN和NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含PVALB外显子4或外显子4的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含PVALB外显子4或外显子4的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合PVALB-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合PVALB和NRG1。

也提供一种第一抗体、或第一与第二抗体组，用于检测包含SLC3A2的转录本3的外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含所述SLC3A2外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合转录本3的SLC3A2-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合所述SLC3A2和NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含APP外显子14或外显子14的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含APP外显子14或外显子14的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合APP-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合APP和NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含WRN外显子33或外显子33的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含WRN外显子33或外显子33的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合WRN-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合WRN和NRG1。

本公开也提供一种第一抗体或第一和第二抗体组，用于检测由多核苷酸融合物所编码的多肽，且该多核苷酸融合物包含编码ASPH(或ASPH的等位基因变体)蛋白序列的核酸与编码NRG1(或NRG1的等位基因变体)蛋白序列的核酸融合。

更特别的是提供了一种用于检测多肽融合物的第一抗体或第一与第二抗体组，且该多肽融合物包含一部分由ASPH的外显子22或外显子22的等位基因变体所编码的多肽与一部分由NRG1的外显子2或外显子2的等位基因变体所编码的多肽融合。也提供了一种包含第一抗体或第一与第二抗体组的检测测定法，用于检测是否存在有包含一部分由ASPH的外显子22或外显子22的等位基因变体所编码的多肽与一部分由NRG1的外显子2或外显子2的等位基因变体所编码的多肽融合的多肽融合物，其中该第一抗体优选地结合该ASPH-NRG1多肽融合物，而该第一与第二抗体组分别优选地结合ASPH与NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含NOTCH2外显子6或外显子6的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含NOTCH2外显子6或外显子6的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合NOTCH2-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合NOTCH2和NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含CD74外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含CD74外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合CD74-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合CD74和NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含SDC4外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含SDC4外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合SDC4-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合SDC4和NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含SDC4外显子4或外显子4的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含SDC4外显子4或外显子4的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合SDC4-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合SDC4和NRG1。

也提供一种第一抗体或第一与第二抗体组，用于检测包含SLC4A4外显子14或外显子14的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含SLC4A4外显子14或外显子14的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体优选地结合SLC4A4-NRG1多肽融合物，而该第一与第二抗体组优选地分别结合SLC4A4和NRG1。

本公开也提供一种第一抗体或第一和第二抗体组，用于检测由多核苷酸融合物所编码的多肽，且该多核苷酸融合物包含编码ZFAT(或ZFAT的等位基因变体)蛋白序列的核酸与编码NRG1(或NRG1的等位基因变体)蛋白序列的核酸融合。

更特别的是提供了一种用于检测多肽融合物的第一抗体或第一与第二抗体组，且该多肽融合物包含一部分由ZFAT的外显子12或外显子12的等位基因变体所编码的多肽与一部分由NRG1的外显子6或外显子6的等位基因变体所编码的多肽融合。也提供了一种包含第一抗体或第一与第二抗体组的检测测定法，用于检测是否存在有包含一部分由ZFAT的外显子12或外显子12的等位基因变体所编码的多肽与一部分由NRG1的外显子6或外显子6的等位基因变体所编码的多肽融合的多肽融合物，其中该第一抗体优选地结合该ZFAT-NRG1多肽融合物，而该第一与第二抗体组分别优选地结合ZFAT与NRG1。

本公开也提供一种第一抗体或第一和第二抗体组，用于检测由多核苷酸融合物所编码的多肽，且该多核苷酸融合物包含编码DSCAML1(或DSCAML1的等位基因变体)蛋白序列的核酸与编码NRG1(或NRG1的等位基因变体)蛋白序列的核酸融合。

更特别的是提供了一种用于检测多肽融合物的第一抗体或第一与第二抗体组，且该多肽融合物包含一部分由DSCAML1的外显子3或外显子3的等位基因变体所编码的多肽与一部分由NRG1的外显子或外显子2的等位基因变体所编码的多肽融合。也提供了一种包含第一抗体或第一与第二抗体组的检测测定法供检测是否存在有包含一部分由DSCAML1的外显子3或外显子3的等位基因变体所编码的多肽与一部分由NRG1的外显子2或外显子2的等位基因变体所编码的多肽融合的多肽融合物，其中该第一抗体优选地结合该DSCAML1-NRG1多肽融合物，而该第一与第二抗体组分别优选地结合DSCAML1与NRG1。

优选地，该抗NRG1抗体优选地与NRG1的EGF样结构域结合。在本公开的多肽融合物中检测EGF样结构域的存在是有利的，因为其显示出EGF样结构域被翻译并因此是与作为融合配偶体的VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1框内融合部分。

本文所提及的抗NRG1、VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的抗体系可使用在流式细胞仪(FC)、荧光原位杂交法(FISH)、免疫细胞化学染色法(ICC)、免疫组织化学染色法(IHC)或免疫荧光染色法(IF)中。

治疗方法

本公开的融合物存在于具有异常细胞的人类患者中或已在其中鉴定出，特别是已诊断患有癌症的患者。本公开的癌症尤其为胰脏癌，更特别是胰脏导管腺癌、肉瘤、膀胱癌、大肠癌、直肠癌、大肠直肠癌、胆囊癌、头颈癌、前列腺癌、子宫癌、乳癌、卵巢癌、肝癌、子宫内膜癌、肺癌，特别是非小细胞肺癌或浸润性黏液腺癌。

一般地，本公开也提供治疗具有像癌症、肿瘤的异常细胞的受试者的方法，其中所述癌症、肿瘤或异常细胞，其细胞、癌症或肿瘤包含本公开的NRG1多核苷酸融合物或表达如本公开的NRG1多肽融合物。

目前的NRG1融合物已确定为称为eNRGy的临床试验及早期准入计划(EarlyAccess Program,分别为NCT02912949和NCT04100694)的一部分。截至2022年4月12日的截止日期，在整个融合配偶体和多种不同癌症类型中，根据RECIST 1.1标准观察到总共约有70％的已登记且未被排除的经鉴定有NRG1融合物的患者表现出调查员评估反应。在表1的每个类别中都观察到调查员评估反应。观察到反应的适应症包括胰腺导管腺癌、非小细胞肺癌、乳癌及胆管癌。

NRG1融合配偶体的盛行率

NRG1融合配偶体类别	占总数的百分比
		CD74	31％
SLC3A2	16％
		SDC4	9％
RBPMS	4％
		CDH1	2％
VTCN1	2％
		其他	23％

表1：发现的NRG1融合配偶体的百分比概述，2022年4月12日截止前的临床试验NCT02912949的受试者中，以已鉴定的所指融合配偶体占融合物总数的百分比的方式表示。在截止日期前鉴定为其他包含NRG1融合物者占总数为小于2％。

优选地，该异常细胞、癌(或癌细胞)或肿瘤(或肿瘤细胞)包含本公开的多核苷酸融合物，且该多核苷酸融合物进一步包含编码NRG1的EGF样结构域的编码序列的框内融合物。

本公开也提供一种治疗患有包含本文所提及的NRG1多核苷酸融合物或表达本文所提及的NRG1多肽融合物的ErbB-2和/或ErbB-3阳性异常细胞、癌细胞或肿瘤细胞的受试者的方法，所述方法包括检测本文所提及的任一多核苷酸或多肽融合物是否存在，随后向该受试者施用有效量的ErbB-2和/或ErbB-3靶向剂，从而治疗该受试者的癌症。存在本公开的NRG1融合物中的任一者时，无论是多核苷酸或由其翻译的多肽，都表示了癌症。

也提供一种抑制患有包含本文所提及的NRG1多核苷酸融合物或表达本文所提及的NRG1多肽融合物的ErbB-2和ErbB-3阳性癌症的受试者进程的方法，所述方法包括检测本文所提及的任一多核苷酸或多肽融合物是否存在，随后向该受试者施用有效量的ErbB-2和/或ErbB-3靶向剂。

也提供一种ErbB-2和/或ErbB-3靶向剂，其用于治疗患有包含本文所提及的NRG1多核苷酸融合物或表达本文所提及的NRG1多肽融合物的ErbB-2和ErbB-3阳性癌症的受试者，所述治疗包含检测本文所提及的任一多核苷酸或多肽融合物是否存在，随后向该受试者施用有效量的ErbB-2和/或ErbB-3靶向剂。

也提供一种ErbB-2和/或ErbB-3靶向剂在制备用于治疗携带包含本文所提及的NRG1多核苷酸融合物或表达本文所提及的NRG1多肽融合物的ErbB-2和ErbB-3阳性癌症的受试者的药物中的用途，所述治疗包含检测本文所提及的任一多核苷酸或多肽融合物是否存在，随后向该受试者施用有效量的ErbB-2和/或ErbB-3靶向剂。

再进一步提供了一种评估受试者是否罹患癌症或是易于罹患癌症的方法，该方法包括检验获自受试者的样本以检测该样本中是否存在本文所提及的NRG1多核苷酸融合物或NRG1多肽融合物，且通过鉴定所述融合物是否存在来评估所述受试者罹患所述癌症或是易于罹患所述癌症。该检验优选地包含利用结合剂特异性地结合所述多核苷酸或是利用结合剂与包含所述多核苷酸融合物的多核苷酸结合来检测该融合物。对于与包含所述多核苷酸融合物的多核苷酸结合的结合剂的更多细节详见下述。

优选地，本文所提及的诊断方法包含将样本中NRG1融合物的检测与表达本文所提及NRG1多肽的癌症联系在一起的步骤，以诊断该受试者患有表达所述NRG1多肽融合物的癌症。NRG1融合分子的检测使得可鉴定受试者患有表达该NRG1融合多肽的癌症，且可诊断所述受试者有这类癌症。对癌症的潜在致癌性驱动因素有所了解使得可选择及指定改进或更好的特制治疗。因此，检测受试者样本中的融合分子，诸如融合多肽或多核苷酸，使得可改善患有NRG1相关癌症的受试者的存活机会。

本公开因此提供一种治疗癌症的方法。该癌症优选地为复发性癌症或转移性癌症。复发一般是指局部复发，且意指该癌症与原来的癌症在同一个地方或非常接近。当肿瘤已迁移到原来癌症附近的淋巴结或组织，或是扩散到远离原来癌症更远的器官或组织时，一般会说该肿瘤是转移性肿瘤。在这类情况下，两种表示均可使用。

该癌症尤其为胰脏癌、胰脏腺癌、胰脏导管腺癌、肉瘤、膀胱癌、大肠直肠癌、胆囊癌、头颈癌、前列腺癌、子宫癌、乳癌、卵巢癌、肝癌、子宫内膜癌、诸如非小细胞肺癌之肺癌，特别是非小细胞肺癌，更特别是浸润性黏液腺癌。优选地，该肿瘤基因组显示出在选自由EGFR、KRAS、cKIT-BRCA1-2、MET、ROS、RET、ALK、优选地KRAS所组成的组的一个或多个基因中是否存在突变。

本公开使用ErbB-2和/或ErbB-3靶向剂用于治疗表达NRG1融合多肽的癌症，其中所述癌症优选为ErbB-2和/或ErbB-3阳性癌症。所述靶向剂选自由以下所组成的组：包含结合ErbB-2的胞外部分的第一抗原结合位点和结合ErbB-3的胞外部分的第二抗原结合位点的多特异性抗体、ErbB-2的酪氨酸激酶抑制剂、包含结合ErbB-2的胞外部分的抗原结合位点的单特异性二价抗体、包含结合ErbB-3的胞外部分的抗原结合位点的单特异性二价抗体、或其任何组合。

还包含施用一种或多种选自以下组成的组中的化合物以治疗癌症：抑制PI3激酶路径中的组分的抑制剂、抑制MAPK路径中的组分的抑制剂、微管破坏药物、及组蛋白去乙酰酶(HDAC)的抑制剂。所述抑制剂优选地包含酪氨酸激酶抑制剂、PI3Ka抑制剂、Akt抑制剂、mTOR抑制剂或Src抑制剂。所述酪氨酸激酶抑制剂优选为阿法替尼(afatinib)、拉帕替尼(lapatinib)和/或来那替尼(neratinib)。所述PI3Ka抑制剂优选为BYL719。在一实施例中，所述Akt抑制剂为MK-2206。在一个优选实施方式中，所述mTOR抑制剂为维莫司(everolimus)。在一个优选实施方式中，所述Src抑制剂为塞卡替尼(saracatinib)。在一个优选实施方式中，所述微管破坏药物为紫杉醇。在一个优选实施方式中，所述HDAC抑制剂为伏立诺他(vorinostat)。在一实施例中，所述对ErbB 2和ErbB 3具有专一性的结合化合物为MM 111。

该ErbB-2靶向剂优选为具有单特异性二价抗体且其包含结合ErbB-2的细胞外部分的抗原结合位点。这类抗体优选为曲妥珠单抗、帕妥珠单抗(pertuzumab)或曲妥珠单抗艾坦辛(trastuzumab-emtansine)。ErbB-2的靶向治疗优选为ErbB-2TKI。该ErbB-2TKI优选为拉帕替尼、卡奈替尼(canertinib)、来那替尼、图卡替尼(tucatinib)(或厄滨替尼(irbinitinib))、CP-724714、达洛西替尼(tarloxitinib)、穆布里替尼(mubritinib)、阿法替尼、伐利替尼(varlitinib)及达科米替尼(dacomitinib)中的一或多者，优选为阿法替尼。ErbB-2TKI也可能影响ErbB-1信号传导，但与ErbB-1TKI的不同之处在于它对ErbB-2具有显著的活性。ErbB-3靶向治疗优选为带有单特异性二价抗体且其包含结合ErbB-3的细胞外部分的抗原结合位点。这类抗体优选为帕利珠单抗(patritumab)、瑟瑞妥单抗(seribantumab)、鲁妥珠单抗(lumretuzumab)、依更妥单抗(elgemtumab)、GSK2849330、KTN3379或AV-203。

优选地，该包含结合ErbB-3的细胞外部分的抗原结合位点的单特异性二价抗体包含帕利珠单抗、瑟瑞妥单抗、鲁妥珠单抗、依更妥单抗、GSK2849330、KTN3379或AV-203。

该酪氨酸激酶抑制剂优选为阿法替尼、拉帕替尼和/或来那替尼。

更优选地，该ErbB-2和/或ErbB-3靶向剂为多特异性抗体，或更优选地为双特异性抗体，且其包含与ErbB-2的细胞外部分结合的第一抗原结合位点以及与ErbB-3的细胞外部分结合的第二抗原结合位点。特别地，所述双特异性抗体为泽妥珠单抗(zenocutuzumab)。

该抗体优选地可在ErbB-2和ErbB-3阳性细胞中降低配体诱导的ErbB-3受体功能。此外，该抗体优选地可降低ErbB-2和ErbB-3阳性细胞中的配体诱导的生长。该抗体优选地为包含与ErbB-2的细胞外部分结合的第一抗原结合位点以及与ErbB-3的细胞外部分结合的第二抗原结合位点多特异性或双特异性抗体。

该受试者优选为人类受试者。该受试者优选为符合使用ErbB-2特异性抗体(诸如曲妥珠单抗)进行单克隆抗体疗法的受试者。在一个优选实施方式中，该受试者包含肿瘤/癌症，其优选为ErbB-2/ErbB-3阳性癌症，优选为具ErbB-2治疗抗性基因型和/或heregulin抗性基因型的肿瘤/癌症，优选为具单克隆抗体抗性基因型的肿瘤/癌症。涉及这类基因型的肿瘤可躲过当前抗HER2治疗方案(诸如(但不限于)抗ErbB-2的单克隆抗体疗法)的治疗。

特别地，该癌症包含属于转移性肿瘤的肿瘤，优选地其中该肿瘤已迁移到原来癌症附近的淋巴结或组织，或是扩散到远离原来癌症更远的器官或组织。

本公开也包括体内模型，诸如表达在其基因组内或是包含本文所提及的多核苷酸融合物的移植异常细胞的异种移植或基因转基因动物模型，和/或表达由其所编码的多肽融合物，以及使用ERB2和/或Erb3靶向剂或其他靶向剂的这类模型的治疗以评估这类试剂的治疗活性。优选地，该动物模型为非人类动物模型。

在所公开的实施方式中，所述体内动物模型包含如本公开的多核苷酸融合物和/或表达由其所编码的多肽融合物，其中由该动物模型所包含的多核苷酸融合物或多肽融合物优选地是由存在于该动物模型中的移植异常细胞所包含，或是由所述动物模型的基因组所包含。

在所公开的实施方式中，本公开提供一种使用ErbB-2和/或ErbB-3靶向剂的所述体内动物模型的治疗方法，该靶向剂选自由以下所组成的组：包含结合ErbB-2的胞外部分的第一抗原结合位点和结合ErbB-3的胞外部分的第二抗原结合位点的多特异性抗体、ErbB-2的酪氨酸激酶抑制剂、包含结合ErbB-2的胞外部分的抗原结合位点的单特异性二价抗体、包含结合ErbB-3的胞外部分的抗原结合位点的单特异性二价抗体、或其任何组合，所述方法包括向该动物施用所述Erb2和/或Erb3靶向剂。

在所公开的实施方式中，本公开提供一种ErbB-2和/或ErbB-3靶向剂，其选自由以下所组成的组：包含结合ErbB-2的胞外部分的第一抗原结合位点和结合ErbB-3的胞外部分的第二抗原结合位点的多特异性抗体、ErbB-2的酪氨酸激酶抑制剂、包含结合ErbB-2的胞外部分的抗原结合位点的单特异性二价抗体、包含结合ErbB-3的胞外部分的抗原结合位点的单特异性二价抗体、或其任何组合，用于所述体内动物模型的治疗中。所述方法优选地包含向该动物施用所述Erb2和/或Erb3靶向剂。

给药及施用

本公开的药物组合物中的活性成分或是任何治疗方法中所施用的实际剂量含量可变化以获得有效实现对特定患者、组合物和施用模式的所需治疗反应，而对患者不具有毒性的活性成分的量。所选剂量水平将依赖于多种药物动力学因素，包括所用的本公开的特定组合物的活性、施用途径、施用时间、所用特定化合物的排出速率、治疗持续时间；与所用特定组合物组合使用的其他药物、化合物和/或物质；所治疗患者的年龄、性别、体重、病状、一般健康状况及先前医疗病史；以及药学领域中所熟知的类似因素。所述活性成分优选为本公开的任一Erb2和/或Erb3靶向剂。任何经批准的活性成分或正在进行临床试验的药物，特别是一旦进入临床试验的第二期，可由医生考虑按照批准的剂量方案或临床试验剂量治疗方案施用。

待施用于患者的如本文中所提及的任一ErbB-2和/或ErbB-3靶向剂的量通常在治疗窗内，其意指使用足够量来获得治疗效果，同时该量不超过会导致副作用达到不可接受程度的阈值。用来获得所要治疗效果的治疗物质所需量越低，治疗窗一般会越大。所选剂量水平将取决于各种因素，包括施用途径、施用时间、所用特定化合物的排出速率、治疗持续期间、组合使用的其他药物、化合物和/或物质、所治疗受试者的年龄、性别、体重、病状、一般健康状况及先前医疗病史；以及药学领域中所熟知的类似因素。

关于泽妥珠单抗，其在相对高剂量下具有良好的安全性概况，因此比其他靶标或具有细胞毒性的化学治疗剂相比下提供了较大的治疗窗。本公开的双特异性抗体的施用遵循每周、每两周或每三周一次750mg的施用方案，优选为每两周一次750mg的剂量。给药优选地用于患有胰脏癌、NSCLC、或实体瘤的受试者，且其包括患有具NRG1融合物的实体瘤的任何受试者，其中此类受试者已在施用化疗照护标准、或ErbB-2或ErbB-3靶向剂、或TKI时有所进展。替代地，随后的给药方案包括每周一次400mg的固定剂量施用，优选为在单次施用800mg之后开始。在此替代给药方案之后，本公开的双特异性抗体优选地以每周一次400mg的剂量施用3周，接着1周没有给药。接着，遵循一个或多个由下列组成的四周期间循环：三次的每周一次400mg的固定剂量，随后一周不施用。优选为遵循此方式直到观察到治疗效果。

给药优选地涉及以静脉内注射进行本公开的双特异性抗体的两次输注以达到完整剂量，其优选为在给药＞360mg抗体时。替代地，针对较低剂量可给予单次输注的完整剂量，例如在给药≤360mg抗体时。给药方案中可包括预备药物以减缓输注相关反应。

一般定义

冠词“一个”和“一种”在本文中是指冠词语法对象中的一个或多于一个(即，一个或至少一个)。

在整个本说明书及所附申请专利范围中，词语“包含”、“包括”及“具有”以及诸如“包含”、“包含有”、“包括”和“包括有”的变体将被解释为具有包容性。也就是说，在上下文允许的情况下，这些词语意欲表达可能包括未具体列举的其他元素或整数。

当提及核酸或氨基酸序列时，“一致性百分比(％)”的定义为在出于最佳比较目的而比对序列之后与经选择序列中的残基具有一致性的候选序列中的残基百分比。为了使比对优化，可以在两个序列之间在经比较的两个序列中的任一个中引入空隙。这模拟对可在所比较的全长序列上进行。替代性地，比对可在较短长度上进行，例如在约20个、约50个、约100个或更多个核酸/碱基或氨基酸上进行。序列一致性为报导的对齐区上方的两个序列之间的一致匹配百分比。

序列比较及两个序列之间的序列一致性百分比测定可使用数学算法实现。技术人员将了解以下事实：数个不同计算机程序可用于比对两个序列且测定两个序列之间的一致性(Kruskal,J.B.(1983)An overview of sequence comparison In D.Sankoff andJ.B.Kruskal,(编),Time warps,string edits and macromolecules:the theory andpractice of sequence comparison,第1-44页Addison Wesley)。两个氨基酸序列或核酸序列之间的序列一致性百分比可使用用于两个序列比对的尼-翁氏(Needleman andWunsch)算法来测定(Needleman,S.B.及Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。尼-翁氏算法已实施于计算机程序NEEDLE中。出于本公开的目的，使用来自EMBOSS软件包的NEEDLE程序以测定氨基酸和核酸序列的一致性百分比(版本2.8.0或更高版本，EMBOSS:TheEuropean Molecular Biology Open Software Suite(2000)Rice,P.LongdenJ.及Bleasby,A.Trends in Genetics 16,(6)第276-277页,http://emboss.bioinformatics.nl/)。对于蛋白质序列，使用EBLOSUM62以用于取代矩阵。对于DNA序列，使用DNAFULL。所用参数为10的空隙开放罚分及0.5的空隙扩展罚分。

在比对之后，通过如上文所描述的程序NEEDLE如下计算查询序列与本公开序列之间的序列一致性百分比：在两个序列中显示相同氨基酸或相同核苷酸的比对中的对应位置数目除以减除比对中的空隙总数目之后的比对总长度。

“等位基因变体”是指在源自患者的样本中所鉴定出的特定序列的天然发生的等位基因，其所鉴定出的序列已被指派SEQ ID NO，且其变体落入确定的变异范围内。该变异性的定义为与表示其为等位基因变体的序列有至少85％序列一致性，优选为90％一致性，或与其具有92％、94％、95％、96％或更佳为至少98％序列一致性。这类变体被认为是与之比较的序列的等位基因，因此仍有资格作为它的变体基因。如果在本文中没有明确提及与特定等位基因变体的关系，这些序列一致性百分比仍适用于所指的等位基因变体。

“双特异性抗体”是指一种抗体，其具有一个抗体可变域结合至第一抗原，而第二抗体可变域结合至第二抗原，其中所述第一和第二抗原是不相同的。术语“双特异性抗体”也涵盖二元抗体，其中一个抗体可变域结合至抗原的第一表位，而第二抗体可变域结合至相同抗原的第二表位。该术语进一步包括其中至少一个VH能够特异性地鉴定第一抗原与VL的抗体，与免疫球蛋白可变域中的至少一个VH配对，以能够特异性地鉴定第二抗原。所得VH/VL对将与抗原1或抗原2结合，且称为“二合一抗体”，例如在WO 2008/027236、WO 2010/108127及Schaefer等人(Cancer Cell 20,472-486,October 2011)中所描述。如本公开的双特异性抗体并不限于任何特定双特异性型式或是产生其的方法。

“可检测标记”是指化学、生物或其他修饰，包括但不限于荧光、质量、残基、染料、放射性同位素、标签或标记修饰等，其致使检测感兴趣的分子(在本文中优选为多核苷酸或多肽)是否存在。优选地，可检测标记为可见标记、荧光染料、淬灭体、紫外光可检测标记、显色标记、放射性标记、电化学标记、标签、当与对酶或分子条形码(barcode)具有特异性的基质接触时产生可检测标记的酶。示例性荧光染料包括水溶性罗丹明染料、荧光素、4,7-二氯荧光素、苯并蒽醌染料和能量转移染料，如以下参考文献中所公开的：Handbook ofMolecular Probes and Research Reagents,第8版(2002),Molecular Probes,Eugene,Oreg.；WO 2001/32783；美国专利公开号US2002-0081616,US2002-0086985；及Lee等人,1997,Nucleic Acids Research 25:2816-2822。

“分离的”或“纯化的”是指核酸或氨基酸序列被从其天然环境中移出而经分离或经纯化。“分离的”核酸分子包括从存在于该核酸分子的天然来源中的其他核酸分子分离出的核酸分子。此外，“分离的”核酸分子(诸如cDNA分子)在通过重组技术产生时包括不含其他细胞物质或培养基的状态，或在化学合成时实质上不含化学前驱物或其他化学品。

本文中的“样本”是指获自受试者或患者的样本。这类样本为生物样本或患者样本，这些术语在本文中可互换使用，因为本文所提及的样本为获自患者的生物样本。术语“样本”包括液态活检样本，采自实体癌或实体瘤的样本，且在向其应用任何处理之前将含有多核苷酸融合物和/或多肽融合物。特别地，该样本包含异常细胞，诸如肿瘤细胞或癌细胞。

措辞“不含其他细胞物质或培养基”包括核酸分子制剂，其中将该核酸分子自分离或重组产生核酸分子的细胞中的细胞成分分离出。

“引物”是指具有足够长度以特异性地与感兴趣的核苷酸序列杂交的单链核苷酸分子，以致使与界定了在聚合酶连锁反应(PCR)中被扩增的感兴趣区域的第二引物一起特异性结合(在本文中也称为杂交或退火)至目标或选定核苷酸序列。在本文中，第一和第二引物或引物对专门设计用于扩增跨越NRG1融合接点的核苷酸区域。特别地，使用了第一引物与第二引物的组合，该第一引物与对于在该融合接点一侧的NRG1序列部分具有特异性的核苷酸序列杂交，而该第二引物与对于在该融合接点另一侧的选自VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的融合配偶体具有特异性的核苷酸序列杂交。一般地，引物本身并不包含可检测标记。在NRG1融合多核苷酸的目标序列的全长上，引物通常与目标序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约97％、至少约98％或至少约99％的序列一致性。多核苷酸引物最优选地与其目标序列互补(在全长上具有100％序列一致性)。在本文中的所有实施例中，序列一致性通常在非变异/目标序列的全长上测得。

“探针”或“核酸探针”是指具有足够长度以特异性地与感兴趣的核苷酸序列杂交的单链核苷酸分子。特别地，在本公开的上下文中，该探针可检测发生在VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1中的融合物，特别是选自VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、DAAM1-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1和DSCAML1-NRG1的融合物。探针通常包含一种或两种可检测标记。在NRG1融合多核苷酸的目标序列的全长上，多核苷酸探针通常与目标序列具有至少约80％，至少约85％，至少约90％，至少约95％，至少约97％，至少约98％或至少约99％的序列一致性。该多核苷酸引物最优选地与其目标序列互补(在全长上具有100％序列一致性)。在本文中的所有实施例中，序列一致性通常在非变异/目标序列的全长上测得。

该多核苷酸探针优选为DNA探针、TaqMan探针、分子信标、蝎型探针(scorpionprobe)或于FISH中使用的探针。DNA探针通常与互补的目标序列杂交，且接着可使用(例如)可检测标记来检测。TaqMan探针在本领域中是已知的，且为具有附接至5'端的荧光染料及附接至3'端的淬灭体的多核苷酸。PCR中使用的聚合酶可裂解经杂交的探针，使荧光染料不受淬灭作用而使得可被检测到。分子信标探针在本领域是已知的，除了与目标序列杂交而将染料与淬灭体分开(而不是使用裂解将染料与淬灭体分离)，其与TaqMan探针相似。Scorpion探针在本领域中是已知的且与分子信标相似，除了其3'端还包含一个与引物的延伸产物的5'端互补的序列以打开杂交中的探针而使染料可被检测到。该多核苷酸探针优选为TaqMan探针。该多核苷酸探针优选为TaqMan探针并用于上述任何PCR方法中。

用于像FISH或断裂分离FISH的技术中的探针具有适宜长度且包含单可检测标记。FISH涉及已与间期染色体或中期染色体杂交的高特异性DNA探针的检测且使之可见，以便使用荧光显微镜进行检测。断裂分离FISH特别适合检测融合断点。在这种情况下，感兴趣的基因的两端以不同的颜色标记，当发生易位而产生融合物时，两种单独的颜色不会共定位，而会观察到两种原色。在具有正常拷贝数的经标记感兴趣基因的正常细胞中，这两种颜色会共定位而产生融合信号。

用于鉴定由细胞构成的融合多核苷酸的探针或引物可使用标准分子生物学技术来分离或纯化，或基于本文所述数据库纪录中的序列信息来合成。如本文所述的这类核酸分子可使用标准杂交和克隆技术(例如，Sambrook等编，Molecular Cloning:A LaboratoryManual,第二版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989中所述者)来分离。此外，可使用任何适宜标准分子生物技术来分离、纯化或合成融合多核苷酸。在一些实施方式中，引物或探针对于cDNA具有特异性。例如，在一些实施方式中，引物或探针对于cDNA中的外显子-外显子接合具有特异性。

“多核苷酸融合物”是指两个多核苷酸之间的共价键结连接，其中在融合接点的一侧存在来自一个基因的核苷酸序列，而在另一侧存在来自另一个基因的核苷酸序列。在多核苷酸融合物的上下文中，该连接以允许转录成蛋白质的方式而可操作地连接。在融合接点的其中一侧上，所述核苷酸序列优选为来自VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1，且另一侧上优选为来自NRG1。

“多肽融合物”是指两个氨基酸之间的共价键结连接，其中在融合接点的一侧存在来自一个多肽的氨基酸序列，而在另一侧存在来自另一个多肽的氨基酸序列。在融合接点的其中一侧上，所述氨基酸序列优选为来自VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1，且另一侧上优选为来自NRG1。

“融合配偶体”是指由于基因重排而已与NRG1基因或多肽发生融合的基因或多肽。在本公开中，该融合配偶体为VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1中的一者。一般地，该融合配偶体位于该NRG1基因的上游处(在有义链的5’端)，且框内融合而导致翻译为包含该融合配偶体的一部分与NRG1部分的嵌合蛋白。由于接合两个不同基因部分与融合多肽所导致的融合基因为来自这类融合基因的翻译产物。

“融合点”是指在氨基酸或核苷酸序列中有一侧出现NRG1序列且另一侧出现NRG1融合配偶体序列的位置。此为发生基因重排而形成嵌合基因、mRNA和/或蛋白序列的接点或位置。本文中的术语“融合点”可与“接点”或“融合接点”互换。

“位于3’处的基因序列”是指位于所指基因的下游或3’处且被认为是所述基因的一部分的任何组件(无论是否具调节性质)。本文中的调节组件包括增强子、沉默子、反应组件、内含子、外显子、内嵌启动子，且该组件对所涉基因具有特异性，使得可因为靠近该融合接点而以独特方式扩增及鉴定该融合物。此上下文中的位于3’处的基因序列也包括位于可用于独特地鉴定所涉融合物的任何调节组件之间的任何基因序列。

“位于5’处的基因序列”是指位于所指基因的下游或5’处且被认为是所述基因的一部分的任何组件(无论是否具调节性质)。本文中的调节组件包括启动子、增强子、沉默子、反应组件、内含子、外显子、内嵌启动子，且该组件对所涉基因具有特异性，使得可因为靠近该融合接点而以独特方式扩增及鉴定该融合物。此上下文中的位于5’处的基因序列也包括位于可用于独特地鉴定所涉融合物的任何调节组件之间的任何基因序列。

如本文中所使用，术语“ErbB-2”是指在人类中由ERBB-2基因编码的蛋白质。该基因或蛋白质的替代名称包括CD340；HER-2；HER-2/neu；MLN 19；NEU；NGL；TKR1。ERBB-2基因经常被称为HER2(出自人类表皮生长因子受体2)。当本文中引用ErbB-2时，该引用是指人类ErbB-2。包含结合ErbB-2的抗原结合部位的抗体与人类ErbB-2结合。ErbB-2抗原结合部位因在人类与其他哺乳动物异种同源物之间的序列及三级结构相似性而也可结合此类异种同源物，但不一定如此。人类ErbB-2蛋白及其编码基因的数据库登录号为(NP_001005862.1、NP_004439.2、NC_000017.10、NT_010783.15、NC_018928.2)。给予登录号主要是为了提供将ErbB-2识别为目标的进一步方法，结合抗体的ErbB-2蛋白的实际序列可有所变化，例如因为编码基因中的突变，诸如发生于一些癌症或类似者中的突变。ErbB-2抗原结合部位与ErbB-2及其各种变体结合，诸如由一些ErbB-2阳性肿瘤细胞所表达的。结合ErbB-2的抗原结合部位优选地与ErbB-2的结构域I结合。

如本文中所使用，术语“ErbB-3”是指在人类中由ERBB3基因编码的蛋白质。该基因或蛋白质的替代名称为HER3；LCCS2；MDA-BF-1；c-ErbB-3；c-ErbB3；ErbB3-S；p180-ErbB3；p45-sErbB3；和P85-sErbB3。当本文中引用ErbB-3时，该引用是指人类ErbB-3。包含结合ErbB-3的抗原结合部位的抗体与人类ErbB-3结合。ErbB-3抗原结合部位因在人类与其他哺乳动物异种同源物之间的序列及三级结构相似性而也可结合此类异种同源物，但不一定如此。人类ErbB-3蛋白及其编码基因之数据库登录号为(NP_001005915.1、NP_001973.2、NC_000012.11、NC_018923.2、NT_029419.12)。给予登录号主要是为了提供将ErbB-3识别为目标的进一步方法，抗体所结合的ErbB-3蛋白的实际序列可有所变化，例如因为编码基因中的突变，诸如发生于一些癌症或类似者中的突变。ErbB-3抗原结合部位与ErbB-3及其各种变体结合，诸如由一些ErbB-3阳性肿瘤细胞所表达的。结合ErbB-3的抗原结合部位优选地与ErbB-3的结构域III结合。

当引用ErbB-2或ErbB-3或其替代名称时，该引用是指人类ErbB-2或ErbB-3。本文中所引用的抗体结合至ErbB-2或ErbB-3及许多突变的ErbB-2或ErbB-3蛋白(如癌症中可发现的)。

本文所提及的SEQ ID NO的任意范围的数值明确包括落入相关范围内的全部的个别SEQ ID NO并包括其端值。因此，为避免疑虑，若(例如)引用SEQ ID NO:17-23，其意欲在所提及的SEQ ID NO范围的上下文中提及并公开SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22及SEQ ID NO:23。

条款

以下条款说明示例性实施方式。

1.一种多核苷酸，包含：VALB核酸序列或该VALB序列的等位基因变体，其与NRG1核酸序列或该NRG1序列的等位基因变体融合。

2.如条款1的多核苷酸，其中该VAPB核酸序列包含SEQ ID NO:17-23中的任一者或由其组成，或包含SEQ ID NO:17-23中的任一者的等位基因变体或由其组成，且该NRG1核酸序列包含SEQ ID NO:125-138中的任一者或由其组成。

3.如条款1或2的多核苷酸，其中该VALB核酸序列(或其等位基因变体)位于NRG1核酸序列(或其等位基因变体)的5’端。

4.如前述条款中的任一者的多核苷酸，其中该VAPB核酸序列的等位基因变体与SEQ ID NO:17-23中的任一者有至少85％的一致性，优选地至少90％的一致性，更优选地至少95％的序列一致性；且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85％的一致性，优选地至少90％的一致性，更优选地至少95％的序列一致性。

5.如前述条款中的任一者的多核苷酸，其中该VALB核酸与该NRG1核酸的融合物包含来自SEQ ID NO:3的2至约40个连续核酸，优选地包括位置102和103处的核酸

6.如前述条款中的任一者的多核苷酸，其中该编码NRG1蛋白序列(或其等位基因变体)的核酸包含或编码NRG1的EGF样结构域，优选为如SEQ ID NO:163的EGF样结构域。

7.一种多核苷酸，包含：

-PVALB核酸序列或该PVALB序列的等位基因变体，其与NRG1核酸序列或该NRG1序列的等位基因变体融合，或

-ASPH核酸序列或该ASPH序列的等位基因变体，其与NRG1核酸序列或该NRG1序列的等位基因变体融合，或

-DAAM1核酸序列或该DAAM1序列的等位基因变体，其与NRG1核酸序列或该NRG1序列的等位基因变体融合，或

-ZFAT核酸序列或该ZFAT序列的等位基因变体，其与NRG1核酸序列或该NRG1序列的等位基因变体融合，或

-DACAML1核酸序列或该DSCAML1序列的等位基因变体，其与NRG1核酸序列或该NRG1序列的等位基因变体融合。

8.如条款7的多核苷酸，其中

-该PVALB核酸序列包含SEQ ID NO:439-444中的任一者或由其组成，或包含SEQID NO:439-444中的任一者的等位基因变体或由其组成，且该NRG1核酸序列包含SEQ IDNO:125-138中的任一者或由其组成；

-该DAAM1核酸序列包含SEQ ID NO:606-631中的任一者或由其组成，或包含SEQID NO:606-631中的任一者的等位基因变体或由其组成，且该NRG1核酸序列包含SEQ IDNO:125-138中的任一者或由其组成；

-该ZFAT核酸序列包含SEQ ID NO:830-846中的任一者或由其组成，或包含SEQ IDNO:830-846中的任一者的等位基因变体或由其组成，且该NRG1核酸序列包含SEQ ID NO:125-138中的任一者或由其组成；或

-该DSCAML1核酸序列包含SEQ ID NO:870-903中的任一者或由其组成，或包含SEQID NO:870-903中的任一者的等位基因变体或由其组成，且该NRG1核酸序列包含SEQ IDNO:125-138中的任一者或由其组成。

9.如条款7或8的多核苷酸，其中该PVALB、DAAM1、ZFAT或DSCAML1核酸序列(或其等位基因变体)位于NRG1核酸序列(或其等位基因变体)的5’端。

10.如条款7-9中任一项的多核苷酸，其中

-该PVALB核酸序列的等位基因变体与SEQ ID NO:439-444中的任一者有至少85％的一致性，优选地至少90％的一致性，更优选地至少95％的序列一致性；且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85％的一致性，优选地至少90％的一致性，更优选地至少95％的序列一致性；

-该DAAM1核酸序列的等位基因变体与SEQ ID NO:606-631中的任一者有至少85％的一致性，优选地至少90％的一致性，更优选地至少95％的序列一致性；且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85％的一致性，优选地至少90％的一致性，更优选地至少95％的序列一致性；

-该ZFAT核酸序列的等位基因变体与SEQ ID NO:830-846中的任一者有至少85％的一致性，优选地至少90％的一致性，更优选地至少95％的序列一致性；且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85％的一致性，优选地至少90％的一致性，更优选地至少95％的序列一致性；或

-该DSCAML1核酸序列的等位基因变体与SEQ ID NO:870-903中的任一者有至少85％的一致性，优选地至少90％的一致性，更优选地至少95％的序列一致性；且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85％的一致性，优选地至少90％的一致性，更优选地至少95％的序列一致性。

11.如条款7至10中的任一项的多核苷酸，其中：

-该PVALB核酸与该NRG1核酸的融合物包含来自SEQ ID NO:437的2至约40个连续核酸，优选地包括位置102和103处的核酸；

-该DAAM1核酸与该NRG1核酸的融合物包含来自SEQ ID NO:605的2至约40个连续核酸，优选地包括位置75和76处的核酸；

-该ZFAT核酸与该NRG1核酸的融合物包含来自SEQ ID NO:828的2至约40个连续核酸，优选地包括位置75和76处的核酸；或

-该DSCAML1核酸与该NRG1核酸的融合物包含来自SEQ ID NO:868的2至约40个连续核酸，优选地包括位置75和76处的核酸。

12.如条款7至11中的任一项的多核苷酸，其中该编码NRG1蛋白序列(或其等位基因变体)的核酸包含或编码NRG1的EGF样结构域，优选为如SEQ ID NO:163的EGF样结构域。

13.一种多核苷酸，包含：

-VAPB的外显子1或外显子1的等位基因变体的一部分，其与NRG1的外显子2或外显子2的等位基因变体的一部分融合；

-CADM1的外显子7或外显子7的等位基因变体的一部分，与NRG1的外显子6或外显子6的等位基因变体的一部分；

-CD44的外显子5或外显子5的等位基因变体的一部分，与NRG1的外显子2或外显子2的等位基因变体的一部分；

-SLC3A2的转录本6的外显子1或外显子1的等位基因变体的一部分，与NRG1的外显子5或外显子5的等位基因变体的一部分；

-VTCN1的外显子2或外显子2的等位基因变体的一部分，与NRG1的外显子2或外显子2的等位基因变体的一部分；

-CDH1的外显子11或外显子11的等位基因变体的一部分，与NRG1的外显子2或外显子2的等位基因变体的一部分；

-CXADR的外显子1或外显子1的等位基因变体的一部分，与NRG1的外显子2或外显子2的等位基因变体的一部分；

-GTF2E2的外显子2或外显子2的等位基因变体的一部分，与NRG1的外显子2或外显子2的等位基因变体的一部分；

-CSMD1的外显子23或外显子23的等位基因变体的一部分，与NRG1的外显子6或外显子6的等位基因变体的一部分；

-PTN的外显子4或外显子4的等位基因变体的一部分，与NRG1的外显子2或外显子2的等位基因变体的一部分；

-ST14的外显子11或外显子11的等位基因变体的一部分，与NRG1的外显子6或外显子6的等位基因变体的一部分；

-THBS1的外显子9或外显子9的等位基因变体的一部分，与NRG1的外显子6或外显子6的等位基因变体的一部分；

-AGRN的外显子12或外显子12的等位基因变体的一部分，与NRG1的外显子6或外显子6的等位基因变体的一部分；

-PVALB的外显子4或外显子4的等位基因变体的一部分，与NRG1的外显子6或外显子6的等位基因变体的一部分；

-SLC3A2的转录本3的外显子2或外显子2的等位基因变体的一部分，与NRG1的外显子6或外显子6的等位基因变体的一部分；

-APP的外显子14或外显子14的等位基因变体的一部分，与NRG1的外显子6或外显子6的等位基因变体的一部分；

-WRN的外显子33或外显子33的等位基因变体的一部分，与NRG1的外显子6或外显子6的等位基因变体的一部分；

-DAAM1的外显子1或外显子1的等位基因变体的一部分，与NRG1的外显子1或外显子1的等位基因变体的一部分；

-ASPH的外显子22或外显子22的等位基因变体的一部分，与NRG1的外显子2或外显子2的等位基因变体的一部分；

-NOTCH2的外显子6或外显子6的等位基因变体的一部分，与NRG1的外显子6或外显子6的等位基因变体的一部分；

-CD74的外显子2或外显子2的等位基因变体的一部分，与NRG1的外显子2或外显子2的等位基因变体的一部分；

-SDC4的外显子2或外显子2的等位基因变体的一部分，与NRG1的外显子2或外显子2的等位基因变体的一部分；

-CD44的外显子5或外显子5的等位基因变体的一部分，与NRG1的外显子6或外显子6的等位基因变体的一部分；

-SLC4A4的外显子14或外显子14的等位基因变体的一部分，与NRG1的外显子6或外显子6的等位基因变体的一部分；

-SDC4的外显子4或外显子4的等位基因变体的一部分，与NRG1的外显子2或外显子2的等位基因变体的一部分；

-ZFAT的外显子12或外显子12的等位基因变体的一部分，与NRG1的外显子6或外显子6的等位基因变体的一部分；或

-DSCAML1的外显子3或外显子3的等位基因变体的一部分，与NRG1的外显子2或外显子2的等位基因变体的一部分。

14.如条款13的多核苷酸，其中VAPB的外显子1为SEQ ID NO:17的外显子；CADM1的外显子7为SEQ ID NO:39的外显子；CD44的外显子5为SEQ ID NO:65的外显子；SLC3A2的外显子1为SEQ ID NO:103的外显子；VTCN1的外显子2为SEQ ID NO:169的外显子；CDH1的外显子11为SEQ ID NO:198的外显子；CXADR的外显子1为SEQ ID NO:219的外显子；GTF2E2的外显子2为SEQ ID NO:236的外显子；CSMD1的外显子23为SEQ ID NO:279的外显子；PTN的外显子4为SEQ ID NO:318的外显子；ST14的外显子11为SEQ ID NO:342的外显子；THBS1的外显子9为SEQ ID NO:386的外显子；AGRN的外显子12为SEQ ID NO:416的外显子；PVALB的外显子4为SEQ ID NO:442的外显子；SLC3A2的外显子2为SEQ ID NO:457的外显子；APP的外显子14为SEQ ID NO:501的外显子；WRN的外显子33为SEQ ID NO:562的外显子；DAAM1的外显子1为SEQ ID NO:606的外显子；ASPH的外显子22为SEQ ID NO:658的外显子；NOTCH2的外显子6为SEQ ID NO:700的外显子；CD74的外显子2为SEQ ID NO:720的外显子；SDC4的外显子2为SEQ ID NO:746的外显子；CD44的外显子5为SEQ ID NO:65的外显子；SLC4A4的外显子14为SEQ ID NO:780的外显子；SDC4的外显子4为SEQ ID NO:748的外显子；ZFAT的外显子12为SEQ ID NO:841的外显子；DSCAML1的外显子3为SEQ ID NO:872的外显子，且NRG1的外显子1、2、5及6分别为SEQ ID NO:125、126、129和130的外显子。

15.如条款13或14中的任一项的多核苷酸，其中：

-该VAPB的外显子1或其等位基因变体的一部分位于该NRG1的外显子2或其等位基因变体的一部分的5’端；

-该CADM1的外显子7或其等位基因变体的一部分位于该NRG1的外显子6或其等位基因变体的一部分的5’端；

-该CD44的外显子5或其等位基因变体的一部分位于该NRG1的外显子2或其等位基因变体的一部分的5’端；

-该SLC3A2的外显子1或其等位基因变体的一部分位于该NRG1的外显子5或其等位基因变体的一部分的5’端；

-该VTCN1的外显子2或其等位基因变体的一部分位于该NRG1的外显子2或其等位基因变体的一部分的5’端；

-该CDH1的外显子11或其等位基因变体的一部分位于该NRG1的外显子2或其等位基因变体的一部分的5’端；

-该CXADR的外显子1或其等位基因变体的一部分位于该NRG1的外显子2或其等位基因变体的一部分的5’端；

-该GTF2E2的外显子2或其等位基因变体的一部分位于该NRG1的外显子2或其等位基因变体的一部分的5’端；

-该CSMD1的外显子23或其等位基因变体的一部分位于该NRG1的外显子6或其等位基因变体的一部分的5’端；

-该PTN的外显子4或其等位基因变体的一部分位于该NRG1的外显子2或其等位基因变体的一部分的5’端；

-该ST14的外显子11或其等位基因变体的一部分位于该NRG1的外显子6或其等位基因变体的一部分的5’端；

-该THBS1的外显子9或其等位基因变体的一部分位于该NRG1的外显子6或其等位基因变体的一部分的5’端；

-该AGRN的外显子12或其等位基因变体的一部分位于该NRG1的外显子6或其等位基因变体的一部分的5’端；

-该PVALB的外显子4或其等位基因变体的一部分位于该NRG1的外显子6或其等位基因变体的一部分的5’端；

-该SCL3A2的外显子2或其等位基因变体的一部分位于该NRG1的外显子6或其等位基因变体的一部分的5’端；

-该APP的外显子14或其等位基因变体的一部分位于该NRG1的外显子6或外显子6的等位基因变体部分的5’端；

-该WRN的外显子33或其等位基因变体的一部分位于该NRG1的外显子6或外显子6的等位基因变体部分的5’端；

-该DAAM1的外显子1或其等位基因变体的一部分位于该NRG1的外显子1或外显子1的等位基因变体部分的5’端；

-该ASPH的外显子22或其等位基因变体的一部分位于该NRG1的外显子2或外显子2的等位基因变体部分的5’端；

-该NOTCH2的外显子6或其等位基因变体的一部分位于该NRG1的外显子6或外显子6的等位基因变体部分的5’端；

-该CD74的外显子2或其等位基因变体的一部分位于该NRG1的外显子2或外显子2的等位基因变体部分的5’端；

-该SDC4的外显子2或其等位基因变体的一部分位于该NRG1的外显子2或外显子2的等位基因变体部分的5’端；

-该CD44的外显子5或其等位基因变体的一部分位于该NRG1的外显子6或外显子6的等位基因变体部分的5’端；

-该SLC4A4的外显子14或其等位基因变体的一部分位于该NRG1的外显子6或外显子6的等位基因变体部分的5’端；

-该SDC4的外显子4或其等位基因变体的一部分位于该NRG1的外显子2或外显子2的等位基因变体部分的5’端；

-该ZFAT的外显子12或其等位基因变体的一部分位于该NRG1的外显子6或外显子6的等位基因变体部分的5’端；及

-该DSCAML1的外显子3或其等位基因变体的一部分位于该NRG1的外显子2或外显子2的等位基因变体部分的5’端。

16.如条款13至15中的任一项的多核苷酸，其中：

-该VAPB的外显子1的等位基因变体与SEQ ID NO:17有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-CADM1该的外显子7的等位基因变体与SEQ ID NO:39有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该CD44的外显子5的等位基因变体与SEQ ID NO:65有至少85％的一致性，优选地与其有至少90％的一致性，更优选地有至少95％的一致性，或优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该SLC3A2的外显子1的等位基因变体与SEQ ID NO:103有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-VTCN1该的外显子2的等位基因变体与SEQ ID NO:169有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该CDH1的外显子11的等位基因变体与SEQ ID NO:198有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该NRG1的外显子2的等位基因变体与SEQ ID NO:126有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该NRG1的外显子5的等位基因变体与SEQ ID NO:129有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该NRG1的外显子6的等位基因变体与SEQ ID NO:130有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该CXADR的外显子1的等位基因变体与SEQ ID NO:219有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该GTF2E2的外显子2的等位基因变体与SEQ ID NO:236有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该CSMD1的外显子23的等位基因变体与SEQ ID NO:279有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该PTN的外显子4的等位基因变体与SEQ ID NO:318有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该ST14的外显子11的等位基因变体与SEQ ID NO:342有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该THBS1的外显子9的等位基因变体与SEQ ID NO:386有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该AGRN的外显子12的等位基因变体与SEQ ID NO:416有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该PVALB的外显子4的等位基因变体与SEQ ID NO:442有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该SCL3A2的外显子2的等位基因变体与SEQ ID NO:457有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该APP的外显子14的等位基因变体与SEQ ID NO:501有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该WRN的外显子33的等位基因变体与SEQ ID NO:562有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该DAAM1的外显子1的等位基因变体与SEQ ID NO:606有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该NRG1的外显子1的等位基因变体与SEQ ID NO:125有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该ASPH的外显子22的等位基因变体与SEQ ID NO:658有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该NOTCH2的外显子6的等位基因变体与SEQ ID NO:700有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该CD74的外显子2的等位基因变体与SEQ ID NO:720有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该SDC4的外显子2的等位基因变体与SEQ ID NO:746有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该CD44的外显子5的等位基因变体与SEQ ID NO:65有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该SLC4A4的外显子14的等位基因变体与SEQ ID NO:780有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该SDC4的外显子4的等位基因变体与SEQ ID NO:748有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-该ZFAT的外显子12的等位基因变体与SEQ ID NO:841有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；及

-该DSCAML1的外显子3的等位基因变体与SEQ ID NO:872有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

17.如条款13至16中的任一项的多核苷酸，其中：

-该VAPB与NRG1的融合物包含来自SEQ ID NO:3的2至约40个连续核酸，包括位置43和44处的核酸；

-该CADM1与NRG1的融合物包含来自SEQ ID NO:7的2至约40个连续核酸，包括位置53和54处的核酸；

-该CD44与NRG1的融合物包含来自SEQ ID NO:11的2至约40个连续核酸，包括位置52和53处的核酸；

-该SLC3A2与NRG1的融合物包含来自SEQ ID NO:15的2至约40个连续核酸，包括位置53和54处的核酸；

-该VTCN1与NRG1的融合物包含来自SEQ ID NO:166的2至约40个连续核酸，包括位置65和66处的核酸；

-该CDH1与NRG1的融合物包含来自SEQ ID NO:186的2至约40个连续核酸，包括位置119和120处的核酸；

-该CXADR与NRG1的融合物包含来自SEQ ID NO:217的2至约40个连续核酸，包括位置43和44处的核酸；

-该GTF2E2与NRG1的融合物包含来自SEQ ID NO:233的2至约40个连续核酸，包括位置141和142处的核酸；

-该CSMD1与NRG1的融合物包含来自SEQ ID NO:255的2至约40个连续核酸，包括位置88和89处的核酸；

-该PTN与NRG1的融合物包含来自SEQ ID NO:313的2至约40个连续核酸，包括位置102和103处的核酸；

-该ST14与NRG1的融合物包含来自SEQ ID NO:330的2至约40个连续核酸，包括位置95和96处的核酸；

-该THBS1与NRG1的融合物包含来自SEQ ID NO:376的2至约40个连续核酸，包括位置56和57处的核酸；

-该AGRN与NRG1的融合物包含来自SEQ ID NO:403的2至约40个连续核酸，包括位置106和107处的核酸；

-该PVALB与NRG1的融合物包含来自SEQ ID NO:437的2至约40个连续核酸，包括位置102和103处的核酸；

-该SLC3A2与NRG1的融合物包含来自SEQ ID NO:454的2至约40个连续核酸，包括位置93和94处的核酸；

-该APP与NRG1的融合物包含来自SEQ ID NO:486的2至约40个连续核酸，包括位置54和55处的核酸；

-该WRN与NRG1的融合物包含来自SEQ ID NO:528的2至约40个连续核酸，包括位置96和97处的核酸；

-该DAAM1与NRG1的融合物包含来自SEQ ID NO:605的2至约40个连续核酸，包括位置75和76处的核酸；

-该ASPH与NRG1的融合物包含来自SEQ ID NO:635的2至约40个连续核酸，包括位置75和76处的核酸；

-该NOTCH2与NRG1的融合物包含来自SEQ ID NO:693的2至约40个连续核酸，包括位置75和76处的核酸；

-该CD74与NRG1的融合物包含来自SEQ ID NO:717的2至约40个连续核酸，包括位置75和76处的核酸；

-该SDC4与NRG1的融合物包含来自SEQ ID NO:743的2至约40个连续核酸，包括位置75和76处的核酸；

-该CD44与NRG1的融合物包含来自SEQ ID NO:761的2至约40个连续核酸，包括位置75和76处的核酸；

-该SLC4A4与NRG1的融合物包含来自SEQ ID NO:765的2至约40个连续核酸，包括位置75和76处的核酸；

-该SDC4与NRG1的融合物包含来自SEQ ID NO:824的2至约40个连续核酸，包括位置75和76处的核酸；

-该ZFAT与NRG1的融合物包含来自SEQ ID NO:828的2至约40个连续核酸，包括位置75和76处的核酸；以及

-该DSCAML1与NRG1的融合物包含来自SEQ ID NO:868的2至约40个连续核酸，包括位置75和76处的核酸。

18.如条款13至17中的任一项的多核苷酸，其中：

-该VAPB与NRG1的融合物包含SEQ ID NO:3或其等位基因变体；

-该CAD1与NRG1的融合物包含SEQ ID NO:7或其等位基因变体；

-该CD44与NRG1的融合物包含SEQ ID NO:11或其等位基因变体；

-该SLC3A2与NRG1的融合物包含SEQ ID NO:15或其等位基因变体；

-该VTCN1与NRG1的融合物包含SEQ ID NO:166或其等位基因变体；

-该CDH1与NRG1的融合物包含SEQ ID NO:186或其等位基因变体；

-该CXADR与NRG1的融合物包含SEQ ID NO:217或其等位基因变体；

-该GTF2E2与NRG1的融合物包含SEQ ID NO:233或其等位基因变体；

-该CSMD1与NRG1的融合物包含SEQ ID NO:255或其等位基因变体；

-该PTN与NRG1的融合物包含SEQ ID NO:313或其等位基因变体；

-该ST14与NRG1的融合物包含SEQ ID NO:330或其等位基因变体；

-该THBS1与NRG1的融合物包含SEQ ID NO:376或其等位基因变体；

-该AGRN与NRG1的融合物包含SEQ ID NO:403或其等位基因变体；

-该PVALB与NRG1的融合物包含SEQ ID NO:437或其等位基因变体；

-该SLC3A2与NRG1的融合物包含SEQ ID NO:454或其等位基因变体；

-该APP与NRG1的融合物包含SEQ ID NO:486或其等位基因变体；

-该WRN与NRG1的融合物包含SEQ ID NO:528或其等位基因变体；

-该DAAM1与NRG1的融合物包含SEQ ID NO:605或其等位基因变体；

-该ASPH与NRG1的融合物包含SEQ ID NO:635或其等位基因变体；

-该NOTCH2与NRG1的融合物包含SEQ ID NO:693或其等位基因变体；

-该CD74与NRG1的融合物包含SEQ ID NO:717或其等位基因变体；

-该SDC4与NRG1的融合物包含SEQ ID NO:743或其等位基因变体；

-该CD44与NRG1的融合物包含SEQ ID NO:761或其等位基因变体；

-该SLC4A4与NRG1的融合物包含SEQ ID NO:765或其等位基因变体；

-该SDC4与NRG1的融合物包含SEQ ID NO:824或其等位基因变体；

-该ZFAT与NRG1的融合物包含SEQ ID NO:828或其等位基因变体；及

-该DSCAML1与NRG1的融合物包含SEQ ID NO:868或其等位基因变体。

19.如条款13至18中的任一项的多核苷酸，其中：

-该VAPB的外显子1的一部分是或包含SEQ ID NO:1或SEQ ID NO:1的等位基因变体；

-该CADM1的外显子7的一部分是或包含SEQ ID NO:5或SEQ ID NO:5的等位基因变体；

-该CD44的外显子5的一部分是或包含SEQ ID NO:9或SEQ ID NO:9的等位基因变体；

-该SLC3A2的外显子1的一部分是或包含SEQ ID NO:13或SEQ ID NO:13的等位基因变体；

-该VTCN1的外显子2的一部分是或包含SEQ ID NO:164或SEQ ID NO:164的等位基因变体；

-该CDH1的外显子11的一部分是或包含SEQ ID NO:184或SEQ ID NO:184的等位基因变体；

-该CXADR的外显子1的一部分是或包含SEQ ID NO:219或SEQ ID NO:219的等位基因变体；

-该GTF2E2的外显子2的一部分是或包含SEQ ID NO:236或SEQ ID NO:236的等位基因变体；

-该CXADR的外显子23的一部分是或包含SEQ ID NO:279或SEQ ID NO:279的等位基因变体；

-该PTN的外显子4的一部分是或包含SEQ ID NO:318或SEQ ID NO:318的等位基因变体；

-该ST14的外显子11的一部分是或包含SEQ ID NO:342或SEQ ID NO:342的等位基因变体；

-该THBS1的外显子9的一部分是或包含SEQ ID NO:385或SEQ ID NO:386的等位基因变体；

-该AGRN的外显子12的一部分是或包含SEQ ID NO:416或SEQ ID NO:416的等位基因变体；

-该PVALB的外显子4的一部分是或包含SEQ ID NO:442或SEQ ID NO:442的等位基因变体；

-该SLC3A2的外显子2的一部分是或包含SEQ ID NO:457或SEQ ID NO:457的等位基因变体；

-该NRG1的外显子2的一部分是或包含SEQ ID NO:165或SEQ ID NO:165的等位基因变体；

-该NRG1的外显子5的一部分是或包含SEQ ID NO:14或SEQ ID NO:14的等位基因变体；

-该NRG1的外显子6的一部分是或包含SEQ ID NO:6或其等位基因变体；

-该APP的外显子14的一部分是或包含SEQ ID NO:484或其等位基因变体；

-该WRN的外显子33的一部分是或包含SEQ ID NO:526或其等位基因变体；

-该DAAM1的外显子1的一部分是或包含SEQ ID NO:603或其等位基因变体；

-该ASPH的外显子22的一部分是或包含SEQ ID NO:633或其等位基因变体；

-该NOTCH2的外显子6的一部分是或包含SEQ ID NO:691或其等位基因变体；

-该CD74的外显子2的一部分是或包含SEQ ID NO:715或其等位基因变体；

-该SDC4的外显子2的一部分是或包含SEQ ID NO:741或其等位基因变体；

-该CD44的外显子5的一部分是或包含SEQ ID NO:759或其等位基因变体；

-该SLC4A4的外显子14的一部分是或包含SEQ ID NO:763或其等位基因变体；

-该SDC4的外显子4的一部分是或包含SEQ ID NO:822或其等位基因变体；

-该ZFAT的外显子12的一部分是或包含SEQ ID NO:826或其等位基因变体；

-该DSCAML1的外显子3的一部分是或包含SEQ ID NO:866或其等位基因变体；及

-该NRG1的外显子1的一部分是或包含SEQ ID NO:604或其等位基因变体。

20.如条款13至18中的任一项的多核苷酸，其中：

-VAPB与NRG1的融合物包含在VAPB的外显子1与NRG1的外显子2之间的融合接点，优选为SEQ ID NO:3的VAPB位置43的核酸与NRG1位置44的核酸之间的接点；

-CADM1与NRG1的融合物包含在CADM1的外显子7与NRG1的外显子6之间的融合接点，优选为SEQ ID NO:7的CADM1位置53的核酸与NRG1位置54的核酸之间的接点；

-CD44与NRG1的融合物包含在CD44的外显子5与NRG1的外显子2之间的融合接点，优选为SEQ ID NO:11的CD44位置52的核酸与NRG1位置53的核酸之间的接点；

-SLC3A2与NRG1的融合物包含在SLC3A2的外显子1与NRG1的外显子5之间的融合接点，优选为SEQ ID NO:15的SLC3A2位置53的核酸与NRG1位置54的核酸之间的接点；

-VTCN1与NRG1的融合物包含在VTCN1的外显子2与NRG1的外显子2之间的融合接点，优选为SEQ ID NO:166的VTCN1位置65的核酸与NRG1位置66的核酸之间的接点；

-CDH1与NRG1的融合物包含在CDH1的外显子11与NRG1的外显子2之间的融合接点，优选为SEQ ID NO:186的CDH1位置119的核酸与NRG1位置120的核酸之间的接点；

-CXADR与NRG1的融合物包含在CXADR的外显子1与NRG1的外显子2之间的融合接点，优选为SEQ ID NO:217的CXADR位置43的核酸与NRG1位置44的核酸之间的接点；

-GTF2E2与NRG1的融合物包含在GTF2E2的外显子2与NRG1的外显子2之间的融合接点，优选为SEQ ID NO:233的GTF2E2位置141的核酸与NRG1位置142的核酸之间的接点；

-CSMD1与NRG1的融合物包含在CSMD1的外显子23与NRG1的外显子6之间的融合接点，优选为SEQ ID NO:255的CSMD1位置88的核酸与NRG1位置89的核酸之间的接点；

-PTN与NRG1的融合物包含在PTN的外显子4与NRG1的外显子2之间的融合接点，优选为SEQ ID NO:313的PTN位置102的核酸与NRG1位置103的核酸之间的接点；

-ST14与NRG1的融合物包含在ST14的外显子11与NRG1的外显子6之间的融合接点，优选为SEQ ID NO:330的ST14位置95的核酸与NRG1位置96的核酸之间的接点；

-THBS1与NRG1的融合物包含在THBS1的外显子9与NRG1的外显子6之间的融合接点，优选为SEQ ID NO:376的THBS1位置56的核酸与NRG1位置57的核酸之间的接点；

-AGRN与NRG1的融合物包含在AGRN的外显子12与NRG1的外显子6之间的融合接点，优选为SEQ ID NO:403的AGRN位置106的核酸与NRG1位置107的核酸之间的接点；

-PVALB与NRG1的融合物包含在PVALB的外显子4与NRG1的外显子6之间的融合接点，优选为SEQ ID NO:437的PVALB位置102的核酸与NRG1位置103的核酸之间的接点；

-SLC3A2与NRG1的融合物包含在SLC3A2的外显子2与NRG1的外显子6之间的融合接点，优选为SEQ ID NO:454的SLC3A2位置93的核酸与NRG1位置94的核酸之间的接点；

-APP与NRG1的融合物包含在APP的外显子14与NRG1的外显子6之间的融合接点，优选为SEQ ID NO:486的APP位置54的核酸与NRG1位置55的核酸之间的接点；

-WRN与NRG1的融合物包含在WRN的外显子33与NRG1的外显子6之间的融合接点，优选为SEQ ID NO:528的WRN位置96的核酸与NRG1位置97的核酸之间的接点；

-DAAM1与NRG1的融合物包含在DAAM1的外显子1与NRG1的外显子1之间的融合接点，优选为SEQ ID NO:605的DAAM1位置的核酸75与NRG1位置的核酸76之间的接点；

-ASPH与NRG1的融合物包含在ASPH的外显子22与NRG1的外显子2之间的融合接点，优选为SEQ ID NO:635的ASPH位置75的核酸与NRG1位置76的核酸之间的接点；

-NOTCH2与NRG1的融合物包含在NOTCH2的外显子6与NRG1的外显子6之间的融合接点，优选为SEQ ID NO:693的NOTCH2位置75的核酸与NRG1位置76的核酸之间的接点；

-CD74与NRG1的融合物包含在CD74的外显子2与NRG1的外显子2之间的融合接点，优选为SEQ ID NO:717的CD74位置75的核酸与NRG1位置76的核酸之间的接点；

-SDC4与NRG1的融合物包含在SDC4的外显子2与NRG1的外显子2之间的融合接点，优选为SEQ ID NO:743的SDC4位置75的核酸与NRG1位置76的核酸之间的接点；

-CD44与NRG1的融合物包含在CD44的外显子5与NRG1的外显子6之间的融合接点，优选为SEQ ID NO:761的VAPB位置75的核酸与NRG1位置76的核酸之间的接点；

-SLC4A4与NRG1的融合物包含在SLC4A4的外显子14与NRG1的外显子6之间的融合接点，优选为SEQ ID NO:765的SLC4A4位置75的核酸与NRG1位置76的核酸之间的接点；

-SDC4与NRG1的融合物包含在SDC4的外显子4与NRG1的外显子2之间的融合接点，优选为SEQ ID NO:824的SDC4位置75的核酸与NRG1位置76的核酸之间的接点；

-ZFAT与NRG1的融合物包含在ZFAT的外显子12与NRG1的外显子6之间的融合接点，优选为SEQ ID NO:828的ZFAT位置75的核酸与NRG1位置76的核酸之间的接点；及

-DSCAML1与NRG1的融合物包含在DSCAML1的外显子3与NRG1的外显子2之间的融合接点，优选为SEQ ID NO:868的DSCAML1位置75的核酸与NRG1位置76的核酸之间的接点。

21.如前述条款中的任一者的多核苷酸，其中该多核苷酸被分离或纯化。

22.如前述条款中的任一者的多核苷酸，其中融合物中的任一者为框内融合。

23.如前述条款中的任一者的多核苷酸，其中该多核苷酸为哺乳动物多核苷酸，优选为人类多核苷酸。

24.一种由如前述条款中的任一者的多核苷酸所编码的多肽融合物。

25.一种包含如条款1至23中任一项的多核苷酸的载体。

26.一种包含如条款1至23中任一项的多核苷酸或如条款25的载体的重组宿主细胞。

27.一种制造如条款24的多肽融合物的方法，包含将如条款26的宿主细胞维持在适合该宿主细胞所包含的多核苷酸表达的条件下，从而表达该多核苷酸且产生多肽融合物，随后分离或纯化该多肽融合物。

28.一种制造重组宿主细胞的方法，包含将如条款25的载体导入宿主细胞内。

29.一种检测测定法，其包含用于检测如条款1至23中的任一项的多核苷酸融合物的存在的核酸探针、引物或引物对。

30.一种用于检测如条款1至23中任一项的多核苷酸融合物的核酸探针、引物或引物对。

31.如条款30的核酸探针、引物或引物对，其长度为10至40个核苷酸。

32.如条款30或31的核酸探针、引物或引物对，其中所检测到的融合物包含：

-VAPB与NRG1的融合物，包含SEQ ID NO:3或由其组成，且优选地包括位置43或44的核酸；

-CADM1与NRG1的融合物，包含SEQ ID NO:7或由其组成，且优选地包括位置53或54的核酸；

-CD44与NRG1的融合物，包含SEQ ID NO:11或由其组成，且优选地包括位置52或53的核酸；

-SLC3A2与NRG1的融合物，包含SEQ ID NO:15或由其组成，且优选地包括位置53或54的核酸；

-VTCN1与NRG1的融合物，包含SEQ ID NO:166或由其组成，且优选地包括位置65或66的核酸；

-CDH1与NRG1的融合物，包含SEQ ID NO:186或由其组成，且优选地包括位置119或120的核酸；

-CXADR与NRG1的融合物，包含SEQ ID NO:217或由其组成，且优选地包括位置43或44的核酸；

-GTF2E2与NRG1的融合物，包含SEQ ID NO:233或由其组成，且优选地包括位置141或142的核酸；

-CSMD1与NRG1的融合物，包含SEQ ID NO:255或由其组成，且优选地包括位置88或89的核酸；

-PTN与NRG1的融合物，包含SEQ ID NO:313或由其组成，且优选地包括位置102或103的核酸；

-ST14与NRG1的融合物，包含SEQ ID NO:330或由其组成，且优选地包括位置95或96的核酸；

-THBS1与NRG1的融合物，包含SEQ ID NO:376或由其组成，且优选地包括位置56或57的核酸；

-AGRN与NRG1的融合物，包含SEQ ID NO:403或由其组成，且优选地包括位置106或107的核酸；

-PVALB与NRG1的融合物，包含SEQ ID NO:437或由其组成，且优选地包括位置102或103的核酸；

-SLC3A2与NRG1的融合物，包含SEQ ID NO:454或由其组成，且优选地包括位置93或94的核酸；

-APP与NRG1的融合物，包含SEQ ID NO:486或由其组成，且优选地包括位置54或55的核酸；

-WRN与NRG1的融合物，包含SEQ ID NO:528或由其组成，且优选地包括位置96或97的核酸；

-DAAM1与NRG1的融合物，包含SEQ ID NO:605或由其组成，且优选地包括位置75或76的核酸；

-ASPH与NRG1的融合物，包含SEQ ID NO:635或由其组成，且优选地包括位置75或76的核酸；

-NOTCH2与NRG1的融合物，包含SEQ ID NO:693或由其组成，且优选地包括位置75或76的核酸；

-CD74与NRG1的融合物，包含SEQ ID NO:717或由其组成，且优选地包括位置75或76的核酸；

-SDC4与NRG1的融合物，包含SEQ ID NO:743或由其组成，且优选地包括位置75或76的核酸；

-CD44与NRG1的融合物，包含SEQ ID NO:761或由其组成，且优选地包括位置75或76的核酸；

-SLC4A4与NRG1的融合物，包含SEQ ID NO:765或由其组成，且优选地包括位置75或76的核酸；

-SDC4与NRG1的融合物，包含SEQ ID NO:824或由其组成，且优选地包括位置75或76的核酸；

-ZFAT与NRG1的融合物，包含SEQ ID NO:828或由其组成，且优选地包括位置75或76的核酸；以及

-DSCAML1与NRG1的融合物，包含SEQ ID NO:868或由其组成，且优选地包括位置75或76的核酸。

33.如条款30至32中任一项的核酸探针、引物或引物对，其中：

-用于检测VAPB与NRG1的融合物的探针、引物或引物对特异性地与由VAPB的外显子1所组成的序列或位于外显子1的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测CADM1与NRG1的融合物的探针、引物或引物对特异性地与由CADM1的外显子7所组成的序列或位于外显子7的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测CD44与NRG1的融合物的探针、引物或引物对特异性地与由CD44的外显子5所组成的序列或位于外显子5的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测SLC3A2的转录本6与NRG1的融合物的探针、引物或引物对特异性地与由SLC3A2的外显子1所组成的序列或位于外显子1的5’处的序列杂交，和/或特异性地与由NRG1的外显子5所组成的序列或位于外显子5的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测VTCN1与NRG1的融合物的探针、引物或引物对特异性地与由VTCN1的外显子2所组成的序列或位于外显子2的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测CDH1与NRG1的融合物的探针、引物或引物对特异性地与由CDH1的外显子11所组成的序列或位于外显子11的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测CXADR与NRG1的融合物的探针、引物或引物对特异性地与由CXADR的外显子1所组成的序列或位于外显子1的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测GTF2E2与NRG1的融合物的探针、引物或引物对特异性地与由GTF2E2的外显子2所组成的序列或位于外显子2的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测CSMD1与NRG1的融合物的探针、引物或引物对特异性地与由CSMD1的外显子23所组成的序列或位于外显子23的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测PTN与NRG1的融合物的探针、引物或引物对特异性地与由PTN的外显子4所组成的序列或位于外显子4的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测ST14与NRG1的融合物的探针、引物或引物对特异性地与由ST14的外显子11所组成的序列或位于外显子11的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测THBS1与NRG1的融合物的探针、引物或引物对特异性地与由THBS1的外显子9所组成的序列或位于外显子9的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测AGRN与NRG1的融合物的探针、引物或引物对特异性地与由AGRN的外显子12所组成的序列或位于外显子12的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测PVALB与NRG1的融合物的探针、引物或引物对特异性地与由PVALB的外显子4所组成的序列或位于外显子4的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测SLC3A2的转录本3与NRG1的融合物的探针、引物或引物对特异性地与由SLC3A2的外显子2所组成的序列或位于外显子2的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测APP与NRG1的融合物的探针、引物或引物对特异性地与由APP的外显子14所组成的序列或位于外显子14的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测WRN与NRG1的融合物的探针、引物或引物对特异性地与由WRN的外显子33所组成的序列或位于外显子33的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测DAAM1与NRG1的融合物的探针、引物或引物对特异性地与由DAAM1的外显子1所组成的序列或位于外显子1的5’处的序列杂交，和/或特异性地与由NRG1的外显子1所组成的序列或位于外显子1的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测ASPH与NRG1的融合物的探针、引物或引物对特异性地与由ASPH的外显子22所组成的序列或位于外显子22的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测NOTCH2与NRG1的融合物的探针、引物或引物对特异性地与由NOTCH2的外显子6所组成的序列或位于外显子6的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测CD74与NRG1的融合物的探针、引物或引物对特异性地与由CD74的外显子2所组成的序列或位于外显子2的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测SDC4与NRG1的融合物的探针、引物或引物对特异性地与由SDC4的外显子2所组成的序列或位于外显子2的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测CD44与NRG1的融合物的探针、引物或引物对特异性地与由CD44的外显子5所组成的序列或位于外显子5的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测SLC4A4与NRG1的融合物的探针、引物或引物对特异性地与由SLC4A4的外显子14所组成的序列或位于外显子14的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测SDC4与NRG1的融合物的探针、引物或引物对特异性地与由SDC4的外显子4所组成的序列或位于外显子4的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测ZFAT与NRG1的融合物的探针、引物或引物对特异性地与由ZFAT的外显子12所组成的序列或位于外显子12的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；或

-用于检测DSCAML1与NRG1的融合物的探针、引物或引物对特异性地与由DSCAML1的外显子3所组成的序列或位于外显子3的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性。

34.如条款33的核酸探针、引物或引物对，其中：

-来自VAPB的外显子1包含SEQ ID NO:17或其等位基因变体，或是由其组成；

-来自CADM1的外显子7包含SEQ ID NO:39或其等位基因变体，或是由其组成；

-来自CD44的外显子5包含SEQ ID NO:65或其等位基因变体，或是由其组成；

-来自SLC3A2的外显子1包含SEQ ID NO:103或其等位基因变体，或是由其组成；

-来自VTCN1的外显子2包含SEQ ID NO:169或其等位基因变体，或是由其组成；

-来自CDH1的外显子11包含SEQ ID NO:198或其等位基因变体，或是由其组成；

-来自CXADR的外显子1包含SEQ ID NO:219或其等位基因变体，或是由其组成；

-来自GTF2E2的外显子2包含SEQ ID NO:236或其等位基因变体，或是由其组成；

-来自CSMD1的外显子23包含SEQ ID NO:279或其等位基因变体，或是由其组成；

-来自PTN的外显子4包含SEQ ID NO:318或其等位基因变体，或是由其组成；

-来自ST14的外显子11包含SEQ ID NO:342或其等位基因变体，或是由其组成；

-来自THBS1的外显子9包含SEQ ID NO:386或其等位基因变体，或是由其组成；

-来自AGRN的外显子12包含SEQ ID NO:416或其等位基因变体，或是由其组成；

-来自PVALB的外显子4包含SEQ ID NO:442或其等位基因变体，或是由其组成；

-来自SLC3A2的外显子2包含SEQ ID NO:457或其等位基因变体，或是由其组成；

-来自APP的外显子14包含SEQ ID NO:501或其等位基因变体，或是由其组成；

-来自WRN的外显子33包含SEQ ID NO:562或其等位基因变体，或是由其组成；

-来自DAAM1的外显子1包含SEQ ID NO:606或其等位基因变体，或是由其组成；

-来自ASPH的外显子22包含SEQ ID NO:658或其等位基因变体，或是由其组成；

-来自NOTCH2的外显子6包含SEQ ID NO:700或其等位基因变体，或是由其组成；

-来自CD74的外显子2包含SEQ ID NO:720或其等位基因变体，或是由其组成；

-来自SDC4的外显子2包含SEQ ID NO:746或其等位基因变体，或是由其组成；

-来自SLC4A4的外显子14包含SEQ ID NO:780或其等位基因变体，或是由其组成；

-来自SDC4的外显子4包含SEQ ID NO:748或其等位基因变体，或是由其组成；

-来自ZFAT的外显子12包含SEQ ID NO:841或其等位基因变体，或是由其组成；

-来自DSCAML1的外显子3包含SEQ ID NO:872或其等位基因变体，或是由其组成；以及

-来自NRG1的外显子1、2、5及6分别包含SEQ ID NO:125、126、129和130或其等位基因变体，或是由其组成。

35.如条款33的核酸探针、引物或引物对，其中：

-用于检测VAPB与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:17所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测CADM1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:57所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测CD44与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:99所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测SLC3A2与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:103所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:157所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测VTCN1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:181所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测CDH1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:213所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测CXADR与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:219所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测GTF2E2与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:252所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测CSMD1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:309所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测PTN与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:326所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测ST14与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:372所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测THBS1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:399所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测AGRN与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:433所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测PVALB与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:450所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测SLC3A2与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:482所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测APP与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:524所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测WRN与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:601所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测DAAM1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:606所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:138所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测ASPH与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:689所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测NOTCH2与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:713所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测CD74与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:739所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测SDC4与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:757所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测CD44与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:99所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测SLC4A4与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:820所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测SDC4与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:940所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测ZFAT与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:864所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；及

-用于检测DSCAML1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:938所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性。

36.一种用于原位杂交测定法以检测如条款1至23中任一项的多核苷酸融合物的第一核酸探针和第二核酸探针，

-其中该第一探针特异性地与位于SEQ ID NO:3的位置43的核酸5’处的VAPB序列杂交，且该第二探针特异性地与位于SEQ ID NO:3的位置44的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:7的位置53的核酸5’处的CADM1序列杂交，且该第二探针特异性地与位于SEQ ID NO:7的位置54的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:11的位置52的核酸5’处的CD44序列杂交，且该第二探针特异性地与位于SEQ ID NO:11的位置53的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:15的位置53的核酸5’处的SLC3A2序列杂交，且该第二探针特异性地与位于SEQ ID NO:15的位置54的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:166的位置65的核酸5’处的VTCN1序列杂交，且该第二探针特异性地与位于SEQ ID NO:166的位置66的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:186的位置119的核酸5’处的CDH1序列杂交，且该第二探针特异性地与位于SEQ ID NO:186的位置120的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:217的位置43的核酸5’处的CXADR序列杂交，且该第二探针特异性地与位于SEQ ID NO:217的位置44的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:233的位置141的核酸5’处的GTF2E2序列杂交，且该第二探针特异性地与位于SEQ ID NO:233的位置142的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:255的位置88的核酸5’处的CSMD1序列杂交，且该第二探针特异性地与位于SEQ ID NO:255的位置89的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:313的位置102的核酸5’处的PTN序列杂交，且该第二探针特异性地与位于SEQ ID NO:313的位置103的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:330的位置95的核酸5’处的ST14序列杂交，且该第二探针特异性地与位于SEQ ID NO:330的位置96的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:376的位置56的核酸5’处的THBS1序列杂交，且该第二探针特异性地与位于SEQ ID NO:376的位置57的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:403的位置106的核酸5’处的AGRN序列杂交，且该第二探针特异性地与位于SEQ ID NO:403的位置107的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:437的位置102的核酸5’处的PVALB序列杂交，且该第二探针特异性地与位于SEQ ID NO:437的位置103的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:454的位置93的核酸5’处的SLC3A2序列杂交，且该第二探针特异性地与位于SEQ ID NO:454的位置94的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:486的位置54的核酸5’处的APP序列杂交，且该第二探针特异性地与位于SEQ ID NO:486的位置55的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:528的位置96的核酸5’处的WRN序列杂交，且该第二探针特异性地与位于SEQ ID NO:528的位置97的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:605的位置75的核酸5’处的DAAM1序列杂交，且该第二探针特异性地与位于SEQ ID NO:605的位置76的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:635的位置75的核酸5’处的ASPH序列杂交，且该第二探针特异性地与位于SEQ ID NO:635的位置76的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:693的位置75的核酸5’处的NOTCH2序列杂交，且该第二探针特异性地与位于SEQ ID NO:693的位置76的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:717的位置75的核酸5’处的CD74序列杂交，且该第二探针特异性地与位于SEQ ID NO:717的位置76的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:743的位置75的核酸5’处的SDC4序列杂交，且该第二探针特异性地与位于SEQ ID NO:743的位置76的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:761的位置75的核酸5’处的CD44序列杂交，且该第二探针特异性地与位于SEQ ID NO:761的位置76的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:765的位置75的核酸5’处的SLC4A4序列杂交，且该第二探针特异性地与位于SEQ ID NO:765的位置76的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:824的位置75的核酸5’处的SDC4序列杂交，且该第二探针特异性地与位于SEQ ID NO:824的位置76的核酸3’处的NRG1序列杂交；

-其中该第一探针特异性地与位于SEQ ID NO:828的位置75的核酸5’处的ZFAT序列杂交，且该第二探针特异性地与位于SEQ ID NO:828的位置76的核酸3’处的NRG1序列杂交；或

-其中该第一探针特异性地与位于SEQ ID NO:868的位置75的核酸5’处的DSCAML1序列杂交，且该第二探针特异性地与位于SEQ ID NO:868的位置76的核酸3’处的NRG1序列杂交。

37.一种用于检测如条款1至23中任一项的多核苷酸融合物所编码的多肽的第一抗体或第一与第二抗体组。

38.一种包含用于检测如条款1至23中任一项的多核苷酸融合物所编码的多肽的存在的第一抗体或第一与第二抗体组的检测测定法，其中该第一抗体或第一与第二抗体组优选为如条款34的第一抗体或第一与第二抗体组。

39.如条款38的第一抗体或第一与第二抗体组，或如条款32的检测测定法，其中该第一抗体结合选自VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1或DSCAML1-NRG1的多肽融合物，而该第一与第二抗体组分别结合VAPB与NRG1或CADM1与NRG1、或CD44与NRG1、SLC3A2与NRG1、CDH1与NRG1、CXADR与NRG1、GTF2E2与NRG1、CSMD1与NRG1、PTN与NRG1、ST14与NRG1、THBS1与NRG1、AGRN与NRG1、PVALB与NRG1、APP与NRG1、WRN与NRG1、ASPH与NRG1、NOTCH2与NRG1、CD74与NRG1、SDC4与NRG1、SLC4A4与NRG1、ZFAT与NRG1、或DSCAML1与NRG1。

40.一种用于鉴定样本中的如条款1至23中任一项的多核苷酸融合物、或由其所编码的多肽的方法，所述方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。

41.一种用于检测样本中的如条款1至23中任一项的多核苷酸融合物、或由其所编码的多肽是否存在的方法，所述方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。

42.一种用于确定来自受试者的异常细胞是否包含如条款1至23中任一项的融合物、或由其所编码的多肽的方法，所述方法包括检验获自该受试者的异常细胞的多核苷酸或多肽内容物是否在样本中存在该融合物。

43.一种鉴定受试者携带如条款1至23中任一项的多核苷酸融合物、或由其所编码的多肽的方法，所述方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。

44.如条款37至40中任一项的方法，其中该检验包含利用诸如条款31至36中任一项的核酸探针、引物或引物对的结合剂特异性地结合该多核苷酸或由其所编码的多肽以检测该融合物，或利用结合包含该多核苷酸融合物的多核苷酸的结合剂以检测该融合物。

45.如条款40至44中任一项的方法，其中该检验包含扩增或检测用于区别该多核苷酸融合物或由其所编码的多肽是否存在的序列。

46.如条款41至45中任一项的方法，其中该多核苷酸融合物获自一会表达包含NRG1的EGF样结构域的多核苷酸融合物的异常细胞。

47.如条款40至46中任一项的方法，其中该方法包括从受试者获得样本的步骤，随后为从该样本中分离该多核苷酸或由其所编码的多肽的步骤。

48.如条款40至47中任一项的方法，其中该方法包括从该样本纯化或分离该多核苷酸的步骤。

49.如条款40至48中任一项的方法，其中该结合剂是或包含引物、引物对、探针或抗体。

50.如条款40至49中任一项的方法，其中该检验为离体(ex vivo)方法，优选为体外(in vitro)方法。

51.如条款40至50中任一项的方法，其中该结合剂包含或与可检测标记相关联。

52.如条款40至51中任一项的方法，其中该样本为液态活检样本或固态样本，诸如经福尔马林固定的石蜡包埋组织(FFPE)样本。

53.如条款40至52中任一项的方法，其中该样本包含血液、血清、血浆、胸水、尿液、精液、羊水或腹水。

54.如条款40至53中任一项的方法，其中该样本包含变异细胞，诸如肿瘤细胞或癌细胞，或其多核苷酸或多肽内容物。

55.一种治疗患有包含多核苷酸融合物和/或表达由其所编码的融合多肽的ErbB-2和/或ErbB-3阳性癌症或肿瘤的受试者的方法，所述方法包括向该受试者施用有效量的ErbB-2和/或ErbB-3靶向剂，其中该融合物为如条款1至23中任一项的融合物。

56.一种抑制患有包含多核苷酸融合物和/或表达由其所编码的融合多肽的ErbB-2和ErbB-3阳性癌症或肿瘤的受试者进程的方法，所述方法包括向该受试者施用有效量的ErbB-2和/或ErbB-3靶向剂，其中所述融合物为如条款1至23中任一项的融合物。

57.一种用于治疗患有包含多核苷酸融合物和/或表达由其所编码的融合多肽的ErbB-2和ErbB-3阳性癌症或肿瘤的受试者中的ErbB-2和/或ErbB-3靶向剂，所述治疗包含向该受试者施用有效量的ErbB-2和/或ErbB-3靶向剂，其中所述融合物为如条款1至23中任一项的融合物。

58.一种诊断受试者是否有包含如条款1至23中任一项的多核苷酸融合物或由其所编码的多肽的异常细胞的方法，该方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。

59.如条款58的方法，其中该检验包含利用诸如条款30至35中任一项的核酸探针、引物或引物对的结合剂特异性地结合该多核苷酸或由其所编码的多肽以检测该融合物，或利用结合包含该多核苷酸融合物的多核苷酸的结合剂以检测该融合物。

60.一种评估受试者是否罹患癌症或肿瘤或是易于罹患癌症或肿瘤的方法，该方法包括检验获自受试者的样本以检测该样本中是否存在如条款1至23中任一项的多核苷酸融合物或由其所编码的多肽，且通过鉴定所述多核苷酸或多肽融合物是否存在来评估所述受试者罹患所述癌症或肿瘤或是易于罹患所述癌症或肿瘤。

61.如条款55至58中任一项的方法或用途，其中该ErbB-2和/或ErbB-3靶向剂选自由以下所组成的组：包含结合ErbB-2的胞外部分的第一抗原结合位点和结合ErbB-3的胞外部分的第二抗原结合位点的多特异性抗体、ErbB-2的酪氨酸激酶抑制剂、包含结合ErbB-2的胞外部分的抗原结合位点的单特异性二价抗体、包含结合ErbB-3的胞外部分的抗原结合位点的单特异性二价抗体、或其任何组合。

62.如条款55至58或61中任一项的方法或用途，其中该ErbB-2和/或ErbB-3靶向剂为泽妥珠单抗(zenocutuzumab)。

63.如条款41至62中任一项的方法或用途，其中该异常细胞、癌细胞或肿瘤细胞包含如条款1至23中任一项的多核苷酸融合物或由其编码的多肽，且其中该细胞所包含的多核苷酸融合物进一步包含编码NRG1的EGF样结构域的编码序列的框内融合物。

64.如条款41至63中任一项的方法或用途，其中该异常细胞系来自癌症，尤其所述癌症为腺癌，更特别是黏液腺癌、胰脏癌，更特别是胰脏腺癌，更特别是胰脏导管腺癌、肾细胞癌、肉瘤、膀胱癌、大肠癌、直肠癌、大肠直肠癌、胆囊癌、头颈癌、前列腺癌、子宫癌、乳癌、卵巢癌、肝癌、子宫内膜癌、肺癌，优选为非小细胞肺癌，优选地、更优选地为浸润性黏液腺癌、或是原发性癌或转移性癌。

65.一种包含如条款1至23中任一项的多核苷酸融合物和/或表达由其所编码的多肽融合物的体内动物模型，其中由该动物模型所包含的多核苷酸融合物或多肽融合物优选地是由存在于该动物模型中的移植异常细胞所包含，或是由所述动物模型的基因组所包含。

66.一种以Erb2和/或Erb3靶向剂治疗如条款66的体内动物模型的方法，该靶向剂选自由以下所组成的组：包含结合ErbB-2的胞外部分的第一抗原结合位点和结合ErbB-3的胞外部分的第二抗原结合位点的多特异性抗体、ErbB-2的酪氨酸激酶抑制剂、包含结合ErbB-2的胞外部分的抗原结合位点的单特异性二价抗体、包含结合ErbB-3的胞外部分的抗原结合位点的单特异性二价抗体、或其任何组合，所述方法包括向该动物施用所述Erb2和/或Erb3靶向剂。

67.一种用于原位杂交测定法以检测VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的基因重排的第一核酸探针和第二核酸探针，其中：

-用于检测VAPB的基因重排的第一探针特异性地与SEQ ID NO:1的位置43的核酸5’处的VAPB序列杂交，且该第二探针特异性地与位于SEQ ID NO:1的位置43的核酸3’处的VAPB序列杂交；

-用于检测CADM1的基因重排的第一探针特异性地与SEQ ID NO:5的位置53的核酸5’处的CADM1序列杂交，且该第二探针特异性地与位于SEQ ID NO:5的位置53的核酸3’处的CADM1序列杂交；

-用于检测CD44的基因重排的第一探针特异性地与SEQ ID NO:9的位置52的核酸5’处的CD44序列杂交，且该第二探针特异性地与位于SEQ ID NO:9的位置52的核酸3’处的CD44序列杂交；

-用于检测SLC3A2的基因重排的第一探针特异性地与SEQ ID NO:13的位置53的核酸5’处的SLC3A2序列杂交，且该第二探针特异性地与位于SEQ ID NO:13的位置53的核酸3’处的SLC3A2序列杂交；

-用于检测VTCN1的基因重排的第一探针特异性地与SEQ ID NO:164的位置65的核酸5’处的VTCN1序列杂交，且该第二探针特异性地与位于SEQ ID NO:164的位置65的核酸3’处的VTCN1序列杂交；

-用于检测CDH1的基因重排的第一探针特异性地与SEQ ID NO:184的位置119的核酸5’处的CDH1序列杂交，且该第二探针特异性地与位于SEQ ID NO:184的位置119的核酸3’处的CDH1序列杂交；

-用于检测CXADR的基因重排的第一探针特异性地与SEQ ID NO:215的位置43的核酸5’处的CXADR序列杂交，且该第二探针特异性地与位于SEQ ID NO:215的位置43的核酸3’处的CXADR序列杂交；

-用于检测GTF2E2的基因重排的第一探针特异性地与SEQ ID NO:231的位置141的核酸5’处的GTF2E2序列杂交，且该第二探针特异性地与位于SEQ ID NO:231的位置141的核酸3’处的GTF2E2序列杂交；

-用于检测CSMD1的基因重排的第一探针特异性地与SEQ ID NO:253的位置88的核酸5’处的CSMD1序列杂交，且该第二探针特异性地与位于SEQ ID NO:253的位置88的核酸3’处的CSMD1序列杂交；

-用于检测PTN的基因重排的第一探针特异性地与SEQ ID NO:311的位置102的核酸5’处的PTN序列杂交，且该第二探针特异性地与位于SEQ ID NO:311的位置102的核酸3’处的PTN序列杂交；

-用于检测ST14的基因重排的第一探针特异性地与SEQ ID NO:328的位置95的核酸5’处的ST14序列杂交，且该第二探针特异性地与位于SEQ ID NO:328的位置95的核酸3’处的ST14序列杂交；

-用于检测AGRN的基因重排的第一探针特异性地与SEQ ID NO:401的位置106的核酸5’处的AGRN序列杂交，且该第二探针特异性地与位于SEQ ID NO:401的位置106的核酸3’处的AGRN序列杂交；

-用于检测THBS1的基因重排的第一探针特异性地与SEQ ID NO:374的位置56的核酸5’处的THBS1序列杂交，且该第二探针特异性地与位于SEQ ID NO:374的位置56的核酸3’处的THBS1序列杂交；

-用于检测PVALB的基因重排的第一探针特异性地与SEQ ID NO:435的位置102的核酸5’处的PVALB序列杂交，且该第二探针特异性地与位于SEQ ID NO:435的位置102的核酸3’处的PVALB序列杂交；

-用于检测SLC3A2的基因重排的第一探针特异性地与SEQ ID NO:452的位置93的核酸5’处的SLC3A2序列杂交，且该第二探针特异性地与位于SEQ ID NO:452的位置93的核酸3’处的SLC3A2序列杂交；

-用于检测APP的基因重排的第一探针特异性地与SEQ ID NO:484的位置54的核酸5’处的APP序列杂交，且该第二探针特异性地与位于SEQ ID NO:484的位置54的核酸3’处的APP序列杂交；

-用于检测WRN的基因重排的第一探针特异性地与SEQ ID NO:526的位置96的核酸5’处的WRN序列杂交，且该第二探针特异性地与位于SEQ ID NO:526的位置96的核酸3’处的WRN序列杂交；

-用于检测DAAM1的基因重排的第一探针特异性地与SEQ ID NO:603的位置75的核酸5’处的DAAM1序列杂交，且该第二探针特异性地与位于SEQ ID NO:603的位置75的核酸3’处的DAAM1序列杂交；

-用于检测ASPH的基因重排的第一探针特异性地与SEQ ID NO:633的位置75的核酸5’处的ASPH序列杂交，且该第二探针特异性地与位于SEQ ID NO:633的位置75的核酸3’处的ASPH序列杂交；

-用于检测NOTCH2的基因重排的第一探针特异性地与SEQ ID NO:691的位置75的核酸5’处的NOTCH2序列杂交，且该第二探针特异性地与位于SEQ ID NO:691的位置75的核酸3’处的NOTCH2序列杂交；

-用于检测CD74的基因重排的第一探针特异性地与SEQ ID NO:715的位置75的核酸5’处的CD74序列杂交，且该第二探针特异性地与位于SEQ ID NO:715的位置75的核酸3’处的CD74序列杂交；

-用于检测SDC4的基因重排的第一探针特异性地与SEQ ID NO:741的位置75的核酸5’处的SDC4序列杂交，且该第二探针特异性地与位于SEQ ID NO:741的位置75的核酸3’处的SDC4序列杂交；

-用于检测CD44的基因重排的第一探针特异性地与SEQ ID NO:759的位置75的核酸5’处的CD44序列杂交，且该第二探针特异性地与位于SEQ ID NO:759的位置75的核酸3’处的CD44序列杂交；

-用于检测SLC4A4的基因重排的第一探针特异性地与SEQ ID NO:763的位置75的核酸5’处的SLC4A4序列杂交，且该第二探针特异性地与位于SEQ ID NO:763的位置75的核酸3’处的SLC4A4序列杂交；

-用于检测SDC4的基因重排的第一探针特异性地与SEQ ID NO:822的位置75的核酸5’处的SDC4序列杂交，且该第二探针特异性地与位于SEQ ID NO:822的位置75的核酸3’处的SDC4序列杂交；

-用于检测ZFAT的基因重排的第一探针特异性地与SEQ ID NO:826的位置75的核酸5’处的ZFAT序列杂交，且该第二探针特异性地与位于SEQ ID NO:826的位置75的核酸3’处的ZFAT序列杂交；或

-用于检测DSCAML1的基因重排的第一探针特异性地与SEQ ID NO:866的位置75的核酸5’处的DSCAML1序列杂交，且该第二探针特异性地与位于SEQ ID NO:866的位置75的核酸3’处的DSCAML1序列杂交。

实施例

实施例1：检验样本制备

液态样本或活检包括血液、血清、血浆、胸腔积液、尿液、精液、阴道拭子、羊水、腹膜液、无细胞灌洗液或其他生物流体。

当使用血液作为起始材料时，可在以细胞稳定剂(诸如无细胞的DNA BCT管(Streck))处理过的管子中收集血液，该细胞稳定剂可防止血球细胞在收集后破裂，并将来自正常细胞的野生型DNA/RNA的污染降至最低。

实施例2：从血浆纯化循环DNA

虽然此实施例的实验方案描述了从1ml的血浆样本中分离cfDNA，但当期望有更高产量及其他样本类型(如尿液及血清)时，该实验方案也适合从其他体积中分离。该实验方案基于循环核酸套组(CNA)(Qiagen,产品编号#55114)及日期为10/2019的手册(HB-0202-006)。

在开始之前，允许来自人类受试者的血浆样本平衡至室温，无论是来自于适合冷藏温度储存的样本或是从患者抽取后直接使用。所有的离心步骤都是在室温下进行。必要时，用磷酸盐缓冲盐水(PBS)将体积低于1ml的样本调整到总共1ml。

缓冲液及试剂的制备

根据制造商的说明书来制备缓冲液ACB、ACW1和ACW2。简言之，在使用前，将200ml异丙醇(100v/v％)添加到300ml缓冲液ACB浓缩物中以得到500ml缓冲液ACB。在添加异丙醇之后，将所得缓冲液混合均匀。在使用前，将25ml乙醇96-100(v/v％)添加到19ml缓冲液ACW1浓缩物以得到44ml缓冲液ACW1。在添加乙醇之后将所得液体混合均匀。在使用前，将30ml乙醇(96-100％)添加到13ml缓冲液ACW2浓缩物中以得到43ml缓冲液，随后将其混合均匀。例如，要处理12个1ml血浆样本时，将10.6ml缓冲液ACL与67.5μl的含有载体的AVE缓冲液混合在一起。

从血浆分离cfDNA

流程：将100μl QIAGEN蛋白酶K抽吸到50ml离心管中，将1ml的血浆添加到该50ml离心管中。添加0.8ml ACL缓冲液(含有1.0μg载体RNA)，之后关上盖子并用脉冲涡动混合30秒且同时在管内形成涡流。将样本和ACL缓冲液彻底混合以产生均质溶液。将样本在60℃下培育30分钟使其立即裂解。在离心管内向该裂解物添加1.8ml ACB缓冲液，之后关上盖子并用脉冲涡动彻底混合15至30秒。将该裂解物ACB缓冲混合液在离心管内在冰上培育5分钟。将QIAamp小型管柱(Mini column)插入QIAvac 24Plus上的真空接头(VacConnector)中，并根据制造商的说明书设定。将20ml延伸管插入敞开的QIAamp小型管柱中。将20ml延伸管紧紧插入QIAamp小型管柱中。

在冰上培育之后，将该裂解物-ACB缓冲混合液施加至QIAamp小型管柱的延伸管中。开启真空泵，且当所有裂解物已完全被抽吸通过管柱时，关闭真空泵且使压力释放至0毫巴。小心地移出且丢弃延伸管。如果为QIAvac连接系统(Connecting System)的一部分，则可使用真空调节器(Vacuum Regulator)。为了避免交叉污染，不要将延伸管在邻近的QIAamp小型管柱上方移动。将600μl ACW1缓冲液施加至QIAamp小型管柱中。将管柱的盖子打开且开启真空泵。在所有ACW1缓冲液已被抽吸通过QIAamp小型管柱之后，关闭真空泵且使压力释放至0毫巴。将750μl ACW2缓冲液施加至QIAamp小型管柱中。将管柱的盖子打开且开启真空泵。在所有ACW2缓冲液已被抽吸通过QIAamp小型管柱之后，关闭真空泵且使压力释放至0毫巴。将750μl乙醇(96v/v％)施加至QIAamp小型管柱中。将管柱的盖子打开且开启真空泵。在所有乙醇已被抽吸通过QIAamp离心层析管柱(spin column)之后，关闭真空泵且使压力释放至0毫巴。将QIAamp小型管柱的盖子盖紧，将该管柱自真空歧管中移出且抛弃真空接头。将QIAamp小型管柱置放于干净的2ml收集管中，且全速(20,000x g；14,000rpm)离心3分钟。将QIAamp小型管柱置放于新的2ml收集管中。打开盖子，且将总成在56℃下培育10分钟以使膜完全干燥。将QIAamp小型管柱置放于干净的1.5ml洗脱管中并丢弃最后使用的2ml收集管。将20μl AVE缓冲液小心地施加至QIAamp小型管柱膜(Mini membrane)之中心。盖紧盖子且在室温下培育3分钟。将洗脱缓冲液AVE平衡至室温。回收的洗脱液体积为约5μl，小于施加至QIAamp小型管柱的洗脱体积。在微型离心机中以全速(20,000x g；14,000rpm)将管柱离心1分钟以洗脱核酸，致使获得细胞游离DNA。

用AVE缓冲液洗脱游离的循环游离细胞DNA，即用于扩增反应或储存在-30℃至-15℃下。经纯化的核酸不含蛋白质、核酸酶及其他杂质。

接着，核酸浓度是在扩增NRG1融合物及检测分析之前，根据制造商的建议来测定，诸如定量扩增测定法。

用于QIAvac 24Plus系统的真空处理1-24QIAGEN离心层析管柱的材料清单。QIAvac24Plus：处理1-24离心层析管柱的真空歧管，包括QIAvac 24Plus真空歧管、LuerPlugs及快速联结管(Quick Couplings)(产品编号19413)。真空接头(500)：500型抛弃式接头，供与鲁尔槽(luer slot)或真空阀(VacValve)上的QIAamp小型管柱一起使用(产品编号19407)。真空阀(24)：24个阀，供与QIAvac 24Plus一起使用(产品编号19408)。真空调节器(Vacuum Regulator)：供与QIAvac歧管一起使用(产品编号19530)。真空泵(230V,50Hz)：通用真空泵(容量为34L/分钟，8mbar真空绝对值)(产品编号84020)。QIAvac连接系统(Connecting System)：用以连接真空歧管与真空泵的系统：包括托盘、废液瓶、管路、联结管、阀门、压力计、24个真空阀(产品编号19419)。

实施例3：循环肿瘤RNA(cfRNA)

从血浆纯化循环RNA

虽然此实施例的实验方案描述了从4ml的血浆样本中分离循环RNA，但当期望有更高产量及其他样本类型(如尿液及血清)时，该实验方案也适合从其他体积中分离。该实验方案系基于循环核酸套组(CNA)(Qiagen,产品编号#55114)及日期为10/2019的手册(HB-0202-006)。

在开始之前，允许来自人类受试者的血浆样本平衡至室温，无论是来自于适合冷藏温度储存的样本或是从患者抽取后直接使用。所有的离心步骤都是在室温下进行。必要时，用磷酸盐缓冲盐水(PBS)将体积低于4ml的样本调整到总共4ml。

缓冲液及试剂的制备。

根据制造商的说明书来制备缓冲液ACB、ACW1和ACW2。简言之，在使用前，将200ml异丙醇(100v/v％)添加到300ml缓冲液ACB浓缩物中以得到500ml缓冲液ACB。在添加异丙醇之后，将所得缓冲液混合均匀。在使用前，将25ml乙醇96-100(v/v％)添加到19ml缓冲液ACW1浓缩物以得到44ml缓冲液ACW1。在添加乙醇之后将所得液体混合均匀。在使用前，将30ml乙醇(96-100％)添加到13ml缓冲液ACW2浓缩物中以得到43ml缓冲液，随后将其混合均匀。例如，要处理12个4ml血浆样本时，将43ml缓冲液ACL与67.5μl的含有载体的AVE缓冲液混合在一起。

从血浆分离cfRNA

流程：将400μl QIAGEN蛋白酶K抽吸到50ml离心管中，将4ml的血浆添加到该50ml离心管中。添加3.2ml ACL缓冲液(含有1.0μg载体RNA)，之后关上盖子并用脉冲涡动混合30秒且同时在管内形成涡流。将样本和ACL缓冲液彻底混合以产生均质溶液。将样本在60℃下培育30分钟使其立即裂解。在离心管内向该裂解物添加7.2ml ACB缓冲液，之后关上盖子并用脉冲涡动彻底混合15至30秒。将该裂解物ACB缓冲混合液在离心管内在冰上培育5分钟。将QIAamp小型管柱(Mini column)插入QIAvac 24Plus上的真空接头(VacConnector)中，并根据制造商的说明书设定。将20ml延伸管插入敞开的QIAamp小型管柱中。将20ml延伸管紧紧插入QIAamp小型管柱中。

在冰上培育之后，将该裂解物-ACB缓冲混合液施加至QIAamp小型管柱的延伸管中。开启真空泵，且当所有裂解物已完全被抽吸通过管柱时，关闭真空泵且使压力释放至0毫巴。小心地移出且丢弃延伸管。如果为QIAvac连接系统(Connecting System)的一部分，则可使用真空调节器(Vacuum Regulator)。为了避免交叉污染，不要将延伸管在邻近的QIAamp小型管柱上方移动。将600μl ACW1缓冲液施加至QIAamp小型管柱中。将管柱的盖子打开且开启真空泵。在所有ACW1缓冲液已被抽吸通过QIAamp小型管柱之后，关闭真空泵且使压力释放至0毫巴。将750μl ACW2缓冲液施加至QIAamp小型管柱中。将管柱的盖子打开且开启真空泵。在所有ACW2缓冲液已被抽吸通过QIAamp小型管柱之后，关闭真空泵且使压力释放至0毫巴。将750μl乙醇(96v/v％)施加至QIAamp小型管柱中。将管柱的盖子打开且开启真空泵。在所有乙醇已被抽吸通过QIAamp离心层析管柱(spin column)之后，关闭真空泵且使压力释放至0毫巴。将QIAamp小型管柱的盖子盖紧，将该管柱自真空歧管中移出且抛弃真空接头。将QIAamp小型管柱置放于干净的2ml收集管中，且全速(20,000x g；14,000rpm)离心3分钟。将QIAamp小型管柱置放于新的2ml收集管中。打开盖子，且将总成在56℃下培育10分钟以使膜完全干燥。将QIAamp小型管柱置放于干净的1.5ml洗脱管中并丢弃最后使用的2ml收集管。将20μl AVE缓冲液小心地施加至QIAamp小型管柱膜(Mini membrane)之中心。盖紧盖子且在室温下培育3分钟。将洗脱缓冲液AVE平衡至室温。回收的洗脱液体积为约5μl，小于施加至QIAamp小型管柱的洗脱体积。在微型离心机中以全速(20,000x g；14,000rpm)将管柱离心1分钟以洗脱核酸，致使获得细胞游离RNA。

用AVE缓冲液洗脱游离的循环游离细胞RNA，即用于扩增反应或储存在-30℃至-15℃下。经纯化的核酸不含蛋白质、核酸酶及其他杂质。

为了避免在纯化期间和之后损失来自生物材料的RNA，首先彻底清洁任何塑料器皿或玻璃器皿，以消除可能的核糖核酸酶(RNase)污染。通过建立及维护无RNase的环境，可以避免无意中将RNase引入分离流程中。

实施例4：循环肿瘤细胞的分离

此实验方案描述从全血分离出循环肿瘤细胞，其使用Adna Test Breast CancerSelect套组(ADNAGEN，产品编号T-1-508)使得可经由上皮及肿瘤相关抗原产生富集免疫磁性的肿瘤细胞。抗上皮及肿瘤相关抗原的抗体与磁珠(Dynabeads)缀合以标记周边血中的肿瘤细胞。经标记的细胞以磁粒收集器(AdnaMag-L和AdnaMag-S)萃取且随后裂解。从所得裂解物分离出mRNA且用于检测NRG1融合物。

将全血(至少5ml，但也可能是10ml)收集在含有EDTA(例如，‘KaliumEDTA’,Sarstedt；‘BD/>K3EDTA’,Becton Dickinson)的管子中且立即置于冰上，之后在4小时内抽吸并进行处理。

选择磁珠(Select Bead)的制备：以抽吸方式使BreastSelect Beads(套组中所提供)彻底重新悬浮。计算全部样本所需的BreastSelect Beads体积且将计算出的体积转移到1.5ml反应管。将反应管置于AdnaMag-S磁力收集器(AdnaGen GmbH,产品编号T-1-800)中。在1分钟后移除上清液。将磁珠用1ml PBS(磷酸盐缓冲盐水；pH 7.0-7.3)洗涤三次。将反应管从AdnaMag-S移出并使其重新悬浮于100μl PBS中。

肿瘤细胞的选择：首先将5ml的血液样本抽吸到15ml管子内。将100μl的已重新悬浮的BreastSelect Beads添加至各血液样本中。使管子在可倾斜和旋转的设备上于室温下慢速旋转(大约5rpm)30分钟。接着将管子置于未置有磁性滑块的AdnaMag-L(AdnaGenGmbH,产品编号T-1-700)内，且向下摆动以释放盖子中获得的血滴。接着将磁性滑块插入且将管子在室温下培育3分钟。在不碰触到磁珠的情况下用10ml抽吸管将血液上清液完全移除。首先从AdnaMag-L将磁性滑块移开，向管子添加5ml的PBS，轻轻使磁珠/细胞复合物重新悬浮，以完成洗涤三次。将磁性滑块放回到AdnaMag-L内且将管子在室温下培育1分钟，随后用抽吸管移除上清液。洗涤之后，将磁性滑块移开，将磁珠/细胞复合物重新悬浮1ml PBS中并转移到1.5ml的反应管。将反应管置于已插入磁性滑块的AdnaMag-S内。1分钟之后，将上清液全部移除以进行后续的细胞裂解。

从AdnaMag-S将磁性滑块移开，向每个反应管添加200μl的经室温平衡的裂解/结合缓冲液(套组中所提供)，随后通过抽吸五次使重新悬浮。将磁性滑块插入AdnaMag-S且培育1分钟。将含有细胞裂解物的上清液转移到新的1.5ml反应管，且将含有磁珠的管子丢弃。该细胞裂解物适于mRNA分离或储存在-20℃下。该裂解物的mRNA在反转录(RT-PCR)反应中使用寡聚胸腺嘧啶(Oligo(dT))引物来分离并转录成cDNA模板。随后通过PCR介导扩增来检测NRG1融合物。

实施例5：细胞外囊泡及外泌体

使用ExoRNeasy Maxi套组(产品编号77023,QIAGEN GmbH,Hilden,德国)而从血液获得总囊泡RNA，该套组基于以膜为基础的亲合性结合步骤而从无细胞的生物液体分离出外泌体及其他EV。

步骤1包括血浆分离与储存。将全血收集于含有EDTA的BD静脉采血管(Venous Blood Collection Tubes)(产品编号367525)(或是Streck公司的/>血液ccfDNA管[产品编号768115]和无细胞DNA/>管，但不是RNA BCT管)中。将管子储存在室温或4℃下且在1小时内处理。使用摆动式斗状转子将血液样本在初次采血管中以1900xg(3000rpm)及4℃离心10分钟。小心将上部(黄色)血浆相转移到新的管子(具有锥形底部)中且不搅乱中间的血沉棕黄层(含有白细胞和血小板)。将血浆样本在锥形管中以3000x g及4℃离心15分钟(或以16,000x g离心10分钟,见上文)，或通过0.8μm过滤器(NML[Sartorius产品编号16592])。小心将澄清上清液转移到新的管子且不搅乱沉淀物。将血浆储存在2-8℃达6小时并在同一天处理。

步骤2描述从4ml的血浆获得及裂解外泌体及其他细胞外囊泡(EV)。将4ml的结合缓冲液XBP添加至4ml的血浆中并立即轻轻倒置管子5次混合均匀。将血浆/XBP混合物添加至exoEasy离心层析管柱(spin column)(将EV结合至膜上的膜亲合性管柱)且以500x g离心1分钟。将流出的液体丢弃，且将管柱放回同一个收集管中。将10ml洗涤缓冲液XWP添加至exoEasy Maxi离心层析管柱，且以5000x g离心5分钟。将流出的液体与收集管一起丢弃。将离心层析管柱转移至新的收集管。将700μl QIAzol添加至膜以裂解囊泡，以5000x g离心5分钟以收集裂解物，将完全转移至2ml管子。

步骤3描述从裂解物分离出总RNA。根据制造商的说明书制备缓冲液RWT及RPE。将含有裂解物的管子短暂地涡动且在室温下培育5分钟。接着添加90μl的氯仿至管子且剧烈摇动15秒。在室温下培育2至3分钟之后，在4℃下以12,000x g将管子离心15分钟。将上部水相转移至新的收集管，添加2倍体积的100％乙醇且彻底混合。将700μl样本抽吸至在2ml收集管中的RNeasy MinElute离心层析管柱中，且以≥8000x g(≥10,000rpm)离心15秒。丢弃流出的液体之后，使用剩余的样本重复此步骤。将700μl缓冲液RWT添加至RNeasy MinElute离心层析管柱且以≥8000x g(≥10,000rpm)离心15秒，随后添加500μl缓冲液RPE且以≥8000x g(≥10,000rpm)离心15秒。将每个步骤中流出的液体丢弃。最后将500μl缓冲液RPE添加至RNeasy MinElute离心层析管柱上且以≥8000x g(≥10,000rpm)离心2分钟。将收集管与流出的液体一起丢弃。

将RNeasy MinElute离心层析管柱置入新的2ml收集管且在盖子打开下以全速离心5分钟以使膜干燥。将收集管与流出的液体一起丢弃。通过添加14μl不含RNase的水来洗脱RNA，让管子静置1分钟，且以全速离心1分钟。

实施例6：经肿瘤教化的血小板(TEP)

已知肿瘤细胞将(突变的)RNA转移到血小板中，随后用于检测肿瘤相关的RNA标志物。此实验方案将血小板mRNA的降解程度降至最低，且将其他细胞类型(如红血球及白血球)的污染程度降至最低(Amisten S,Methods Mol Biol.2012)。接着将获自血小板RNA用来扩增及检测NRG1融合物。

抗体缀合磁珠的制备：将1ml Dynabead洗涤缓冲液(具0.1％(w/v)BSA的PBS，pH7.4)与250μl Dynabead浆料(Pan Mouse IgG,Invitrogen)一起混合并置于Dynamag磁铁(DynaMag^TM-2或DynaMag^TM-15,Invitrogen)中1分钟，随后将液体移除。在另一次洗涤之后，从磁铁移出磁珠且使其重新悬浮于250μL洗涤缓冲液中。将15μl的抗CD235a抗体(小鼠，抗人类CD235a，红血球表面标志物，BD Inc,NJ,USA)及15μl抗CD45抗体(小鼠抗人类CD45，白血球表面标志物，BD Inc,NJ,USA)添加至磁珠，在温和倾斜和旋转下混合且培育至少30分钟。将管子置于磁铁中1分钟以移除上清液，且将磁珠重新悬浮于250μl洗涤缓冲液，之后储存在4℃。

收集血球及纯化血小板：以18ml ACD(无菌抗凝剂：柠檬酸葡萄糖溶液,SigmaAldrich)、12μl的1mM PGE1(Prostaglandin E1,1mM于乙醇中的储备液,Sigma Aldrich)、120μl的30mM乙酰柳酸(30mM于乙醇中的储备液,Sigma Aldrich)、及480μl的0.5M EDTA(Sigma Aldrich)来制备血小板抑制混合物。在进一步含有1.5ml血小板抑制混合物的15ml管子的管内收集8.5ml的血。在室温下以200g离心20分钟之后，将上层上面85％的富含血小板(PRP)的血浆转移到新的15ml管子。在另一次离心(200g，10分钟，室温)移除白血球与红血球之后，将85％的PRP转移到50ml管子。接着以AutoStop^TMBC高效过滤器(Pall公司，产品编号ATSBC1E)将PRP过滤以移除白血球，将滤液与抗体缀合磁珠混合培育，同时在室温下倾斜和旋转45分钟。将该PRP/磁珠混合物置于DynaMagTM-2内2分钟，且将上清液转移到新的管子以得到耗尽的PRP。在重复PRP耗尽步骤之后，将上清液在室温下以800g离心10分钟以收取上清液。将血小板沉淀物秤重并以每100mg沉淀物用1ml TRIzol(Invitrogen)来溶解，样本秤重小于100mg时用最低量1mL TRIzol。

分离血小板RNA：将溶解于TRIzol中的血小板样本在室温下培育5分钟，且向每管添加200μl氯仿(Sigma Aldrich)。在剧烈摇动15至30分钟之后，将管子在室温下培育2至3分钟，并在4℃下以12,000g离心15分钟。将10μg极纯肝醣(UltraPure^TMGlycogen,Invitrogen,产品编号10814-010)添加至新的无RNase管子。将TRIzol/氯仿混合物的水相小心添加至含有肝醣的管子，随后添加500μl的冷异丙醇(Sigma Aldrich)。将管子混合并在-20℃下静置过夜。在4℃下以12,000g离心15分钟之后，移除上清液且将RNA沉淀物在1ml的75％乙醇中洗涤。将经干燥的RNA沉淀物溶解于无RNase水中，且可进一步用于反转录为cDNA。

实施例7：ddPCR核酸扩增及融合物检测

使用微滴式数字聚合酶连锁反应(ddPCR)来检测来自液态活检cfDNA及cfRNA样本中的目标核酸融合物。

使用Bio-Rad’s QX100^TM或QX200^TM微滴式数字PCR系统来进行微滴式数字聚合酶连锁反应(ddPCR)，以致使检测来自液态活检DNA和/或RNA(cDNA)样本中的目标核酸融合物。

引物及探针：引物是设计在融合接点或断点附近，以扩增60-200bp大小的NRG1融合产物。使用Primer3程序(Whitehead Institute for Biomedical Research,麻省理工学院)来设计引物使其GC含量为50-60％且T_m介于50与65℃之间(在50mM盐浓度和300nM寡核苷酸浓度下)，以避免二级结构及引物二聚物。

使用具序列特异性且用FAM、HEX或VIC染料荧光标记的TaqMan^TM水解探针。探针序列是在扩增子(amplicon)的两个引物之间选择。水解探针的T_m比GC含量为30-80％的引物高3-10℃。该探针的长度小于30个核苷酸。

样本制备：使用A260光谱仪来评估输入DNA/RNA的浓度，以确认所要装填的目标DNA/RNA浓度是在检测动态范围内。QX100或QX200系统建议的DNA动态范围为每20μl反应物120,000个拷贝数。也根据制造商的建议对基因组DNA使用4切酶或6切酶与每μg DNA10单位酶来进行限制酶消化切割。经消化切割的DNA系储存在-20℃下直至进一步使用。

当使用cfDNA做为起始材料进行实验时，该融合序列包括融合位点加上每一侧有足够长的毗邻序列以涵盖PCR扩增子。所得核苷酸序列介于50-250ntd。将T7启动子序列(5'-CAGAGATGCATAATACGACTCACTATAGGGAGA-3')加到目标序列的5'端。双链脱氧核醣核酸(DNA)片段形式的合成序列从IDT(www.idtdna.com)订购，且于Tris-EDTA(TE)缓冲液中恢复水分至最终浓度为10ng/μl。

当使用RNA作为起始材料时，首先使用RT-PCR来生成cDNA，例如使用针对寡聚胸腺嘧啶(oligo(dT))或基因特异性导引的Bio-Rad’s iScript^TM Select cDNA合成套组。cDNA浓度减至相等于约0.2ng/μl RNA，且每个微滴式数字PCR反应(总体积20μl)使用5μl。

为了生成cfRNA的阳性对照组，使用体外转录将60ng的合成DNA转成RNA且使用苯酚/胍基试剂将所得RNA转录物纯化。添加DNase I以移除残余模板DNA。以凝胶电泳来评估RNA的质量。基于输出到检验样本的所要拷贝数，将所得RNA稀释至范围为0.25至2.5fg的浓度。将用于阳性对照组的10μl的分析RNA等分储存在-80℃下。使用无核酸酶的水作为cfDNA及cfRNA的阴性对照组。

ddPCR反应：制备20μl PCR混合物，其含有样本核酸(1μg的DNA或cDNA，最终浓度为50ng/μl)、探针用的2x ddPCR supermix((Bio-Rad,产品编号1863023；不含2’-脱氧尿核苷5’-三磷酸盐)-10μl、20x融合特异性引物/探针组(450nmol/L引物，250nmol/L FAM探针)-1μl、20x对照目标引物/探针组(450nmol/L引物，250nmol/L HEX探针)-1μl及无核酸酶的水。建立稍微超过20μl(22-25μl)的初始反应物池，以确保能将20μl的混合物转移至DG8药筒(Bio-Rad,产品编号1864007)。将该等反应混合物合并且在一个单独的管子中(而非在微滴产生药筒中)混合均匀。接着将反应混合物转移至已预载于DG8药筒支架(Bio-Rad,产品编号1863051)中的DG8药筒。

装填20μl PCR反应物之后，将70μl的微滴产生油(Bio-Rad,产品编号1863005)装填入DG8药筒各孔底部。在DG8药筒顶部安装一个衬垫，将其置入QX200微滴产生仪。该微滴产生仪在约2.5分钟内对8个样本产生每样本约20,000个微油滴。接着轻轻将微油滴抽吸转移至96孔盘。使用Bio-Rad’s PX1TM PCR孔盘封膜仪(Plate Sealer)及可穿刺热封箔将PCR孔盘热封。接着将PCR孔盘置入具有96深孔反应模块的C1000 Touch^TM热循环仪(ThermalCycler)中进行PCR。热循环条件如下：在95℃(10分钟，1循环)活化酵素；变性(94℃,30秒)及退火/延长(55℃,1分钟)40个循环；在98℃下酵素失活，10分钟，1循环。使用每秒2℃的变温速率。

在PCR扩增微油滴中的核酸目标之后，将含有微油滴的孔盘置入QX100或QX200微滴读取仪，其中使用软件QuantaSoft，使用双色检测系统(设定成检测FAM及HEX)个别分析每个微油滴。含有至少一个拷贝的目标DNA/RNA分子的阳性微油滴与阴性微油滴相比展现出荧光增强。其浓度以每μl最终1x ddPCR反应物中的拷贝数报告。使用阈值工具正确地指出微油滴群为双阴性(FAM及HEX均为阴性)、FAM阳性、HEC阳性、及双阳性(FAM及HEX均为阳性)。使用ABS分析，以每微升的拷贝数及每微滴的拷贝数得到目标物的绝对量化。

实施例8：锚定多重PCR

使用锚定多重PCR(AMP)来检测基因融合物及检测与感兴趣的基因的多重融合。以下实验方案基于Archer FusionPlex实体瘤(Solid Tumor)套组(ArcherDX,产品编号AB0005)，且使用获自例如实施例6的液态活检的RNA来进行。

样本库制备：

包括一个含有至少数个已证实的基因融合的阳性对照组。包括一个非模板对照组作为每次运作时另外的样本。

随机导引、第一与第二链cDNA合成：该测定法所要输入的是200ng RNA，其稀释于pH8.0的10mM Tris HCl中。将20μl经稀释的RNA添加至预冷的随机导引试剂连排反应管中(套组中所提供)。在混合和短暂快速旋转之后，将混合物转移到96孔PCR孔盘，以RT膜(USAScientific,产品编号2921-7800)密封并在热循环仪铝块上以65℃培育5分钟(盖子加热下)。

将随机导引产物转移到第一链试剂连排反应管(置于预冷铝块中)且混合、短暂快速旋转，并转移到96孔PCR孔盘。使用以下热循环仪程序：25℃10分钟，42℃30分钟，80℃20分钟，保持4℃(盖子加热下)。

在一组新的PCR连排反应管中以无核酸酶的水制作1:10稀释的第一链产物，以用于Pre-Seq质量控制(QC)测定法中。QC测定法主要是用于验证非模板对照组中没有cDNA合成。根据制造商的实验方案进行QC测定法。

对于第二链cDNA合成，添加21μl无核酸酶的水至其余的第一链产物，且将40μl的此产物添加至第二链试剂连排反应管(套组中所提供，置于预冷铝块中)。在混合及短暂快速旋转之后，将混合物转移到96孔PCR孔盘并密封。将孔盘插入热循环仪铝块上，且使用以下热循环仪程序：16℃60分钟，75℃20分钟，保持4℃(盖子加热下)。

末端修复：将40μl的第二链产物转移到末端修复试剂连排反应管(套组中所提供，置于预冷铝块中)。在混合及短暂快速旋转之后，将连排反应管在热循环仪铝块中以25℃培育30分钟，随后保持4℃。在室温下将该末端修复产物添加至纯化珠粒(Agencourt AMPureXP Beads,Bechman Coulter,产品编号A63881)。在混合之后，将该混合物在室温下培育5分钟，随后在磁铁(Alpaqua,产品编号A32782)上培育5分钟。丢弃上清液，将珠粒用200μl70％乙醇以培育30秒及风干5分钟进行洗涤两次。使珠粒重新悬浮于22μl的pH 8.0的10mMTris HCl中，离开磁铁培育3分钟，随后在磁铁上培育2分钟。

接合步骤1：从末端修复珠粒纯化孔盘取出20μl转移入接合步骤1连排反应管(套组中所提供，置于预冷铝块中)。在混合及短暂快速旋转之后，将混合物于96孔PCR孔盘中在热循环仪铝块内以37℃培育15分钟，随后保持4℃(盖子加热下)。将全部体积的接合步骤1产物添加至50μl的经室温平衡的珠粒。在混合之后，将该混合物在室温下培育5分钟，随后在磁铁上培育5分钟。丢弃上清液，将珠粒用200μl 70％乙醇以培育30秒进行洗涤两次。在最终洗涤之后，移除全部的70％乙醇且将珠粒风干5分钟。将珠粒从磁铁移开且重新悬浮在42μl的pH 8.0的10mM Tris HCl中，离开磁铁培育3分钟，随后在磁铁上培育2分钟。

接合步骤2：从4℃储藏库中移出MBC适配连排反应管试剂(套组中所提供)并正确编号。为了测序目的，还记录了样本的特定索引。

从接合步骤1珠粒纯化孔盘取出40μl转移至MBC适配连排反应管(ArcherDX，产品编号AK0016-48，置于预冷铝块中)。在混合及短暂快速旋转之后，将混合物转移至接合步骤2试剂连排反应管(套组中所提供，也置于预冷铝块中)。在混合及短暂快速旋转之后，将混合物在热循环仪中以22℃培育5分钟，随后保持4℃。

将接合清理(Ligation Cleanup)珠粒(经室温平衡)涡动且将50μl添加至新的PCR连排反应管组。在磁铁上培育1分钟之后，丢弃上清液。将连排反应管从磁铁移开且重新悬浮于50μl的接合清理缓冲液中。

将接合步骤2产物添加至接合清理珠粒连排反应管，涡动混合且在室温下培育5分钟。重复进行混合及培育，之后将样本在磁铁上培育1分钟并丢弃上清液。添加200μl的接合清理缓冲液使其重新悬浮，且在快速旋转之后将该混合物置于磁铁上1分钟。重复用接合清理缓冲液进行洗涤。使用超纯水进行相同的洗涤动作，之后将珠粒重新悬浮于20μl的5mMNaOH中且于PCR孔盘中在热循环仪铝块内用以下条件培育：75℃10分钟，随后保持4℃(盖子加热下)。将PCR孔盘置于磁铁上至少3分钟。

第一次PCR：将2μl的NRG1特异性引物(GSP1引物)添加至第一次PCR试剂连排反应管中的每个孔(套组中所提供)并与18μl的接合步骤2清理产物混合。在短暂快速旋转之后，将混合物在热循环仪中用以下程序培育：95℃3分钟，15个循环；95℃30秒-65℃5分钟(变温速率100％)；72℃3分钟，随后保持4℃(盖子加热下)。

将20μl的第一次PCR产物添加至24μl的经室温平衡的珠粒，混合并在室温下培育5分钟且在磁铁上培育2分钟。之后移除上清液，将珠粒用200μl 70％乙醇以培育30秒及风干进行洗涤两次，并使其重新悬浮于24μl的pH8.0的10mM Tris HCl。

第二次PCR及样本库量化

将2μl的另外的NRG1特异性引物(GSP2引物)添加至在冷铝块上的正确标记的第二次PCR试剂连排反应管中的每个孔(套组中所提供)，且与18μl的第一次PCR清理产物混合。在短暂快速旋转之后，将混合物在热循环仪中用以下条件培育：95℃3分钟，18个循环；95℃30秒-65℃5分钟(变温速率100％)；72℃3分钟，随后保持4℃(盖子加热下)。

将20μl的第二次PCR产物添加至24μl的经室温平衡的珠粒，混合并在室温下培育5分钟且在磁铁上培育2分钟。之后移除上清液，将珠粒用200μl 70％乙醇以培育30秒及风干进行洗涤两次。在磁铁上培育2分钟，将20μl的第二次PCR产物转移至新的PCR孔盘并进行定量。

每个样本库的浓度通过qPCR使用用于Illumina平台编码KK4973的KapaBiosystems样本库定量套组(Library Quantification Kit)根据制造商的说明书来测定。用pH8.0之10mM Tris HCl与0.05％ Tween将第二次PCR产物连续稀释。以每孔6μl的样本库定量主混合液(library quantitation master mix)(Kapa Biosystems,产品编号KK4973)添加至96孔光学反应盘，随后添加4μl的合适稀释品或标准品(Kapa Biosystems,产品编号KK4906、KK4903)。使用以下qPCR程序：95℃5分钟1个循环；95℃30秒(变温速率4.4℃/秒)-60℃45秒(变温速率2.2℃/秒)35个循环。完成样本库定量的后，将所有的样本库均一化，且将10μl的每个经均一化的样本库合并到一个1.5ml微量离心管汇集。

样本库的测序：

从冷藏库中移出测序试剂药筒并置入去离子水直到填充线至少一小时。使测序试剂套组(MiSeq试剂套组v3-600循环；Illumina；产品编号MS-102-3003)与室温平衡。将10μl的样本库池与10μl的0.2N NaOH合并以制作变性扩增子样本库(DAL)池且在室温下培育5分钟。将10μl的pH 7.0的200mM Tris HCl添加至DAL，随后添加970μl的HT1缓冲液(套组中所提供)。

合并300μl的HT1、25μl的20pM PhiX及675μl的DAL池以制作最终装填管。在混合及短暂快速旋转之后，将装填管的全部体积添加至该测序试剂药筒的样本孔，且将该药筒装填到测序仪，以2×151bp读长与2×8索引测序数据(index reads)运行(MiSeqDx System-Illumina)。

RNA融合数据使用适合的生物信息数据分析软件来分析。

实施例9：下一代测序

下一代测序以DNA样本使用MI-Exome检验(Caris Molecular CarisLife Sciences)来进行，该检验使用DNA且使用定制人类外显体套组提供肿瘤突变剖析，以检测包括有单一核苷酸同质多形性、插入/缺失和DNA重排和融合事件等的变体。

以下定制外显子套组为使用五种套组的混合套组。套组使用Illumina NovaSeq6000仪器来进行验证。该混合套组包括两种获自Agilent的现成套组以及三种由Caris开发且优化的套组：

Agilent Human All Exon V7套组(48MB)

Agilent SNP Backbone套组(具1MB分辨率的3MB套组)

Caris 719-Gene Targeted Clinical套组(1MB)

Caris Intronic Fusion套组(0.1MB)

Caris Pathogenic套组(0.1MB)

对于以RNA作为起始材料时，使用全基因转录本测定法来进行下一代测序，例如MITranscriptomeTM测定组(Caris MolecularCaris Life Sciences)。当在Illumina NovaSeq仪器上测序时，该测定组使用Agilent SureSelect Human All Exon套组来检测基因融合物及剪接变体。

实施例10：荧光原位杂交(FISH)

对获自血浆或血液或其他液态活检样本上的循环肿瘤细胞(CTC)利用断裂分离探针进行FISH。例如，循环肿瘤细胞使用(Menarini silicon biosystems,意大利)或/>(Rarecells Diagnostics,巴黎，法国)系统而纯化自血浆、血清等，并固定在载玻片上。

简言之，将从全血中浓缩的CTC封固在独立的载玻片上(Frithiof,Henrik等人，OncoTargets and therapy第9卷,7095-7103,2016年11月16日)。将含有CTC的溶液(～900μL)转移至1.5mL Eppendorf管且置于磁性托盘中。培育10分钟之后，移除未附着的溶剂。使细胞重新悬浮于10μL的1倍磷酸盐缓冲盐水且封固在超冻载玻片(ThermoScientific,德国)且在37℃下培育30分钟。将载玻片浸入100％甲醇中5分钟完成固定。将样本储存在-20℃直至进一步评估。

使用FISH-组织实施套组(Tissue Implementation Kit)(ZytoVision,产品编号Z-2028-5)来完成细胞预处理。缓冲液PT1、ES1、WB1、WB2和MT7为套组中所提供。

将载玻片在70℃下培育10分钟，随后在二甲苯中培育2x 10分钟。接着使用一系列乙醇的100％、100％、90％、70％乙醇使载玻片再水合各5分钟，且最后在去离子水或蒸馏水中洗涤2x 2分钟。在98℃下在预加温的热预处理柠檬酸液(Heat Pretreatment SolutionCitric(PT1))中将载波片培育15分钟，且立即转移至去离子水或蒸馏水洗涤2x 2分钟。吸干水分之后，向样本施用胃蛋白酶溶液(Pepsin Solution(ES1))且在37℃之恒湿箱中培育15分钟，并用洗涤缓冲液SSC(WB1)洗涤5分钟。将载玻片于去离子水中洗涤1分钟，在一系列乙醇的70％、90％、100％乙醇中脱水各1分钟并风干。

ZytoLight SPEC NRG1双色断裂分离探针(PL140)是由标记有绿色荧光染料(ZyGreen)及橙色荧光染料(ZyOrange)的多核苷酸所组成。这些探针靶向感兴趣的基因(例如VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、AGRN、THBS1或PVALB)中所发生的映射至断点的远程与近端的序列。将10μl的探针抽吸到各个预处理的样本上，盖上22mm x 22mm盖玻片并密封。将载玻片置入75℃的杂交仪中10分钟以完成变性，随后将载玻片转移至恒湿箱中在37℃下杂交过夜。

次日，将载玻片浸入37℃之1x Wash缓冲液A(WB2)1至3分钟以移除盖玻片，且在37℃下用洗涤缓冲液A再洗涤2x 5分钟。将载玻片在70％、90％及100％乙醇中各培育1分钟且风干。将25μl的DAPI/DuraTect-溶液(MT7)抽吸到载玻片上，盖上盖玻片且在黑暗中培育15分钟。接着以荧光显微镜使用合适的ZyGreen(激发波503nm/发射波528nm)和ZyOrange(激发波580nm/发射波599nm)滤镜来评估样本荧光。基于绿色及橙色信号的重叠或未重叠外观来说明结果。

实施例11：免疫细胞化学染色法(ICC)

对获自血浆或血液或其他液态活检样本上的循环肿瘤细胞进行免疫细胞化学染色法，以检测NRG1融合蛋白的表达。例如，循环肿瘤细胞使用(Menarinisilicon biosystems,意大利)或/>(Rarecells Diagnostics,巴黎，法国)系统而纯化自血浆、血清等，并固定在载玻片上。

在固定之后，使用合适的免疫染色系统(例如Ventana Discovery自动免疫染色系统,Ventana Medical Systems,Tucson,AZ,USA)来进行载玻片上的蛋白质检测。简言之，将封固在超冻载玻片上的细胞在pH 8.0的EDTA基缓冲液中预处理。向本公开的NRG1融合物施用两种初级抗体。例如，抗NRG1抗体，其靶向位于融合接点(诸如NRG1的EGFR结构域)C端侧位置处的区域，以及另一种初级抗体，其靶向位于融合接点N端位置处的CD44表位或结构域。用合适的稀释剂进行抗体稀释。使用合适的次级抗体及两种不同荧光检测系统来检测抗体。在荧光显微镜中使用不同通道将免疫染色可视化。基于两种荧光信号的重叠或未重叠外观来说明结果。

实施例12：治疗实验方案

在经诊断带有以下融合物中各者的患者中用泽妥珠单抗进行治疗：VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、DAAM1-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SLC4A4-NRG1、SDC4-NRG1、ZFAT-NRG1和DSCAML1-NRG1，其治疗如下。

按照双周计划，第一次输注750毫克的泽妥珠单抗，用时4小时，随后每隔一周输注一次，用时2小时，以4周为一个周期。此外，还包括管理IRR(输液相关反应)的预备药物，其中包括所有输液的解热剂及抗组织胺。在第1天第1周期用药之前还包括皮质类固醇；此后，根据调查员的决定进行管理以管理IRR。

实施例13：源自患者的VAPB-NRG1融合数据

将获自经诊断患有肺腺癌的68岁男性病患的右体壁胸膜所得到的具有60％肿瘤性细胞的经石蜡固定的肿瘤性材料样本进行以下分子生物科技分析。

使用可检测一组14个基因(ALK、BRAF、EGFR、FGFR1、FGFR2、FGFR3、KRAS、MET、NRG1、NTRK1、NTRK2、NTRK3、RET、ROS1)的Archer FusionPlex^TM套组。根据制造商的说明书制备建库，且在Illumina MiSeq测序仪上进行下一代测序(NGS)，并使用Archer Analysis 6.0站点完成样本分析。

在此套组中检验是否为VAPB-NRG1融合物阳性的样本。对此样本进行测序以致使如SEQ ID NO:3的序列的鉴定。其显示出在VAPB的外显子1与NRG1的外显子2之间出现一个融合接点。带下划线序列(核苷酸1-43)与编码VAPB(NM_004738.4)的基因的外显子1的一部分对应。核苷酸44-94与编码NRG1的基因的一部分对应。

CAGGTCCTGAGCCTCGAGCCGCAGCACGAGCTCAAATTCCGAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTT(SEQ ID NO:3)。

实施例14：源自患者的CADM1-NRG1融合数据

将获自经诊断罹患转移性肺腺癌NOS的男性病患的具肿瘤性材料的经福尔马林固定石蜡块进行以下分子生物科技分析。

在以批准的显微解剖技术收取转移性脑组织之后进行分子检验。在显微镜下检查候选载玻片，并圈选含有肿瘤细胞(及在需要检验时圈选出单独的正常细胞)的区域。实验室技师使用解剖显微镜从标记区域收取目标组织并取出。所标记及取出的区域在显微解剖后的载玻片上重新进行显微镜检查，并复查显微解剖的妥适性。

对获自该样本的cDNA进行RNA-Seq(RNA测序)以致使如SEQ ID NO:7的序列的鉴定。其显示出存在框内融合且在CADM1基因的外显子7与NRG1基因的外显子6之间出现接点。下划线序列即核苷酸1-53对应CADM1基因(NM_001301045.1)的外显子7的一部分。核苷酸54-85对应编码NRG1的基因(NM_001159999.3)的一部分。

AGCTTCAAACATAGTGGGGAAAGCTCACTCGGATTATATGCTGTATGTATACGCTACATCTACATCCACCACTGGGACAAGCCAT(SEQ ID NO:7)。

使用Illumina NextSeq平台，基于下一代测序(NGS)分析将从经福尔马林固定及石蜡包埋的肿瘤样本分离出的基因组DNA进行肿瘤突变负荷分析。仅使用先前没有关于生殖细胞改变的报告的错义突变来计算肿瘤突变负荷。高突变负荷是免疫疗法反应的潜在指标(Hellman等人，NEJM,2018；Le等人，NEJM,2015；Rizvi等人，Science,2015；Rosenberg等人，Lancet 2016；Snyder等人，NEJM,2014)。NSCLC中的截止点基于大型第3期临床试验，其显示出每兆碱基中的TMB为10或有更多突变的患者在用免疫检查点抑制剂组合疗法治疗时，其无进展生存期比用化疗治疗时更长(Hellman等人，NEJM,2018)。高：每兆碱基大于或等于10个突变；低：每兆碱基小于或等于9个突变。该患者样本的TMB评分为9。

以NGS对样本进行微卫星不稳定性(MSI)分析，其显示出稳定的MSI特征。NGS(MSI-NGS)的MSI状态是通过直接分析一组592个已知基因中所测序的已知微卫星区域来测得。为了确定临床阈值，将MSI-NGS结果与来自于用传统PCR为基础的方法所分析的超过2,000个匹配临床病例的结果进行比较。使用如用于突变检测的相同深度与频率标准来检测微卫星基座中的基因组变体。此测定法中只会考虑到会造成串联重复序列数量改变的插入及缺失。计数每个样本中的微卫星变异总数量并分成三个类别：高度、模棱两可和稳定。低MSI的结果在稳定类别中报告。

在样本上进行的免疫组织化学染色显示出ALK和PD-L1的结果为阴性，MLH1、MSH2、MSH6、PMS2和PTEN的结果为阳性。

使用NGS或RNA-Seq分析，在所获得的样本中未检测到以下与癌症类型相关的生物标志物的融合物或突变：NTRK1、NTRK2、NTRK3、KRAS、ALK、DOR2、ErbB2、ErbB3、ErbB4、PIK3CA、TP53、MET、PD-L1、RET、ROS1、STKI1、TP53。

实施例15：源自患者的CD44-NRG1融合数据

将获自46岁男性病患肝脏的肿瘤性材料生物样本进行以下分子生物科技分析。

使用Archer FusionPlex^TM Custom Solid套组来检测肿瘤样本中的基因融合物，该套组利用了Anchored Multiplex PCR(AMP^TM)技术靶向先前报告过的染色体重排中的62个外显子。对这62个目标外显子设计出单向基因特异性引物(GSP)。将GPS与转接子特异性引物组合来扩增已知的且新型的融合转录物。在Illumina MiSeq测序仪上对富集的扩增子进行测序。

在此研究组中的样本经CD44-NRG1融合物检验为阳性。对该样本进行测序以致使如SEQ ID NO:11的序列的鉴定。其显示出存在框内融合且在CD44的外显子5与NRG1的外显子2之间出现融合接点。下划线序列即核苷酸1-52对应CD44基因(NM_000610)的外显子5的一部分。核苷酸53-110对应编码NRG1的基因的外显子2的一部分。

GACGAAGACAGTCCCTGGATCACCGACAGCACAGACAGAATCCCTGCTACCACCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACT(SEQ ID NO:11)。

该样本在此含有总数62个外显子目标的临床验证套组中检验为阴性，该目标为：ALK的外显子20(NM_004304)、ERG的外显子2,4,8(NM_004449)、EWSR1的外显子6,7,8,10,11(NM_005243)、FGFR3的外显子17,18(NM_00142)、FGFR2的外显子17(NM_00141.4)、FOXO1的外显子2(NM_002015)、NTRK3的外显子11,12,14,15(NM_002530)、RET的外显子12(NM_020975)、ROS的外显子34,35(NM_002944)、SS18的外显子10(NM_001007559)、STAT6的外显子16,17,19(NM_001178078)、TAF15的外显子6(NM_139215)、TFE3的外显子6(NM_006521)、BRAF的外显子7,9,11(NM_004333)、NTRK1的外显子12(NM_002529)、FUS的外显子5,8(NM_004960)、CIC的外显子20(NM_015125)。

实施例16：源自患者的SLC3A2-NRG1融合数据

将获自经诊断患有肺腺癌的女性病患的左下肺叶切除所得到的显示出原发性腺癌组织的肿瘤性材料进行以下分子生物科技分析。

在通过以下目标基因的测序获取肿瘤性细胞后，使用Archer Lung Fusion Plex,Illumina MiniSEQ进行分子检验：ALK、BRAF、FGFR1、FGFR2、FGFR3、KRAS、MET、NRG1、NTRK1、NTRK2、NTRK3、RET、ROS1。参考基因组为GRCh37/hg19。

对获自该样本的cDNA进行RNA-Seq(RNA测序)以致使如SEQ ID NO:15的序列的鉴定。其显示出存在出现在SLC3A2基因的外显子1与NRG1基因的外显子5之间的框内融合接点。下划线序列即核苷酸1-53对应编码SLC3A2的基因((NM_001013251)的外显子1的一部分。其余35个核苷酸，即核苷酸54-88，对应NRG1基因的外显子5的一部分。

CCGCATCGGCGACCTTCAGGCCTTCCAGGGCCACGGCGCGGGCAACCTGGCGGCATCTACATCTACATCCACCACTGGGACAAGCCAT(SEQ ID NO:15)。

实施例17：源自患者的VTCN1-NRG1融合数据

将获自经诊断罹患肺腺癌的病患右侧胸骨旁部位的包含肿瘤性细胞的选定组织块的转移性肿瘤性活检材料进行以下分子生物科技分析。

在通过测序获取肿瘤性细胞及TNA萃取后，对所获得的材料使用Archer FusionPlex RNACTL_V6(Archerdx)套组进行分子检验，所述测序经由Nextseq双端(pair end)使用流通槽N°HFFJFAFX2以及Sophia DDM版本5.7.4—b127-31a209c、流程(Pipeline)IDILL1AM1R2/v5.5.24.1/GEN1GN1FSQ2来实现。

所指的套组可检测以下目标区域(及括号内的外显子)中的突变：AKT1(3)、ALK(22,23,24,25)、AXL(5,11,15,17)、BRAF(11,15)、CTNNB1(3)、CYSLTR2(6)、DDR2(17)、EGFR(18,19,20,21)、ERBB2(20)、FGFR1(2,8,9,10,17)、FGFR2(2,5,7,8,9,10)、FGFR3(3,5,8,9,10)、GNA11(4,5)、GNAS(8,9)、GNAQ(4,5)、HRAS(2,3,4)、IDH1(4)、IDH2(4)、KEAP1(全部)、KIT(11,13,17)、KRAS(2,3,4)、MAP2K1(2,3)、MET(13à19)、NRAS(2,3,4)、PIK3CA(9,20)、POLE(9à14)、RAF1(4,5,6,7,9,10,11,12)、RET(11,13,14,15,16)、ROS1(38)、STK11(全部)、TP53(全部)。检测以下转录融合物：ALK、AXL、BRAF、CCND1、EGFR、FGFR1、FGFR2、FGFR3、MAP2K1、MET、NRG1、NTRK1、NTRK2、NTRK3、PPARG、RAF1、RET、ROS1。并检测以下表达：ALK、CCND1、EGFR、ERBB2、FGFR1、FGFR2、FGFR3、MET、NTRK1、NTRK2、NTRK3、RET、ROS1。

在EGFR基因的外显子18-21未观察到突变；在KRAS基因的外显子2和3未检测到突变；在BRAF基因的外显子11和15未检测到突变；在ERBB2基因的外显子20未检测到突变；在PIK3CA基因的外显子9和20未检测到突变；在MET基因的外显子14未检测到突变；在IDH1基因的外显子4检测到突变395G>T，导致R132L氨基酸改变且在VTCN1的外显子2与NRG1的外显子2之间检测到转录融合物。

未检测到涉及ALK、ROS1、RET、NTRK1、NTRK2、NTRK3、FGFR1、FGFR2及FGFR3基因的转录融合物。

未检测到ERBB2或MET过度表达。

对获自该样本的cDNA进行RNA-Seq(RNA测序)以致使如SEQ ID NO:166的序列的鉴定。其显示出存在出现在VTCN1基因的外显子2与NRG1基因的外显子2之间的框内融合接点。下划线序列即核苷酸1-65对应编码VTCN1的基因(访问代码NM_024626.4)的外显子2的一部分。其余28个核苷酸即核苷酸66-93对应NRG1的外显子2的一部分。

CATAATTAGCATCATCATTATTCTGGCTGGAGCAATTGCACTCATCATTGGCTTTGGTATTTCAGCCTTGCCTCCCCGATTGAAAGAGATGAA(SEQ ID NO:166)。

实施例18：源自患者的CDH1-NRG1融合数据

将获自经诊断罹患胰脏腺癌的女性病患的肿瘤性材料进行以下分子生物科技分析。以Maxwell(Promega)FFPE LEV套组进行自动RNA萃取。

使用Archer Fusion Plex NGS进行分子检验。在含有161个基因的OncomineComprehensive Assay V3(OCAV3)套组上进行NGS(S5XL-Life Technologies)，其中81个被认为是具热突变点基因(hotspot gene)且48个为全长基因，以及47个拷贝数基因。对获自该样本的cDNA进行RNA-Seq(RNA测序)以致使如SEQ ID NO:186的序列的鉴定。

其显示出存在出现在CDH1基因的外显子11与NRG1基因的外显子2之间的框内融合接点。下划线序列即核苷酸1-119对应编码CDH1的基因(NM_001317185.2)的外显子11的一部分。其余30个核苷酸，即核苷酸120-149，对应NRG1基因的外显子2的一部分。此外，NGS显示出在FGFR3基因的外显子10存在有突变1172C>T，引起了氨基酸改变Ala391Val。

CTGGCTGGAGATTAATCCGGACACTGGTGCCATTTCCACTCGGGCTGAGCTGGACAGGGAGGATTTTG AGCACGTGAAGAACAGCACGTACACAGCCCTAATCATAGCTACAGACAATGCCTTGCCTCCCCGATTGAAAGAGATGAAA(SEQ ID NO:186)。

CCTTGCCTCCCCGATTGAAAGAGATGAAAA

实施例19：源自患者的CXADR-NRG1融合数据

将获自经诊断罹患大肠癌的男性病患的肿瘤性材料进行以下分子生物科技分析。所提交组织样本的肿瘤区域或从周围组织显微解剖的载玻片，使用标准方法分离总RNA。对分离出的RNA进行逆转录，且建构双链DNA。对该样本进行通用标签和条形码处理，并使用基因特异性引物及通用标记特异性引物(Archer FusionPlex化学公司)进行半巢式多重PCR。使用Illumina NextSeq v2化学品来制备产物及测序。使用Archer分析软件v4.1来分析序列数据。分析灵敏性为大约5RNA分子编码该融合物并取决于所出现的特异性融合事件。融合物与所报告的参考转录本比较。

分子分析显示存在出现在CXADR基因的外显子1与NRG1的外显子2之间的框内融合接点。下划线序列即核苷酸1-43对应编码CXADR的基因(NM_001207063.2)的外显子1的一部分。其余58个核苷酸，即核苷酸44-101对应NRG1基因的外显子2的一部分。

ATGGCGCTCCTGCTGTGCTTCGTGCTCCTGTGCGGAGTAGTGGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACT(SEQ ID NO:217)。

实施例20：源自患者的GTF2E2-NRG1融合数据

将获自经诊断罹患转移性乳腺癌NOS的女性病患之具肿瘤性材料的经福尔马林固定石蜡块进行以下分子生物科技分析。

在以批准的显微解剖技术获取组织之后进行分子检验。在显微镜下检查候选载玻片，并圈选含有肿瘤细胞(及在需要检验时圈选出单独的正常细胞)的区域。实验室技师使用解剖显微镜从标记区域收取目标组织并取出。所标记及取出的区域在显微解剖后的载玻片上重新进行显微镜检查，并复查显微解剖的妥适性。

基因融合物及变异转录的侦测在从经福尔马林固定及石蜡包埋的肿瘤样本分离出的mRNA上进行，其使用Agilent SureSelectXT的低起始量样本库制备化学品(Low InputLibrary prep chemistry)，针对FFPE样本优化，并结合SureSelect Human All Exon V7捕获探针套组(bait panel)(48.2Mb)与Illumina NovaSeq。此测定法设计用于检测出现在基因内已知的且新的断点处的融合。此分析致使如SEQ ID NO:233的序列的鉴定。其显示出存在了框内融合且在GTF2E2基因的外显子2与NRG1基因的外显子2之间出现接点。下划线序列即核苷酸1-141对应GTF2E2基因(NM_002095.6)的外显子2的一部分。核苷酸142-268对应编码NRG1的基因(NM_001159999.3)的一部分。

GGGAGCTGTTCAAAAAACGAGCTCTTTCTACTCCTGTAGTAGAAAAACGTTCAGCATCTTCTGAGTCA TCATCATCATCGTCAAAGAAGAAGAAAACAAAGGTAGAACATGGAGGATCGTCAGGCTCTAAACAAAATTCTGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAACCAGTTCTGAATACTCCTCTCTCAGATTCAAGTGGTTCAAGAATGGGAATGA(SEQ ID NO:233)。

使用Illumina NextSeq平台，基于下一代测序(NGS)分析将从经福尔马林固定及石蜡包埋的肿瘤样本分离出的基因组DNA进行肿瘤突变负荷分析。仅使用先前没有关于生殖细胞变异的报告的错义突变来计算肿瘤突变负荷。使用以下所定义的肿瘤突变负荷阈值水平并建立截止点：

●高：每兆碱基大于或等于17个突变(≥17个突变/Mb)。

●中：每兆碱基大于或等于7个突变但小于17个突变(≥7个且<17个突变/Mb)。

●低：每兆碱基小于或等于6个突变(≤6个突变/Mb)。患者样本指出TMB评分为9。

通过NGS使用微卫星不稳定性(MSI)分析，未检测到微卫星不稳定性。

使用NGS分析，在GATA3的外显子6检测到框移突变(c.1305_1327del23，蛋白变异P436fs)及失能变体NTRK2(蛋白变异p.Q172 c.514C>T,(NM_006180.4)。

实施例21：源自患者的CSMD1-NRG1融合数据

将获自经诊断罹患大肠直肠癌的男性病患的肿瘤性材料进行以下分子生物科技分析。

使用由596个带有单核苷酸变异、插入与删除(indel)、易位的基因所组成的定制肿瘤学检验套组进行杂交捕获下一代测序。使用IDT xGen Exome研究套组v1.0杂交探针使得可从重排基因中无偏地检测所表达的融合转录本而进行全基因组转录本RNA测序。

其显示出存在出现在CSMD1基因的外显子23与NRG1的外显子6之间的框内融合接点。下划线序列，即核苷酸1-88，对应编码CSMD1的基因(NM_033225.6)的外显子23的一部分。其余的核苷酸，即核苷酸89-150，对应NRG1基因的外显子6的一部分。相关的患者报告提及阿法替尼(Afatinib)及厄洛替尼(Erlotinib)为经FDA批准与此CSMD1-NRG1融合物相关的疗法，同时提及GSK2849330作为调查性研究。此外，提到了与CSMD1-NRG1融合物相关的临床试验TAPUR(NCT02693535)。

在患者的材料中未鉴定出致病性生殖细胞突变，在KRAS或NRAS中也未鉴定出致病性单一核苷酸同质多形性。在患者的材料中鉴定出以下四种体细胞基因组变体：在TP53中的Y220C错义突变、在APC中的R564*终止突变(stop gain mutation)、在APC中的N1455fs框移突变、及在BRAF中的G469A错义突变。确定MSI状态为稳定的且肿瘤突变负荷为4.6m/MB。

鉴定出意义不明的变体，包括：在APOB(NM_000384)中的c.3332+1G>A剪接区变体、在GATA3(NM_001002295)中的c.425C>T p.S142L误义变体、在LZTR1(NM_006767)中的c.352C>T p.R118C误义变体、在CTC1(NM_025099)中的c.227A>T p.H76L误义变体、在CYP1B1(NM_000104)中的c.239G>A p.R80H误义变体、在RECQL4(NM_004260)中的c.1099C>Tp.R367W误义变体、在SOX2(NM_003106)中的c.871A>G p.R291G误义变体、及在TCF7L2(NM_001146274)中的c85_87del pE29del框内缺失。

该患者先前的治疗包括氟脲嘧啶、菊白叶酸、伊立替康(Irinotecan)、贝伐单抗(Bevacizumab)及奥沙利铂(Oxaliplatin)。

ATCCTAAACAGCACATCCAATCACCTGTGGCTAGAGTTCAACACCAATGGATCTGACACCGACCAAGG TTTTCAACTCACCTATACCACTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACT(SEQ ID NO:255)。

实施例22：源自患者的PTN-NRG1融合数据

将获自经诊断罹患转移性乳房恶性肿瘤NOS的女性病患之具肿瘤性材料的经福尔马林固定石蜡块进行以下分子生物科技分析。

在以批准的显微解剖技术收取组织之后进行分子检验。在显微镜下检查候选载玻片，并圈选含有肿瘤细胞(及在需要检验时圈选出单独的正常细胞)的区域。实验室技师使用解剖显微镜从标记区域收取目标组织并取出。所标记及取出的区域在显微解剖后的载玻片上重新进行显微镜检查，并复查显微解剖的妥适性。

基因融合物及变异转录的侦测在从经福尔马林固定及石蜡包埋的肿瘤样本分离出的mRNA上进行，其使用Agilent SureSelectXT的低起始量样本库制备化学品(Low InputLibrary prep chemistry)，针对FFPE样本优化，并结合SureSelect Human All Exon V7捕获探针套组(bait panel)(48.2Mb)与Illumina NovaSeq。此测定法设计用于检测出现在基因内已知的且新的断点处的融合。此分析致使如SEQ ID NO:313的序列的鉴定。其显示出存在了框内融合且在PTN基因的外显子4与NRG1基因的外显子2之间出现接点。下划线序列，即核苷酸1-102，对应PTN基因(NM_001321386.2)的外显子2的一部分。核苷酸103-205对应编码NRG1的基因(NM_001159999.3)的一部分。

CCAGAACTGGAAGTCTGAAGCGAGCCCTGCACAATGCCGAATGCCAGAAGACTGTCACCATCTCCAAG CCCTGTGGCAAACTGACCAAGCCCAAACCTCAAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAACCAGTTCTGAATACTCCTCTCTCAGATT(SEQ ID NO:313)。

●高：每兆碱基大于或等于17个突变(≥17个突变/Mb)。

●低：每兆碱基小于或等于6个突变(≤6个突变/Mb)。患者样本显示出低TMB评分。

使用NGS分析，在TP53的外显子10检测到p.E336*,c.1006G>T突变(NM_000546.5)。在NTRK1/2/3、AKT1、BRCA1/2、ERBB2、ESR1、PIK3CA、PTEN中未检测到变异，且对于PD-L1系得到阴性IHC结果(基于22c3及SP142)。

实施例23：源自患者的ST14-NRG1融合数据

从经诊断出罹患非小细胞肺癌的患者所获得的肿瘤性材料上进行的分子分析显示出存在了出现在如SEQ ID NO:330序列所包含的ST14基因的外显子11与NRG1的外显子6之间的框内融合接点。下划线序列，即核苷酸1-95，对应编码ST14的基因(NM_021978.4)的外显子11的一部分。其余87个核苷酸，即核苷酸96-182，对应NRG1基因的外显子6的一部分。

CAACAGCAACAAGATCACAGTTCGCTTCCACTCAGATCAGTCCTACACCGACACCGGCTTCTTAGCTG AATACCTCTCCTACGACTCCAGTGACCCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCT(SEQ ID NO:330)。

实施例24：源自患者的THBS1-NRG1融合数据

从经诊断出罹患胰脏腺癌的患者所获得之具有肿瘤性材料之新鲜的、冷冻的、或经福尔马林固定的石蜡块中萃取肿瘤DNA，并进行以下分子生物技术分析。

调查萃取的DNA是否存有447个癌症基因的外显子DNA序列且在60个基因中的191个区域进行重排检测。从含有至少20％肿瘤细胞核的组织中分离出DNA，且使用溶液相Agilent SureSelect杂交捕获套组及Illumina HiSeq 2500测序仪来进行大规模平行测序分析。

分子分析显示出存在了出现在THBS1基因的外显子9与NRG1的外显子6之间的框内融合接点。下划线序列即核苷酸1-56对应编码THBS1的基因(NM_003246.4)的外显子9的一部分。核苷酸57-145对应NRG1基因的外显子6的一部分。

ACCCTGTGAAGGCGAAGCGCGGGAGACCAAAGCCTGCAAGAAAGACGCCTGCCCCACTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCTTC(SEQ ID NO:376)。

进一步的分子分析并未显露出有ALK、NTRK1、NTRK2、NTRK3、ROS1的融合物，且未检测到涉及BRCA1、BRCA2或PALB2的致病性突变、拷贝数改变或结构变体。已对鉴定以下突变：TP53中的c.783-10_787delinsCCTG、TP53在17p13.1的单拷贝缺失、c.*178T>A，CDKN1B的外显子3、在ERCC2外显子12中的c.1205A>C(p.N402T)、在FANCD2外显子21中的c.1858T>C(p.C620R)、在KIF1B外显子5中的c.398A>C(p.N133T)、在NAB2中的c.1092-7T>C、在NOTCH1外显子20中的c.3245G>A(p.R1082H)、在PTPN14外显子13中的c.1798C>T(p.R600W)、及在RASA1外显子9中的c.1273C>A(p.H425N)。

在KRAS或NRAS中也未鉴定出致病性单一核苷酸同质多形性。在患者的材料中鉴定出以下四种体细胞基因组变体：在TP53中的Y220C错义突变、在APC中的R564*终止突变(stop gain mutation)、在APC中的N1455fs框移突变、及在BRAF中的G469A错义突变。确定MSI状态为稳定的且肿瘤突变负荷为4.6m/MB。

实施例25：源自患者的AGRN-NRG1融合数据

将获自经诊断罹患胰脏癌(PDAC)的男性病患的肿瘤性材料进行以下分子生物科技分析。

使用由648个带有单核苷酸变异、插入与删除(indel)、易位的基因所组成的定制肿瘤学检验套组进行杂交捕获下一代测序。可从重排基因中无偏地检测所表达的融合转录本来进行全基因组转录本RNA测序。该测定法的限度为对于单核苷酸变体的变异等位基因分数(VAF)为5％且灵敏度为98.2％，对于插入与删除的VAF为5％且灵敏度为91.8％，而对于易位的灵敏度为91.7％。

此分析致使如SEQ ID NO:403的序列的鉴定。其显示出存在框内融合且在AGRN基因的外显子12与NRG1基因的外显子6之间出现接点。下划线序列，即核苷酸1-106，对应AGRN基因(NM_001305275.2)的外显子12的一部分。核苷酸107-207对应编码NRG1的基因(NM_001159999.3)的一部分。

GTGTGCGGCTCAGATGGGGTCACCTACAGCACCGAGTGTGAGCTGAAGAAGGCCAGGTGTGAGTCACA GCGAGGGCTCTACGTAGCGGCCCAGGGAGCCTGCCGAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCTTCATGGTGAAAGAC(SEQ ID NO:403)。

此外，也检测到FGFR1过度表达。

实施例26：源自患者的PVALB-NRG1融合数据

从经诊断出罹患非小细胞肺癌的患者所获得的肿瘤性材料上进行的分子分析显示出存在出现在如SEQ ID NO:437序列所包含的PVALB基因的外显子4与NRG1的外显子6之间的框内融合接点。下划线序列，即核苷酸1-102，对应编码PVALB的基因(NM_002854.3)的外显子4的一部分。核苷酸103-227对应NRG1基因的外显子6的一部分。

TAAAAGGCTTCTCCCCAGATGCCAGAGACCTGTCTGCTAAAGAAACCAAGATGCTGATGGCTGCTGGA GACAAAGATGGGGACGGCAAAATTGGGGTTGACGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCTTCATGGTGAAAGACCTTTCAAACCCCTCGAGATACTTG(SEQ ID NO:437)。

实施例27：源自患者的SLC3A2-NRG1融合数据

从经诊断出罹患肺癌的患者所获得的肿瘤性材料上进行以下分子生物技术分析。先后使用Maxwell RSC及ReliaPrep^TMFFPE Total RNA Promega套组以及Archer Dx CTLFusionplex从经福尔马林固定的石蜡块萃取出总RNA。使用Archer Analysis第6.2.7版进行生物信息分析。

此分析显示出存在了出现在如SEQ ID NO:454序列所包含的SLC3A2基因的外显子2与NRG1的外显子6之间的框内融合接点。下划线序列，即核苷酸1-93，对应编码SLC3A2的基因(NM_002394.6)的外显子2的一部分。核苷酸94-121对应NRG1基因的外显子6的一部分。

AGTTGGGGTCTCACTGTGTTGCCCAGACTGGTCTCGAACTCTTGGCCTCAGGTGATCCTCTTCCCTCA GCTTCCCAGAATGCCGAGATGATAGCTACATCTACATCCACCACTGGGACAAG(SEQ ID NO:454)。

实施例28：源自患者的APP-NRG1融合数据

从经诊断出罹患胰脏癌的患者所获得的肿瘤性材料上进行分子生物技术分析，其显示出存在出现在如SEQ ID NO:486序列所包含的APP基因的外显子14与NRG1基因的外显子6之间的框内融合接点。下划线序列，即核苷酸1-54，对应编码APP的基因(NM_001136130.3)的外显子14的一部分。核苷酸55-141对应NRG1基因的外显子6的一部分。

TTGAGCCTGTTGATGCCCGCCCTGCTGCCGACCGAGGACTGACCACTCGACCAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCT(SEQID NO:486)。

实施例29：源自患者的WRN-NRG1融合数据

从经诊断出罹患乳癌的患者所获得的肿瘤性材料上进行分子生物技术分析，其显示出存在出现在如SEQ ID NO:528序列所包含的WRN基因的外显子33与NRG1基因的外显子6之间的框内融合接点。下划线序列，即核苷酸1-96，对应编码APP的基因(NM_000553.6)的外显子33的一部分。核苷酸97-182对应NRG1基因的外显子6的一部分。

AAGCTGGCTGCCCCCTTGATTTGGAGCGAGCAGGCCTGACTCCAGAGGTTCAGAAGATTATTGCTGAT GTTATCCGAAACCCTCCCGTCAACTCAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGC(SEQ ID NO:528)。

实施例30：源自患者的DAAM1-NRG1融合数据

从经诊断出罹患乳癌的患者所获得的肿瘤性材料上进行分子生物技术分析，其显示出存在出现在如SEQ ID NO:605序列所包含的DAAM1基因的外显子1与NRG1基因的外显子1之间的框内融合接点。下划线序列，即核苷酸1-75，对应编码DAAM1的基因(NM_001270520.2)的外显子1的一部分。核苷酸76-150对应NRG1基因的外显子1的一部分。

GAAGGAAACTGTTTAACCGGATCCCATTGTACCCAGAGTGCAGAGCCGCCTTTCCAGCATGCAGGGGC TGCTCAGGACAGAGAGGGAGGAGGCGCGCGGGGACGGGGACGCCCAGGAGGACCCACTCGCGGGTCCCGCTCCGCTCCGGCA(SEQ ID NO:605)。

实施例31：源自患者的ASPH-NRG1融合数据

从经诊断出罹患大肠直肠腺癌的患者所获得的肿瘤性材料上进行分子生物技术分析，其显示出存在出现在如SEQ ID NO:635序列所包含的ASPH基因的外显子22与NRG1基因的外显子2之间的框内融合接点。下划线序列，即核苷酸1-75，对应编码ASPH的基因(NM_001164750.2)的外显子1的一部分。核苷酸76-150对应NRG1基因的外显子2的一部分。

AAGGTCTCTTCCTGCCTGAGGATGAAAACCTGAGGGAAAAAGGGGACTGGAGCCAGTTCACGCTGTGG CAGCAAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA(SEQ ID NO:635)。

实施例32：源自患者的NOTCH2-NRG1融合数据

从经诊断出罹患胰脏癌的患者所获得的肿瘤性材料上进行分子生物技术分析，其显示出存在出现在如SEQ ID NO:693序列所包含的NOTCH2基因的外显子6与NRG1基因的外显子6之间的框内融合接点。下划线序列，即核苷酸1-75，对应编码NOTCH2的基因(NM_024408.4)的外显子6的一部分。核苷酸76-150对应NRG1基因的外显子6的一部分。

CCTCCTGTACTCCAGGCTCCACCTGCATCGACCGTGTGGCCTCCTTCTCTTGCATGTGCCCAGAGGGG AAGGCAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG(SEQ ID NO:693)。

实施例33：源自患者的CD74-NRG1融合数据

从经诊断出罹患肺癌的患者所获得的肿瘤性材料上进行分子生物技术分析，其显示出存在出现在如SEQ ID NO:717序列所包含的CD74基因的外显子2与NRG1基因的外显子2之间的框内融合接点。下划线序列，即核苷酸1-75，对应编码CD74的基因(NM_001025159.3)的外显子2的一部分。核苷酸76-150对应NRG1基因的外显子2的一部分。

AGGGCCGGCTGGACAAACTGACAGTCACCTCCCAGAACCTGCAGCTGGAGAACCTGCGCATGAAGCTT CCCAAGCCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA(SEQ ID NO:717)。

实施例34：源自患者的SDC4-NRG1融合数据

从经诊断出罹患肺癌的患者所获得的肿瘤性材料上进行分子生物技术分析，其显示出存在出现在如SEQ ID NO:743序列所包含的SDC4基因的外显子2与NRG1基因的外显子2之间的框内融合接点。下划线序列，即核苷酸1-75，对应编码SDC4的基因(NM_002999.4)的外显子2的一部分。核苷酸76-150对应NRG1基因的外显子2的一部分。

TACCAGACGATGAGGATGTAGTGGGGCCCGGGCAGGAATCTGATGACTTTGAGCTGTCTGGCTCTGGA GATCTGGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA(SEQ ID NO:743)。

实施例35：源自患者的CD44-NRG1融合数据

从经诊断出罹患癌症的患者所获得的肿瘤性材料上进行分子生物技术分析，其显示出存在出现在如SEQ ID NO:761序列所包含的CD44基因的外显子5与NRG1基因的外显子6之间的框内融合接点。下划线序列，即核苷酸1-75，对应编码CD44的基因(NM_000610.4)的外显子2的一部分。核苷酸76-150对应NRG1基因的外显子6的一部分。

TTTCTACTGTACACCCCATCCCAGACGAAGACAGTCCCTGGATCACCGACAGCACAGACAGAATCCCT GCTACCACTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG(SEQ ID NO:761)。

实施例36：源自患者的SLC4A4-NRG1融合数据

从经诊断出罹患胰脏癌的患者所获得的肿瘤性材料上进行分子生物技术分析，其显示出存在出现在如SEQ ID NO:765序列所包含的SLC4A4基因的外显子14与NRG1基因的外显子6之间的框内融合接点。下划线序列，即核苷酸1-75，对应编码SLC4A4的基因(NM_001098484.3)的外显子14的一部分。核苷酸76-150对应NRG1基因的外显子6的一部分。

ACTACCCCATCAACTCCAACTTCAAAGTGGGCTACAACACTCTCTTTTCCTGTACCTGTGTGCCACCT GACCCAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG(SEQ ID NO:765)。

实施例37：源自患者的SDC4-NRG1融合数据

从经诊断出罹患肺癌的患者所获得的肿瘤性材料上进行分子生物技术分析，其显示出存在出现在如SEQ ID NO:824序列所包含的SDC4基因的外显子4与NRG1基因的外显子2之间的框内融合接点。下划线序列，即核苷酸1-75，对应编码SDC4的基因(NM_002999.4)的外显子4的一部分。核苷酸76-150对应NRG1基因的外显子2的一部分。

ATGTGTCCAACAAGGTGTCAATGTCCAGCACTGTGCAGGGCAGCAACATCTTTGAGAGAACGGAGGTC CTGGCAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA(SEQ ID NO:824)。

实施例38：源自患者的ZFAT-NRG1融合数据

从经诊断出罹患肺癌的患者所获得的肿瘤性材料上进行分子生物技术分析，其显示出存在出现在如SEQ ID NO:828序列所包含的ZFAT基因的外显子12与NRG1基因的外显子6之间的框内融合接点。下划线序列，即核苷酸1-75，对应编码ZFAT的基因(NM_020863.4)的外显子12的一部分。核苷酸76-150对应NRG1基因的外显子6的一部分。

ACAGGAAGCACCCTAATGAGGAGTATGCCAACGTGGGCACCGGGGAGCTGGCAGCGGAGGTGCTCATC CAGCAAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG(SEQ ID NO:828)。

实施例39：源自患者的DSCAML1-NRG1融合数据

从经诊断出罹患胰脏癌的患者所获得的肿瘤性材料上进行分子生物技术分析，其显示出存在出现在如SEQ ID NO:868序列所包含的DSCAML1基因的外显子3与NRG1基因的外显子2之间的框内融合接点。下划线序列，即核苷酸1-75，对应编码DSCAML1的基因(NM_020693.4)的外显子3的一部分。核苷酸76-150对应NRG1基因的外显子2的一部分。

GCCTCATCCCCTCTTCAGTGCAGGAATATGTTAGCGTTGTATCTTGGGAGAAAGACACAGTCTCCATC ATCCCAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA(SEQ ID NO:868)。

实施例40：PDX动物模型

制备源自患者的异种移植(PDX)动物模型使其含有包含多核苷酸融合物且表达由其所编码的多肽融合物的异常细胞的植入异常细胞，以使用泽妥珠单抗作为ERB2和/或Erb3靶向剂进行治疗来评估其治疗活性。

可从含有癌症或样本的样本产生PDX模型，诸如在此实施例中女性患者经诊断患有胰脏腺癌，以及CDH1-NRG1多核苷酸融合物(见实施例18)，基本上如Puig等人,APersonalizedPreclinical Model to Evaluate the Metastatic Potential ofPatient-Derived Colon Cancer Initiating Cells,Clin Cancer Res；19(24),6787-6801(2013)中所述，其全文并入本申请中。

对于全部的小鼠研究，使用介于6-8周龄的雌性NOD.CB17/AlhnRj-Prkdcscid/Rj小鼠(Janvier Labs)。

该模型可以皮下注射，或在免疫缺陷小鼠的胰腺中原位注射。原位模型系于淋巴结、肝脏、肺或癌病中产生局部及远处转移，再现PDAC患者的前期疾病。

在第6周，将所有经载体或泽妥珠单抗治疗的小鼠牺牲且分析治疗功效。

可以对统计学上相关数量的NOD-SCID小鼠原位胰腺注射1*10^6个来自所述PDX模型的肿瘤细胞。从注射后15天开始，每周用CT成像来监测小鼠并检测胰腺中的原发性肿瘤。在至少80％的动物的胰腺中有原发性肿瘤生长后开始进行治疗。

基于不符合以下质量标准的小鼠将其排除在研究之外，包括手术后死亡、没有原发性肿瘤、肿瘤过大的小鼠、体重不足和一般疾病迹象。根据实施例12进行给药及治疗方案，然而，使用标准程序及计算，注意从人类情况中适当地转换与小鼠有关的条件。

本公开的序列信息

VAPB序列信息

SEQ ID NO:1VAPB-NRG1融合物5’处的VAPB外显子1序列

CAGGTCCTGAGCCTCGAGCCGCAGCACGAGCTCAAATTCCGAG

SEQ ID NO:2VAPB-NRG1融合物3’处的NRG1外显子2序列

CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTT

SEQ ID NO:3VAPB-NRG1多核苷酸序列

CAGGTCCTGAGCCTCGAGCCGCAGCACGAGCTCAAATTCCGAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTT

SEQ ID NO:4VAPB-NRG1多肽序列

QVLSLEPQHELKFRALPPRLKEMKSQESAAG

SEQ ID NO:17VAPB的外显子1

AGTCCCCGCCCCTGGAGCCGGCGGCGCAGGGCGCAGCTTCCCGCCGCCAGAGCGGGCCAGCCTGCTGCGTGCGTGCGTGTGTACGACTCTGCGTGCGTGCGTGCGTGCGTGCGTGCCGTCAGCTCGCCGGGCACCGCGGCCTCGCCCTCGCCCTCCGCCCCTGCGCCTGCACCGCGTAGACCGACCCCCCCCCAGCGCGCCCACCCGGTAGAGGACCCCCGCCCGTGCCCCGACCGGTCCCCGCCTTTTTGTAAAACTTAAAGCGGGCGCAGCATTAACGCTTCCCGCCCCGGTGACCTCTCAGGGGTCTCCCCGCCAAAGGTGCTCCGCCGCTAAGGAACATGGCGAAGGTGGAGCAGGTCCTGAGCCTCGAGCCGCAGCACGAGCTCAAATTCCGAG

SEQ ID NO:18VAPB的外显子2

GTCCCTTCACCGATGTTGTCACCACCAACCTAAAGCTTGGCAACCCGACAGACCGAAATGTGTGTTTTAAGGTGAAGACTACAGCACCACGTAGGTACTGTGTGAGGCCCAACAGCGGAATCATCGATGCAGGGGCCTCAATTAATGTATCTG

SEQ ID NO:19VAPB的外显子3

TGATGTTACAGCCTTTCGATTATGATCCCAATGAGAAAAGTAAACACAAGTTTATGGTTCAGTCTATGTTTGCTCCAACTGACACTTCAGATATGGAAGCAGTA

SEQ ID NO:20VAPB的外显子4

TGGAAGGAGGCAAAACCGGAAGACCTTATGGATTCAAAACTTAGATGTGTGTTTGAATTGCCAGCAGAGAATGATAAACCA

SEQ ID NO:21VAPB的外显子5

CATGATGTAGAAATAAATAAAATTATATCCACAACTGCATCAAAGACAGAAACACCAATAGTGTCTAAGTCTCTGAGTTCTTCTTTGGATGACACCGAAGTTAAGAAGGTTATGGAAGAATGTAAGAGGCTGCAAGGTGAAGTTCAGAGGCTACGGGAGGAGAACAAGCAGTTCAAG

SEQ ID NO:22VAPB的外显子6

GAAGAAGATGGACTGCGGATGAGGAAGACAGTGCAGAGCAACAGCCCCATTTCAGCA

TTAGCCCCAACTGGGAAGGAAGAAGGCCTTAGCACCCGGCTCTTGGCTCTGGTGGTTT

TGTTCTTTATCGTTGGTGTAATTATTGGGAAGATTGCCTTGTAGAGGTAGCATGCACAGG

ATGGTAAATTGGATTGGTGGATCCACCATATCATGGGATTTAAATTTATCATAACCATGTG

TAAAAAGAAATTAATGTATGATGACATCTCACAGGTCTTGCCTTTAAATTACCCCTCCCT

GCACACACATACACAGATACACACACACAAATATAATGTAACGATCTTTTAGAAAGTTA

AAAATGTATAGTAACTGATTGAGGGGGAAAAGAATGATCTTTATTAATGACAAGGGAAA

CCATGAGTAATGCCACAATGGCATATTGTAAATGTCATTTTAAACATTGGTAGGCCTTGG

TACATGATGCTGGATTACCTCTCTTAAAATGACACCCTTCCTCGCCTGTTGGTGCTGGCC

CTTGGGGAGCTGGAGCCCAGCATGCTGGGGAGTGCGGTCAGCTCCACACAGTAGTCCC

CACGTGGCCCACTCCCGGCCCAGGCTGCTTTCCGTGTCTTCAGTTCTGTCCAAGCCATC

AGCTCCTTGGGACTGATGAACAGAGTCAGAAGCCCAAAGGAATTGCACTGTGGCAGC

ATCAGACGTACTCGTCATAAGTGAGAGGCGTGTGTTGACTGATTGACCCAGCGCTTTGG

AAATAAATGGCAGTGCTTTGTTCACTTAAAGGGACCAAGCTAAATTTGTATTGGTTCAT

GTAGTGAAGTCAAACTGTTATTCAGAGATGTTTAATGCATATTTAACTTATTTAATGTATT

TCATCTCATGTTTTCTTATTGTCACAAGAGTACAGTTAATGCTGCGTGCTGCTGAACTCT

GTTGGGTGAACTGGTATTGCTGCTGGAGGGCTGTGGGCTCCTCTGTCTCTGGAGAGTCT

GGTCATGTGGAGGTGGGGTTTATTGGGATGCTGGAGAAGAGCTGCCAGGAAGTGTTTT

TTCTGGGTCAGTAAATAACAACTGTCATAGGGAGGGAAATTCTCAGTAGTGACAGTCA

ACTCTAGGTTACCTTTTTTAATGAAGAGTAGTCAGTCTTCTAGATTGTTCTTATACCACCT

CTCAACCATTACTCACACTTCCAGCGCCCAGGTCCAAGTCTGAGCCTGACCTCCCCTTG

GGGACCTAGCCTGGAGTCAGGACAAATGGATCGGGCTGCAGAGGGTTAGAAGCGAGG

GCACCAGCAGTTGTGGGTGGGGAGCAAGGGAAGAGAGAAACTCTTCAGCGAATCCTT

CTAGTACTAGTTGAGAGTTTGACTGTGAATTAATTTTATGCCATAAAAGACCAACCCAGT

TCTGTTTGACTATGTAGCATCTTGAAAAGAAAAATTATAATAAAGCCCCAAAATTAAGA

ATTCTTTTGTCATTTTGTCACATTTGCTCTATGGGGGGAATTATTATTTTATCATTTTTATTA

TTTTGCCATTGGAAGGTTAACTTTAAAATGAGCCCTATCACTGAGAAATACGTGTTTCAT

GATTTAACTCTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTATTTTTTTTTTGGT

TGTCTTCAGCTGACAGTATGAAAAATGAAACTGCTGAAAAAGCTGAGCACCTGGTCAC

CCTTGGCCTTCCATTGCTTTGGCCTTCAGTAAAAAGCAGCCTCCCTTCTAGGTCAGGGA

ACCATGCCATTGAGACTAGTAACGGGCGTTCTGGGCACAGTCCCACTGTGCACAGGTT

TGAGAGGACAAGTTCATCAGAAGGAAGGCAGTCCTTAGAAGTCACATACGTTGAGCCA

CGTTGCTCCTAAGCCTGGCTCTGTCAAGCTGGGTCAGGGGCCTTGAAACTGGAGAAGT

GGAAGTCTATGGTTGGTCTGAGTAAGTAACTTCCTGTCTTCATGAAAAAAGTTGACTTT

GAATCCCAGGTACTCACAGAAATGGTGAACAGACTTAGTTGTTACCCAGGCACCCATG

GATTGTGTTGAGTGTGCAGACAGGGAGGCCACCCCAATAGGAATTCGTCTCCAGGATTT

TTCCCATGTGTCCCCCAGTACTTATAAAAGGGAGTGAAAAGACCGAGCTGTAAGGCAT

GTGCCTTCTGCCACCTGACTTTCCGTGAGGGGACTAAAATTTACTAATTGTAGTTGCTG

CAGCCAGTTAAGTCCTGTAGCTTCCAGGCCCTCATGTCTTTGATAGGAGAGTGCTTAGG

TGGTCCCCAACAGTGCCTAGGGGTACAGTACAGTCCCATTACACTAGAGCAGGGCTCTA

TTTATTTTTAAAGGATATGGCCGTGTGTTTTGATAAAACTTTATTCACAAAAACAGCCGG

GTCATGGGATTTGGCTTGTGAGTCTGTAACAGTTCTTAAAAAGAATATCTGAGAAACTA

CTCTGTTTTAGACCTTTGAAGGTGATTTAGAGTTTTGTGTACATCTAGGAGAAGGTGTTC

AGCTTCTCAGAGGATGTGGACATTTTGGTTGCAGCTAAAAATCAGTCTCTGAAGTCTCT

CTCCCTTCTAGAGGTTAGGACTTGGTGAACATGTTTGTGGGCCTTTTGACTGAGTGGCA

GAAGGAAACTGCTCAGGAAGAGAAACAGGTGACTGATGGGAAGGTTGATTATTTTCTC

AGTCATCCTGGCAGCCAAAAATGTGCCAGGAAAAGAAAGAATGTGGAGCACGCGTGG

CTCCTGGAGGACTTGGAGATGCATGCACATTTAGGGTGTTTTCCCTAGAATTACATAATG

AAAAAAAGAATAAGGCAAAGAGGAGGTGAATATGGGGCCTGTCACAACGGCCTGCCC

TGCCCCAAGAGGGTTAAGAGTCAGATAATCGGGACGAAACTGGCATGGAAAGAGCGA

GCCTAGGGAGGATGCCGCTGGGCAGTGTGCATGGGGGAGCTGCTGCCAGGCTGCCCTC

CAGTCTGCTCCTGTGGTTACTGGCTCCACAGCACCTCAGAGAGGGCGGCCCTGGCTTC

AGAAATGCCAGCCATAGTGCTCACAAATGCAGAAGAGATGGAAGCGGTGACAGAATCC

TGAAAGTTTTTATTGATTGAAGTTTTAAATTGGTAACTTAAGCTTCCTTGGCACGATACA

AAATACCTCTTAAAGACAGCAGGCTTTTTTATTTGTAGGTGTGAGGAACTGGCTTTAAC

TTTTTTCTCCTCCTAGTTTGCATGTTTTCCTTCTCTCGTCTTCTGAACTGCTGGCACCAG

CAGTAATACATACTGATAAAATCAAAATTGATTTTTACCAGTGGCCAGTTTATGGCTAGA

GAGACGACTTATACCTCCATAACACAGAAGGGGGAAAAATGAAGAACCTCCAGTGATC

CGTGAAAACCTAAACGCTTTCAAACAAATCCCAGGAACAGAATTGCTATCGAAAGATAT

CATTGCCCAGTTTGCAGGCTATGTTGAGTCAGATAGAACTGAATGTAGTGAGAGCTCAG

AGCTACAGAGCCTTTCAGATGAATTTGAAAACAGACTCTGTGTGTGTGTGCATGTGTGC

ATGTGTGCATGTGTGGCATATGTGCCGTATGTCAGTAGCTTGACAGTTTTCAAATCGTGC

CTATATTTTTTTGCATACACAAATTTTTGTGTTTGCAAACTCAGAATCCATGCCAAAATAC

AATGTTATATGTCATTTTCAGCTCCTTCTCTAAAGGAATGGCCCATTTCTCATTGTAGTTT

GAGAAATACATGTATGAAGAGATAGGGGTCTTGGGCTTCCCAGTGTCACTTTGAACACC

TGAATAACATTTAACTCCTGAGACCTTCTCGGTGTAGAGGCCACTGCTTCCCCCTGCTG

GAGATGGCATTTCATTGAAGGGCCTCTCGTGGCTTTCCCTGCCCCCGGCTGTCTGGCCT

GAAGAAGGAGAAAGAACCAAACTGAACTATGAAAAGTTACCACTCTGAGGAGACCTC

TCTTAATTAACACTTGGGGCCATGTTTGCTGTTGTTGAGAAGGAGTGTTCTCAAAGATG

AGCTGGAATGGAATTGTATTTAGAAAGGCCCCTGCAAAGTATATAGATGGATGACTCTA

GTTCATGACATACAAATCCCATAAGGCCAACGACCACTCTTCTGGAACACCAAGAGCA

GCTCTGAGATCATGCTGGCCCTACGCGAATTGAGTTTCTGTGGCCTAATTGGATTTGGA

GAACGCCTTCCCTGGCCCCTTTTCCTCAGACAGATCTGCTCTGATAGGAACCTTTTCAA

GAAAGTTACTGTTGTTTCAATGCCACTCCTTACCTGTATAGAACATTTCCAATACATTCG

CTCATTGAACTTAATCCTTGCAACTGTGACTGGGGGGTAGATGGCTCTGTTTGCATACG

AAGAAATAAAGGCTCCAGGAGGTTAAATCGGGCAACTTTTTAGAACTAAATCAGTCTCT

GTAAGGCCTACATTGCTAAGATACCATTTCAGCTCTGAAAATCTGCTTCAGGGAAGTGA

GTGGATGAGGCCTTCCTGCCTCAGCTACTCTGCCCGTCTGTACATCTTTTGTGTCTGCCT

CCGTACCTTATTCAGTTATTTTCACACTAAAGTAAGTAGAATTAAGACTGTAGTTCAGAT

GCTTTTTCTTTTTCTGTTGGAAACTGAACACACTACAGACAGTGAAAAAAGGTACATAT

TCCATTTTCTCATTGCCTGAAGATCTCTGCTGATGCTCCTGGAGAATGACTTTGGGGGCT

TTAGAAAGAATATTGCCAGTCCGTCTCGGCAAGGAGATGATGGGAGCGCTTTATATGGA

GGCTTTACATGACTTGTAAATTAAATGTGAATGAGGGCAGTTGATTAAAATTGGTATTAC

AGAAGGGCCCTGCTGAGGTTTGAAAACAGCTGAGCTGCTGATGTCTCAGGCCTTTCCC

TGAATTAGCACTGCGGTTCTCCAGGATATCAGCAAAGAGGGCAAGTAATAGAAGCCCC

TGATAAGGAGCGTCAGCCGACAGGCAAGCTTGGGAGGCTGTGGGAATGGGTCTGCCCC

CAGCTTCACAGACCTCTTCCTCCAGCCTCTGAATCCCATTAGCCACAGCCTAGAACATT

AGCTGAGCTGCACAAGCTCACCCACCCCTGTGCCAGGGGGCCCTGACCTCCCTCCATG

CCATGTTTTTGGCTGTATCTACGGCACTTAACAATAGGGGCTTTTTATTTTCATTACAGAG

ATATTTTGAAAAATTTAAAAGACATGAACTCACATAAACAGTTATGGATGATAGTTAAAA

GAGAAACGGGTGGAGGTGGATGAGAGGTTGTCTTCATGAATATAATTACTTGAGATTTT

TTTTTCTTAATGGAATTAGTTTATTAGAAAATGTCTGTGTTAAATCCGTAGAAAAGGAAG

AAAAGTGTAGCAACAAAAATGTAGCCATTATCTAACTTGCCATAAATATTTGCAGTTATG

ATACCTTGGAATGTTGCCACGATATGGATTGCTTTGATTAAAAGATGTCAGTTGAATAAA

ACAGTACTGTGGGAGAATCGCTTTCTGCTGCTAGATAAATGCTGATGTTTATTTTTAAAC

CAGGAAACATTGATCCTGTAACAATGCCCGATTACAATTGCTTTATTACACCCCAGGGCT

GATGGAGATGTAATCACTTGGCTAATGGATGTGGGTGCAGGACAGATGCTCGCTTGCTG

GCCTGCTTTCCTGCTTGCATTCTGATGAGCTGCAGGAGTGCGCCTGGCCTTCTGCAGGT

GGAGCTGCTGTCAGAGCTTCGTTTCACTGATACCCAAAGCCATGTCTGACTGAAATAAA

ACAGGTTCCCTTTTTTTTTCCCTTTGGAAAATGCCAACTAAGGGAGACTAATCAGATATC

TTAACACAATTTCATCCAGGCTTAGTGCTAACAAGATTGCGGGGCTTTTTAGGGTTTAA

GAAGATGAGAAATGAGTGTGCACGTTTCACACGTTGACTTGCCGGTTTTTCCATGTCAT

ACAAAAAAGTCCTGGCTGTTTCTCCGAACTGGCTGCCTGCATTCCCGTCTTTCTTTTGT

TTTTAAGAAATAGACTGAATTCAGCTGTTAATCCTCTAGTACAGTATCCATGTTAAAATG

TTTTTCCATTGCATCTTTTATGTGAATTCAAAGGTCAGAATTTATTGTCTGTGATATTGAGACCATGTGTACAAGAACTACTTTTTGCTTTTCATCATTCACTCCTTAGCAAACGTTTCGTAAGTACCCTCTGTCTGTTTGCTACTATATGAGGTGCTGCGAAATTAGTGGGCGTGGCTTTTTATATTTTTCATTCGTGTGTAGCCTAAGTAAGGTGACTCAAGATGATACACCGAGAGAAAAATGCAAAATATATTTGGTTCTCATTTCTGTTGCTGTCGTTTCCTTTTTAAAGACGATTTATCAACTGCTGCCATTTGGAACTTCCTATAAGAAACTAAAAATGATCTATTTCAGTGTTCCTTTCGCCTTTCCTCTGCTTTCTGAATAAATGGTTTCAGTAACCCATGCTGTTCTCTCCCTATTCTACGTCTTTCTCCCTATGTTGAAAAAAGATTCCCACAGTTTCTGATGTGTGTGTTTATAGTCTTCAATGTATGTTAACATGTTAGGAACTGAGTATCTTAAGAGATGTCTTAGAATGCTTTAGTTTTCATAATTTGTCCTTTATGTATTTTTCATTGTATTTGCTGTTTTGACATGGAAGTAATTTAAAAAGTTGGTGCAGGAAAGGACTCTTTACTGTTGCACATTTTGGTTTTCTGATATGTAATAAATTCATGGCTTGGCAGCTGACATGATGTTTCCCAGAGAGAAGGAGATGTATTTCTGCAGGGTCCAGACCAAAAGAGCCATTTACAGCATGTTCTCCCATGTTCCATTATCAGCCTGATGAAACCTGCCCTGCCAAGGCATAAACTTTTGTACTAGCTGTCTCCATATTATGTTCAATAAATTCTGTGCTCTGAATATATTTAAAAAAAAAAAAA

SEQ ID NO:23VAPB的全部6个外显子1-6按顺序排列的多核苷酸序列

SEQ ID NO:24VAPB的外显子1的翻译多肽序列

MAKVEQVLSLEPQHELKFR

SEQ ID NO:25VAPB的外显子2的翻译多肽序列

PFTDVVTTNLKLGNPTDRNVCFKVKTTAPRRYCVRPNSGIIDAGASINVS

SEQ ID NO:26VAPB的外显子3的翻译多肽序列

MLQPFDYDPNEKSKHKFMVQSMFAPTDTSDMEAV

SEQ ID NO:27VAPB的外显子4的翻译多肽序列

WKEAKPEDLMDSKLRCVFELPAENDKP

SEQ ID NO:28VAPB的外显子5的翻译多肽序列

HDVEINKIISTTASKTETPIVSKSLSSSLDDTEVKKVMEECKRLQGEVQRLREENKQFK

SEQ ID NO:29VAPB的外显子6的翻译多肽序列

EEDGLRMRKTVQSNSPISALAPTGKEEGLSTRLLALVVLFFIVGVIIGKIAL

SEQ ID NO:30VAPB多肽序列

MAKVEQVLSLEPQHELKFRGPFTDVVTTNLKLGNPTDRNVCFKVKTTAPRRYCVRPNSGIIDAGASINVSVMLQPFDYDPNEKSKHKFMVQSMFAPTDTSDMEAVWKEAKPEDLMDSKLRCVFELPAENDKPHDVEINKIISTTASKTETPIVSKSLSSSLDDTEVKKVMEECKRLQGEVQRLREENKQFKEEDGLRMRKTVQSNSPISALAPTGKEEGLSTRLLALVVLFFIVGVIIGKIALCADM1序列信息

SEQ ID NO:5 CADM1-NRG1融合物5’处的CADM1外显子7序列

AGCTTCAAACATAGTGGGGAAAGCTCACTCGGATTATATGCTGTATGTATACG

SEQ ID NO:6 CADM1-NRG1融合物3’处的NRG1外显子6序列

CTACATCTACATCCACCACTGGGACAAGCCAT

SEQ ID NO:7 CADM1-NRG1多核苷酸序列

AGCTTCAAACATAGTGGGGAAAGCTCACTCGGATTATATGCTGTATGTATACGCTACATCTACATCCACCACTGGGACAAGCCAT

SEQ ID NO:8 CADM1-NRG1多肽序列

ASNIVGKAHSDYMLYVYATSTSTTGTSH

SEQ ID NO:33 CADM1的外显子1

GGTTGGGCTCGCGGCGCTGTGATTGGTCTGCCCGGACTCCGCCTCCAGCGCATGTCATTAGCATCTCATTAGCTGTCCGCTCGGGCTCCGGAGGCAGCCAACGCCGCCAGTCTGAGGCAGGTGCCCGACATGGCGAGTGTAGTGCTGCCGAGCGGATCCCAGTGTGCGGCGGCAGCGGCGGCGGCGGCGCCTCCCGGGCTCCGGCTCCGGCTTCTGCTGTTGCTCTTCTCCGCCGCGGCACTGATCCCCACAG

SEQ ID NO:34 CADM1的外显子2

GTGATGGGCAGAATCTGTTTACGAAAGACGTGACAGTGATCGAGGGAGAGGTTGCGACCATCAGTTGCCAAGTCAATAAGAGTGACGACTCTGTGATTCAGCTACTGAATCCCAACAGGCAGACCATTTATTTCAGGGACTTCAGGC

SEQ ID NO:35 CADM1的外显子3

CTTTGAAGGACAGCAGGTTTCAGTTGCTGAATTTTTCTAGCAGTGAACTCAAAGTATCATTGACAAACGTCTCAATTTCTGATGAAGGAAGATACTTTTGCCAGCTCTATACCGATCCCCCACAGGAAAGTTACACCACCATCACAGTCCTGG

SEQ ID NO:36 CADM1的外显子4

TCCCACCACGTAATCTGATGATCGATATCCAGAAAGACACTGCGGTGGAAGGTGAGGAGATTGAAGTCAACTGCACTGCTATGGCCAGCAAGCCAGCCACGACTATCAGGTGGTTCAAAGGGAACACAGAGCTAAAAG

SEQ ID NO:37 CADM1的外显子5

GCAAATCGGAGGTGGAAGAGTGGTCAGACATGTACACTGTGACCAGTCAGCTGATGCTGAAGGTGCACAAGGAGGACGATGGGGTCCCAGTGATCTGCCAGGTGGAGCACCCTGCGGTCACTGGAAACCTGCAGACCCAGCGGTATCTAGAAGTACAGT

SEQ ID NO:38 CADM1的外显子6

ATAAGCCTCAAGTGCACATTCAGATGACTTATCCTCTACAAGGCTTAACCCGGGAAGGGGACGCGCTTGAGTTAACATGTGAAGCCATCGGGAAGCCCCA

SEQ ID NO:39 CADM1的外显子7

GCCTGTGATGGTAACTTGGGTGAGAGTCGATGATGAAATGCCTCAACACGCCGTACTGTCTGGGCCCAACCTGTTCATCAATAACCTAAACAAAACAGATAATGGTACATACCGCTGTGAAGCTTCAAACATAGTGGGGAAAGCTCACTCGGATTATATGCTGTATGTATACG

SEQ ID NO:40 CADM1的外显子8

ACACAACGGCGACGACAGAACCAGCAGTTCACG

SEQ ID NO:41 CADM1的外显子9

GCCTTACTCAGTTGCCCAATTCCGCAGAAGAACTGGACAGTGAGGACCTCTCAG

SEQ ID NO:42 CADM1的外显子10

ATTCCCGAGCAGGTGAAGAAGGCTCGATCAGGGCAGTGGATCATGCCGTGATCGGTGGCGTCGTGGCGGTGGTGGTGTTCGCCATGCTGTGCTTGCTCATCATTCTGGGGCGCTATTTTGCCAGACATAAAG

SEQ ID NO:43 CADM1的外显子11

GTACATACTTCACTCATGAAGCCAAAGGAGCCGATGACGCAGCAGACGCAGACACAGCTATAATCAATGCAGAAGGAGGACAGAACAACTCCGAAGAAAAGAAAGAGTACTTCATCTAGATCAGCCTTTTTGTTTCAATGAGGTGTCCAACTGGCCCTATTTAGATGATAAAGAGACAGTGATATTGGAACTTGCGAGAAATTCGTGTGTTTTTTTATGAATGGGTGGAAAGGTGTGAGACTGGGAAGGCTTGGGATTTGCTGTGTAAAAAAAAAAAAAATGTTCTTTGGAAAGTACACTCTGCTGTTTGACACCTCTTTTTTCGTTTGTTTGTTTGTTTAATTTTTATTTCTTCCTACCAAGTCAAACTTGGATACTTGGATTTAGTTTCAGTAGATTGCAGAAAATTCTGTGCCTTGTTTTTTGTTTGTTTGTTGCGTTCCTTTCTTTTCCCCCTTTGTGCACATTTATTTCCTCCCTCTACCCCAATTTCGGATTTTTTCCAAAATCTCCCATTTTGGAATTTGCCTGCTGGGATTCCTTAGACTCTTTTCCTTCCCTTTTCTGTTCTAGTTTTTTACTTTTGTTTATTTTTATGGTAACTGCTTTCTGTTCCAAATTCAGTTTCATAAAAGGAGAACCAGCACAGCTTAGATTTCATAGTTCAGAATTTAGTGTATCCATAATGCATTCTTCTCTGTTGTCGTAAAGATTTGGGTGAACAAACAATGAAAACTCTTTGCTGCTGCCCATGTTTCAAATACTTAGAGCAGTGAAGACTAGAAAATTAGACTGTGATTCAGAAAATGTTCTGTTTGCTGTGGAACTACATTACTGTACAGGGTTATCTGCAAGTGAGGTGTGTCACAATGAGATTGAATTTCACTGTCTTTAATTCTGTATCTGTAGACGGCTCAGTATAGATACCCTACGCTGTCCAGAAAGGTTTGGGGCAGAAAGGACTCCTCCTTTTTCCATGCCCTAAACAGACCTGACAGGTGAGGTCTGTTCCTTTTATATAAGTGGACAAATTTTGAGTTGCCACAGGAGGGGAAGTAGGGAGGGGGGAAATACAGTTCTGCTCTGGTTGTTTCTGTTCCAAATGATTCCATCCACCTTTCCCAATCGGCCTTACTTCTCACTAATTTGTAGGAAAAAGCAAGTTCGTCTGTTGTGCGAATGACTGAATGGGACAGAGTTGATTTTTTTTTTTTTTTCCTTTGTGCTTAGTTAGGAAGGCAGTAGGATGTGGCCTGCATGTACTGTATATTACAGATATTTGTCATGCTGGGATTTCCAACTCGAATCTGTGTGAAACTTTCATTCCTTCAGATTTGGCTTGACAAAGGCAGGAGGTACAAAAGAAGGGCTGGTATTGTTCTCACACTGGTCTGCTGTCGCTCTCAGTTCTCGATAGGTCAGAGCAGAGGTGGAAAAACAGCATGTACGGATTTTCAGTTACTTAATCAAAACTCAAATGTGAGTGTTTTTATCTTTTTACCTTTCATACACTAGCCTTGGCCTCTTTCCTCAGCCTTAAGAACCATCTGCCAAAAATTACTGATCCTCGCATGATGGCAGCCATAGTGCATAGCTACTAAAATCAGTGACCTTGAACATATCTTAGATGGGGAGCCTCGGGAAAAGGTAGAGGAGTCACGTTACCATTTACATGTTTTAAAGAAAGAAGTGTGGGGATTTTCACTGAAACGTCTAGGAAATCTAGAAGTAGTCCTGAAGGACAGAAACTAAACTCTTACCATATGTTTGGTAAGACTCCAGACTCCAGCTAACAGTCCCTATGGAAAGATGGCATCAAAAAAGATAGATCTATATATATATATAAATATATATTCTATTACATTTTCAGTGAGTAATTTTGGATTTTGCAAGGTGCATTTTTACTATTGTTACATTATGTGGAAAACTTATGCTGATTTATTTAAGGGGGAAAAAGTGTCAACTCTTTGTTATTTGAAAACATGTTTATTTTTCTTGTCTTTATTTTAACCTTTGATAGAACCATTGCAATATGGGGGCCTTTTGGGAACGGACTGGTATGTAAAAGAAAATCCATTATCGAGCAGCATTTTATTTACCCCTCCCCTATCCCTAGGCACTTAACCAAGACAAAAAGCCACAATGAACATCCCTTTTTCAATGAATTTTATAATCTGCAGCTCTATTCCGAGCCCTTAGCACCCATTCCGACCATAGTATAATCATATCAAAGGGTGAGAATCATTTAGCATGTTGTTGAAAGGTTTTTTTTCAGTTGTTCTTTTTAGAAAAAAAGAAAAACAAAAACAAAAACAAAAAAAAAAAATCACACCATTGCTCACAGAATTGGCATCTCATTTTTGGGACCTCCCATCTTTCTGTTTTGAAAAGTGTACAGTAGTGCAGTGTTCCTGATGTAACTTTATGGCTTACAATGTTGACATGTCTCAGGTTCATGTGTTGCGATTGGTGTTTTCCGTCTCAGGTAGATTGCAAAGTGTAGGCCCCACACATTGGAAAAAATAATAATAAAACAAAGCAAAAACAGGAAATTATGGATTTTAGTTGTATATTGGTTTATGTATTTTTTCTTAAGTATACAGTGCACTGTTTGAAATGTATTGTTGAGTATTACTTTGTACAGGTTGATCACTTTTTTTAGAGTGAAGAAAGAACAAACTTGTTTTTTGTGTTTTTTAAAGGAATATAAAATAATGAAGGATGTATAATTGATGCCAAATAAGCTTGTTCTTTAGTCACACCGACGTCTTATTTTTCCCTTTAGGCCAGTTCTGTTTTTAAGGTGTACATGGACAATGTTACAGTGTAAGAAACTCCATATCCATATGTTCCCATTCGCATTTTGTATTGGTTCATGTATACCATTTTTACAAAAAAAAAAAGAAAAAAAAGAAGTACTATAAAATATCTGTCTTCTTAATAAAAAAAAATTAATGTTACAAAGTGA

SEQ ID NO:44 CADM1的全部11个外显子1-11按顺序排列的多核苷酸序列

SEQ ID NO:45 CADM1的外显子1的翻译多肽序列

MASVVLPSGSQCAAAAAAAAPPGLRLRLLLLLFSAAALIPT

SEQ ID NO:46 CADM1的外显子2的翻译多肽序列

DGQNLFTKDVTVIEGEVATISCQVNKSDDSVIQLLNPNRQTIYFRDFR

SEQ ID NO:47 CADM1的外显子3的翻译多肽序列

LKDSRFQLLNFSSSELKVSLTNVSISDEGRYFCQLYTDPPQESYTTITVL

SEQ ID NO:48 CADM1的外显子4的翻译多肽序列

PPRNLMIDIQKDTAVEGEEIEVNCTAMASKPATTIRWFKGNTELK

SEQ ID NO:49 CADM1的外显子5的翻译多肽序列

KSEVEEWSDMYTVTSQLMLKVHKEDDGVPVICQVEHPAVTGNLQTQRYLEVQ

SEQ ID NO:50 CADM1的外显子6的翻译多肽序列

KPQVHIQMTYPLQGLTREGDALELTCEAIGKP

SEQ ID NO:51 CADM1的外显子7的翻译多肽序列

PVMVTWVRVDDEMPQHAVLSGPNLFINNLNKTDNGTYRCEASNIVGKAHSDYMLYVY

SEQ ID NO:52 CADM1的外显子8的翻译多肽序列

TTATTEPAVH

SEQ ID NO:53 CADM1的外显子9的翻译多肽序列

LTQLPNSAEELDSEDLS

SEQ ID NO:54 CADM1的外显子10的翻译多肽序列

SRAGEEGSIRAVDHAVIGGVVAVVVFAMLCLLIILGRYFARHK

SEQ ID NO:55 CADM1的外显子11的翻译多肽序列TYFTHEAKGADDAADADTAIINAEGGQNNSEEKKEYFI

SEQ ID NO:56 CADM1多肽序列

MASVVLPSGSQCAAAAAAAAPPGLRLRLLLLLFSAAALIPTGDGQNLFTKDVTVIEGEVATISCQVNKSDDSVIQLLNPNRQTIYFRDFRPLKDSRFQLLNFSSSELKVSLTNVSISDEGRYFCQLYTDPPQESYTTITVLVPPRNLMIDIQKDTAVEGEEIEVNCTAMASKPATTIRWFKGNTELKGKSEVEEWSDMYTVTSQLMLKVHKEDDGVPVICQVEHPAVTGNLQTQRYLEVQYKPQVHIQMTYPLQGLTREGDALELTCEAIGKPQPVMVTWVRVDDEMPQHAVLSGPNLFINNLNKTDNGTYRCEASNIVGKAHSDYMLYVYDTTATTEPAVHGLTQLPNSAEELDSEDLSDSRAGEEGSIRAVDHAVIGGVVAVVVFAMLCLLIILGRYFARHKGTYFTHEAKGADDAADADTAIINAEGGQNNSEEKKEYFI

SEQ ID NO:57 CADM1的全部7个外显子1-7按顺序排列的多核苷酸序列

SEQ ID NO:58 CADM1的外显子1-7按顺序排列的翻译多肽序列

MASVVLPSGSQCAAAAAAAAPPGLRLRLLLLLFSAAALIPTGDGQNLFTKDVTVIEGEVATISCQVNKSDDSVIQLLNPNRQTIYFRDFRPLKDSRFQLLNFSSSELKVSLTNVSISDEGRYFCQLYTDPPQESYTTITVLVPPRNLMIDIQKDTAVEGEEIEVNCTAMASKPATTIRWFKGNTELKGKSEVEEWSDMYTVTSQLMLKVHKEDDGVPVICQVEHPAVTGNLQTQRYLEVQYKPQVHIQMTYPLQGLTREGDALELTCEAIGKPQPVMVTWVRVDDEMPQHAVLSGPNLFINNLNKTDNGTYRCEASNIVGKAHSDYMLYVY

CD44序列信息

SEQ ID NO:9来自CD44-NRG1融合物5’处的CD44外显子5的序列

GACGAAGACAGTCCCTGGATCACCGACAGCACAGACAGAATCCCTGCTACCA

SEQ ID NO:10 CD44-NRG1融合物3’处的NRG1外显2子序列

CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTSEQ ID NO:11 CD44-NRG1多核苷酸序列

GACGAAGACAGTCCCTGGATCACCGACAGCACAGACAGAATCCCTGCTACCACCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACT

SEQ ID NO:12 CD44-NRG1多肽序列

DEDSPWITDSTDRIPATTLPPRLKEMKSQESAAGSK

SEQ ID NO:61 CD44的外显子1

CTCATTGCCCAGCGGACCCCAGCCTCTGCCAGGTTCGGTCCGCCATCCTCGTCCCGTCCTCCGCCGGCCCCTGCCCCGCGCCCAGGGATCCTCCAGCTCCTTTCGCCCGCGCCCTCCGTTCGCTCCGGACACCATGGACAAGTTTTGGTGGCACGCAGCCTGGGGACTCTGCCTCGTGCCGCTGAGCCTGGCGCAGATCG

SEQ ID NO:62 CD44的外显子2

ATTTGAATATAACCTGCCGCTTTGCAGGTGTATTCCACGTGGAGAAAAATGGTCGCTACAGCATCTCTCGGACGGAGGCCGCTGACCTCTGCAAGGCTTTCAATAGCACCTTGCCCACAATGGCCCAGATGGAGAAAGCTCTGAGCATCGGATTTGAGACCTGCAG

SEQ ID NO:63 CD44的外显子3

GTATGGGTTCATAGAAGGGCACGTGGTGATTCCCCGGATCCACCCCAACTCCATCTGTGCAGCAAACAACACAGGGGTGTACATCCTCACATCCAACACCTCCCAGTATGACACATATTGCTTCAATGCTTCAG

SEQ ID NO:64 CD44的外显子4

CTCCACCTGAAGAAGATTGTACATCAGTCACAGACCTGCCCAATGCCTTTGATGGACCAATTACCATAA

SEQ ID NO:65 CD44的外显子5

CTATTGTTAACCGTGATGGCACCCGCTATGTCCAGAAAGGAGAATACAGAACGAATCCTGAAGACATCTACCCCAGCAACCCTACTGATGATGACGTGAGCAGCGGCTCCTCCAGTGAAAGGAGCAGCACTTCAGGAGGTTACATCTTTTACACCTTTTCTACTGTACACCCCATCCCAGACGAAGACAGTCCCTGGATCACCGACAGCACAGACAGAATCCCTGCTACCA

SEQ ID NO:66 CD44的外显子6

CTTTGATGAGCACTAGTGCTACAGCAACTGAGACAGCAACCAAGAGGCAAGAAACCTGGGATTGGTTTTCATGGTTGTTTCTACCATCAGAGTCAAAGAATCATCTTCACACAACAACACAAATGGCTG

SEQ ID NO:67 CD44的外显子7

GTACGTCTTCAAATACCATCTCAGCAGGCTGGGAGCCAAATGAAGAAAATGAAGATGAAAGAGACAGACACCTCAGTTTTTCTGGATCAGGCATTGATGATGATGAAGATTTTATCTCCAGCACCA

SEQ ID NO:68 CD44的外显子8

TTTCAACCACACCACGGGCTTTTGACCACACAAAACAGAACCAGGACTGGACCCAGTGGAACCCAAGCCATTCAAATCCGGAAGTGCTACTTCAGACAACCACAAGGATGACTGSEQ ID NO:69 CD44的外显子9

ATGTAGACAGAAATGGCACCACTGCTTATGAAGGAAACTGGAACCCAGAAGCACACCCTCCCCTCATTCACCATGAGCATCATGAGGAAGAAGAGACCCCACATTCTACAAGCACAA

SEQ ID NO:70 CD44的外显子10

TCCAGGCAACTCCTAGTAGTACAACGGAAGAAACAGCTACCCAGAAGGAACAGTGGTTTGGCAACAGATGGCATGAGGGATATCGCCAAACACCCAAAGAAGACTCCCATTCGACAACAGGGACAGCTG

SEQ ID NO:71 CD44的外显子11

CAGCCTCAGCTCATACCAGCCATCCAATGCAAGGAAGGACAACACCAAGCCCAGAGGACAGTTCCTGGACTGATTTCTTCAACCCAATCTCACACCCCATGGGACGAGGTCATCAAGCAGGAAGAAGGATGG

SEQ ID NO:72 CD44的外显子12

ATATGGACTCCAGTCATAGTATAACGCTTCAGCCTACTGCAAATCCAAACACAGGTTTGGTGGAAGATTTGGACAGGACAGGACCTCTTTCAATGACAACGC

SEQ ID NO:73 CD44的外显子13

AGCAGAGTAATTCTCAGAGCTTCTCTACATCACATGAAGGCTTGGAAGAAGATAAAGACCATCCAACAACTTCTACTCTGACATCAAGCA

SEQ ID NO:74 CD44的外显子14

ATAGGAATGATGTCACAGGTGGAAGAAGAGACCCAAATCATTCTGAAGGCTCAACTACTTTACTGGAAGGTTATACCTCTCATTACCCACACACGAAGGAAAGCAGGACCTTCATCCCAGTGACCTCAGCTAAGACTGGGTCCTTTGGAGTTACTGCAGTTACTGTTGGAGATTCCAACTCTAATGTCAATCGTTCCTTATCAG

SEQ ID NO:75 CD44的外显子15

GAGACCAAGACACATTCCACCCCAGTGGGGGGTCCCATACCACTCATGGATCTGAATCAGATG

SEQ ID NO:76 CD44的外显子16

GACACTCACATGGGAGTCAAGAAGGTGGAGCAAACACAACCTCTGGTCCTATAAGGACACCCCAAATTCCAG

SEQ ID NO:77 CD44的外显子17

AATGGCTGATCATCTTGGCATCCCTCTTGGCCTTGGCTTTGATTCTTGCAGTTTGCATTGCAGTCAACAGTCGAAGAAG

SEQ ID NO:78 CD44的外显子18

GTGTGGGCAGAAGAAAAAGCTAGTGATCAACAGTGGCAATGGAGCTGTGGAGGACAGAAAGCCAAGTGGACTCAACGGAGAGGCCAGCAAGTCTCAGGAAATGGTGCATTTGGTGAACAAGGAGTCGTCAGAAACTCCAGACCAGTTTATGACAGCTGATGAGACAAGGAACCTGCAGAATGTGGACATGAAGATTGGGGTGTAACACCTACACCATTATCTTGGAAAGAAACAACCGTTGGAAACATAACCATTACAGGGAGCTGGGACACTTAACAGATGCAATGTGCTACTGATTGTTTCATTGCGAATCTTTTTTAGCATAAAATTTTCTACTCTTTTTGTTTTTTGTGTTTTGTTCTTTAAAGTCAGGTCCAATTTGTAAAAACAGCATTGCTTTCTGAAATTAGGGCCCAATTAATAATCAGCAAGAATTTGATCGTTCCAGTTCCCACTTGGAGGCCTTTCATCCCTCGGGTGTGCTATGGATGGCTTCTAACAAAAACTACACATATGTATTCCTGATCGCCAACCTTTCCCCCACCAGCTAAGGACATTTCCCAGGGTTAATAGGGCCTGGTCCCTGGGAGGAAATTTGAATGGGTCCATTTTGCCCTTCCATAGCCTAATCCCTGGGCATTGCTTTCCACTGAGGTTGGGGGTTGGGGTGTACTAGTTACACATCTTCAACAGACCCCCTCTAGAAATTTTTCAGATGCTTCTGGGAGACACCCAAAGGGTGAAGCTATTTATCTGTAGTAAACTATTTATCTGTGTTTTTGAAATATTAAACCCTGGATCAGTCCTTTGATCAGTATAATTTTTTAAAGTTACTTTGTCAGAGGCACAAAAGGGTTTAAACTGATTCATAATAAATATCTGTACTTCTTCGATCTTCACCTTTTGTGCTGTGATTCTTCAGTTTCTAAACCAGCACTGTCTGGGTCCCTACAATGTATCAGGAAGAGCTGAGAATGGTAAGGAGACTCTTCTAAGTCTTCATCTCAGAGACCCTGAGTTCCCACTCAGACCCACTCAGCCAAATCTCATGGAAGACCAAGGAGGGCAGCACTGTTTTTGTTTTTTGTTTTTTGTTTTTTTTTTTTGACACTGTCCAAAGGTTTTCCATCCTGTCCTGGAATCAGAGTTGGAAGCTGAGGAGCTTCAGCCTCTTTTATGGTTTAATGGCCACCTGTTCTCTCCTGTGAAAGGCTTTGCAAAGTCACATTAAGTTTGCATGACCTGTTATCCCTGGGGCCCTATTTCATAGAGGCTGGCCCTATTAGTGATTTCCAAAAACAATATGGAAGTGCCTTTTGATGTCTTACAATAAGAGAAGAAGCCAATGGAAATGAAAGAGATTGGCAAAGGGGAAGGATGATGCCATGTAGATCCTGTTTGACATTTTTATGGCTGTATTTGTAAACTTAAACACACCAGTGTCTGTTCTTGATGCAGTTGCTATTTAGGATGAGTTAAGTGCCTGGGGAGTCCCTCAAAAGGTTAAAGGGATTCCCATCATTGGAATCTTATCACCAGATAGGCAAGTTTATGACCAAACAAGAGAGTACTGGCTTTATCCTCTAACCTCATATTTTCTCCCACTTGGCAAGTCCTTTGTGGCATTTATTCATCAGTCAGGGTGTCCGATTGGTCCTAGAACTTCCAAAGGCTGCTTGTCATAGAAGCCATTGCATCTATAAAGCAACGGCTCCTGTTAAATGGTATCTCCTTTCTGAGGCTCCTACTAAAAGTCATTTGTTACCTAAACTTATGTGCTTAACAGGCAATGCTTCTCAGACCACAAAGCAGAAAGAAGAAGAAAAGCTCCTGACTAAATCAGGGCTGGGCTTAGACAGAGTTGATCTGTAGAATATCTTTAAAGGAGAGATGTCAACTTTCTGCACTATTCCCAGCCTCTGCTCCTCCCTGTCTACCCTCTCCCCTCCCTCTCTCCCTCCACTTCACCCCACAATCTTGAAAAACTTCCTTTCTCTTCTGTGAACATCATTGGCCAGATCCATTTTCAGTGGTCTGGATTTCTTTTTATTTTCTTTTCAACTTGAAAGAAACTGGACATTAGGCCACTATGTGTTGTTACTGCCACTAGTGTTCAAGTGCCTCTTGTTTTCCCAGAGATTTCCTGGGTCTGCCAGAGGCCCAGACAGGCTCACTCAAGCTCTTTAACTGAAAAGCAACAAGCCACTCCAGGACAAGGTTCAAAATGGTTACAACAGCCTCTACCTGTCGCCCCAGGGAGAAAGGGGTAGTGATACAAGTCTCATAGCCAGAGATGGTTTTCCACTCCTTCTAGATATTCCCAAAAAGAGGCTGAGACAGGAGGTTATTTTCAATTTTATTTTGGAATTAAATACTTTTTTCCCTTTATTACTGTTGTAGTCCCTCACTTGGATATACCTCTGTTTTCACGATAGAAATAAGGGAGGTCTAGAGCTTCTATTCCTTGGCCATTGTCAACGGAGAGCTGGCCAAGTCTTCACAAACCCTTGCAACATTGCCTGAAGTTTATGGAATAAGATGTATTCTCACTCCCTTGATCTCAAGGGCGTAACTCTGGAAGCACAGCTTGACTACACGTCATTTTTACCAATGATTTTCAGGTGACCTGGGCTAAGTCATTTAAACTGGGTCTTTATAAAAGTAAAAGGCCAACATTTAATTATTTTGCAAAGCAACCTAAGAGCTAAAGATGTAATTTTTCTTGCAATTGTAAATCTTTTGTGTCTCCTGAAGACTTCCCTTAAAATTAGCTCTGAGTGAAAAATCAAAAGAGACAAAAGACATCTTCGAATCCATATTTCAAGCCTGGTAGAATTGGCTTTTCTAGCAGAACCTTTCCAAAAGTTTTATATTGAGATTCATAACAACACCAAGAATTGATTTTGTAGCCAACATTCATTCAATACTGTTATATCAGAGGAGTAGGAGAGAGGAAACATTTGACTTATCTGGAAAAGCAAAATGTACTTAAGAATAAGAATAACATGGTCCATTCACCTTTATGTTATAGATATGTCTTTGTGTAAATCATTTGTTTTGAGTTTTCAAAGAATAGCCCATTGTTCATTCTTGTGCTGTACAATGACCACTGTTATTGTTACTTTGACTTTTCAGAGCACACCCTTCCTCTGGTTTTTGTATATTTATTGATGGATCAATAATAATGAGGAAAGCATGATATGTATATTGCTGAGTTGAAAGCACTTATTGGAAAATATTAAAAGGCTAACATTAAAAGACTAAAGGAAACAGA

SEQ ID NO:79 CD44的全部18个外显子1-18按顺序排列的多核苷酸序列

SEQ ID NO:80 CD44的外显子1的翻译多肽序列

MDKFWWHAAWGLCLVPLSLAQI

SEQ ID NO:81 CD44的外显子2的翻译多肽序列

LNITCRFAGVFHVEKNGRYSISRTEAADLCKAFNSTLPTMAQMEKALSIGFETC

SEQ ID NO:82 CD44的外显子3的翻译多肽序列

YGFIEGHVVIPRIHPNSICAANNTGVYILTSNTSQYDTYCFNAS

SEQ ID NO:83 CD44的外显子4的翻译多肽序列

PPEEDCTSVTDLPNAFDGPITI

SEQ ID NO:84 CD44的外显子5的翻译多肽序列

IVNRDGTRYVQKGEYRTNPEDIYPSNPTDDDVSSGSSSERSSTSGGYIFYTFSTVHPIPDEDSPWITDSTDRIPAT

SEQ ID NO:85 CD44的外显子6的翻译多肽序列

LMSTSATATETATKRQETWDWFSWLFLPSESKNHLHTTTQMA

SEQ ID NO:86 CD44的外显子7的翻译多肽序列

TSSNTISAGWEPNEENEDERDRHLSFSGSGIDDDEDFISST

SEQ ID NO:87 CD44的外显子8的翻译多肽序列

STTPRAFDHTKQNQDWTQWNPSHSNPEVLLQTTTRMT

SEQ ID NO:88 CD44的外显子9的翻译多肽序列

VDRNGTTAYEGNWNPEAHPPLIHHEHHEEEETPHSTST

SEQ ID NO:89 CD44的外显子10的翻译多肽序列

QATPSSTTEETATQKEQWFGNRWHEGYRQTPKEDSHSTTGTA

SEQ ID NO:90 CD44的外显子11的翻译多肽序列

ASAHTSHPMQGRTTPSPEDSSWTDFFNPISHPMGRGHQAGRRM

SEQ ID NO:91 CD44的外显子12的翻译多肽序列

MDSSHSITLQPTANPNTGLVEDLDRTGPLSMTT

SEQ ID NO:92 CD44的外显子13的翻译多肽序列

QSNSQSFSTSHEGLEEDKDHPTTSTLTSS

SEQ ID NO:93 CD44的外显子14的翻译多肽序列

RNDVTGGRRDPNHSEGSTTLLEGYTSHYPHTKESRTFIPVTSAKTGSFGVTAVTVGDSNSNVNRSLS

SEQ ID NO:94 CD44的外显子15的翻译多肽序列

DQDTFHPSGGSHTTHGSESD

SEQ ID NO:95 CD44的外显子16的翻译多肽序列

HSHGSQEGGANTTSGPIRTPQIP

SEQ ID NO:96 CD44的外显子17的翻译多肽序列

WLIILASLLALALILAVCIAVNSRR

SEQ ID NO:97 CD44的外显子18的翻译多肽序列

CGQKKKLVINSGNGAVEDRKPSGLNGEASKSQEMVHLVNKESSETPDQFMTADETRNLQNVDMKIGV

SEQ ID NO:98 CD44多肽序列

MDKFWWHAAWGLCLVPLSLAQIDLNITCRFAGVFHVEKNGRYSISRTEAADLCKAFNSTLPTMAQMEKALSIGFETCRYGFIEGHVVIPRIHPNSICAANNTGVYILTSNTSQYDTYCFNASAPPEEDCTSVTDLPNAFDGPITITIVNRDGTRYVQKGEYRTNPEDIYPSNPTDDDVSSGSSSERSSTSGGYIFYTFSTVHPIPDEDSPWITDSTDRIPATTLMSTSATATETATKRQETWDWFSWLFLPSESKNHLHTTTQMAGTSSNTISAGWEPNEENEDERDRHLSFSGSGIDDDEDFISSTISTTPRAFDHTKQNQDWTQWNPSHSNPEVLLQTTTRMTDVDRNGTTAYEGNWNPEAHPPLIHHEHHEEEETPHSTSTIQATPSSTTEETATQKEQWFGNRWHEGYRQTPKEDSHSTTGTAAASAHTSHPMQGRTTPSPEDSSWTDFFNPISHPMGRGHQAGRRMDMDSSHSITLQPTANPNTGLVEDLDRTGPLSMTTQQSNSQSFSTSHEGLEEDKDHPTTSTLTSSNRNDVTGGRRDPNHSEGSTTLLEGYTSHYPHTKESRTFIPVTSAKTGSFGVTAVTVGDSNSNVNRSLSGDQDTFHPSGGSHTTHGSESDGHSHGSQEGGANTTSGPIRTPQIPEWLIILASLLALALILAVCIAVNSRRRCGQKKKLVINSGNGAVEDRKPSGLNGEASKSQEMVHLVNKESSETPDQFMTADETRNLQNVDMKIGV

SEQ ID NO:99 CD44的全部5个外显子1-5按顺序排列的多核苷酸序列

SEQ ID NO:100CD44的外显子1-5的翻译多肽序列

MDKFWWHAAWGLCLVPLSLAQIDLNITCRFAGVFHVEKNGRYSISRTEAADLCKAFNSTLPTMAQMEKALSIGFETCRYGFIEGHVVIPRIHPNSICAANNTGVYILTSNTSQYDTYCFNASAPPEEDCTSVTDLPNAFDGPITITIVNRDGTRYVQKGEYRTNPEDIYPSNPTDDDVSSGSSSERSSTSGGYIFYTFSTVHPIPDEDSPWITDSTDRIPAT

SLC3A2转录本6序列信息

SEQ ID NO:13SLC3A2-NRG1融合物5’处的SLC3A2外显子1序列

CCGCATCGGCGACCTTCAGGCCTTCCAGGGCCACGGCGCGGGCAACCTGGCGG

SEQ ID NO:14SLC3A2-NRG1融合物3’处的NRG1外显子5序列

CATCTACATCTACATCCACCACTGGGACAAGCCAT

SEQ ID NO:15SLC3A2-NRG1多核苷酸序列

CCGCATCGGCGACCTTCAGGCCTTCCAGGGCCACGGCGCGGGCAACCTGGCGGCATCTACATCTACATCCACCACTGGGACAAGCCAT

SEQ ID NO:16SLC3A2-NRG1多肽序列

RIGDLQAFQGHGAGNLAASTSTSTTGTSH

SEQ ID NO:103SLC3A2的外显子1

AGATGCAGTAGCCGAAACTGCGCGGAGGCACAGAGGCCGGGGAGAGCGTTCTGGGTCCGAGGGTCCAGGTAGGGGTTGAGCCACCATCTGACCGCAAGCTGCGTCGTGTCGCCGGTTCTGCAGGCACCATGAGCCAGGACACCGAGGTGGATATGAAGGAGGTGGAGCTGAATGAGTTAGAGCCCGAGAAGCAGCCGATGAACGCGGCGTCTGGGGCGGCCATGTCCCTGGCGGGAGCCGAGAAGAATGGTCTGGTGAAGATCAAGGTGGCGGAAGACGAGGCGGAGGCGGCAGCCGCGGCTAAGTTCACGGGCCTGTCCAAGGAGGAGCTGCTGAAGGTGGCAGGCAGCCCCGGCTGGGTACGCACCCGCTGGGCACTGCTGCTGCTCTTCTGGCTCGGCTGGCTCGGCATGCTTGCTGGTGCCGTGGTCATAATCGTGCGAGCGCCGCGTTGTCGCGAGCTACCGGCGCAGAAGTGGTGGCACACGGGCGCCCTCTACCGCATCGGCGACCTTCAGGCCTTCCAGGGCCACGGCGCGGGCAACCTGGCGG

SEQ ID NO:104SLC3A2的外显子2

GTCTGAAGGGGCGTCTCGATTACCTGAGCTCTCTGAAGGTGAAGGGCCTTGTGCTGGGTCCAATTCACAAGAACCAGAAGGATGATGTCGCTCAGACTGACTTGCTGCAGATCGACCCCAATTTTGGCTCCAAGGAAGATTTTGACAGTCTCTTGCAATCGGCTAAAAAAAAGA

SEQ ID NO:105SLC3A2的外显子3

GCATCCGTGTCATTCTGGACCTTACTCCCAACTACCGGGGTGAGAACTCGTGGTTCTCCACTCAGGTTGACACTGTGGCCACCAAGGTGAA

SEQ ID NO:106SLC3A2的外显子4

GATGCTCTGGAGTTTTGGCTGCAAGCTGGCGTGGATGGGTTCCAGGTTCGGGACATAGAGAATCTGAAG

SEQ ID NO:107SLC3A2的外显子5

GATGCATCCTCATTCTTGGCTGAGTGGCAAAATATCACCAAGGGCTTCAGTGAAGACAG

SEQ ID NO:108SLC3A2的外显子6

GCTCTTGATTGCGGGGACTAACTCCTCCGACCTTCAGCAGATCCTGAGCCTACTCGAATCCAACAAAGACTTGCTGTTGACTAGCTCATACCTGTCTGATTCTGGTTCTACTGGGGAGCATACAAAATCCCTAGTCACACAGTATTTGAATGCCACTGGCAATCGCTGGTGCAGCTGGAGT

SEQ ID NO:109SLC3A2的外显子7

TTGTCTCAGGCAAGGCTCCTGACTTCCTTCTTGCCGGCTCAACTTCTCCGACTCTACCAGCTGATGCTCTTCACCCTGCCAGGGACCCCTGTTTTCAGCTACGGGGATGAGATTGGCCTGGATGCAGCTGCCCTTCCTGGACAG

SEQ ID NO:110SLC3A2的外显子8

CCTATGGAGGCTCCAGTCATGCTGTGGGATGAGTCCAGCTTCCCTGACATCCCAGGGGCTGTAAGTGCCAACATGACTGTGAAG

SEQ ID NO:111SLC3A2的外显子9

GGCCAGAGTGAAGACCCTGGCTCCCTCCTTTCCTTGTTCCGGCGGCTGAGTGACCAGCGGAGTAAGGAGCGCTCCCTACTGCATGGGGACTTCCACGCGTTCTCCGCTGGGCCTGGACTCTTCTCCTATATCCGCCACTGGGACCAGAATGAGCGTTTTCTGGTAGTGCTTAACTTTGGGGATGTGGGCCTCTCGGCTGGACTGCAGGCCTCCGACCTGCCTGCCAGCGCCAGCCTGCCAGCCAAGGCTGACCTCCTGCTCAGCACCCAGCCAGGCCGTGAGGAGGGCTCCCCTCTTGAGCTGGAACGCCTGAAACTGGAGCCTCACGAAGGGCTGCTGCTCCGCTTCCCCTACGCGGCCTGACTTCAGCCTGACATGGACCCACTACCCTTCTCCTTTCCTTCCCAGGCCCTTTGGCTTCTGATTTTTCTCTTTTTTAAAAACAAACAAACAAACTGTTGCAGATTATGAGTGAACCCCCAAATAGGGTGTTTTCTGCCTTCAAATAAAAGTCACCCCTGCATGGTGAA

SEQ ID NO:112SLC3A2的全部9个外显子1-9按顺序排列的多核苷酸序列

SEQ ID NO:113SLC3A2的外显子1的翻译多肽序列

MSQDTEVDMKEVELNELEPEKQPMNAASGAAMSLAGAEKNGLVKIKVAEDEAEAAAAAKFTGLSKEELLKVAGSPGWVRTRWALLLLFWLGWLGMLAGAVVIIVRAPRCRELPAQKWWHTGALYRIGDLQAFQGHGAGNLA

SEQ ID NO:114SLC3A2的外显子2的翻译多肽序列

LKGRLDYLSSLKVKGLVLGPIHKNQKDDVAQTDLLQIDPNFGSKEDFDSLLQSAKKK

SEQ ID NO:115SLC3A2的外显子3的翻译多肽序列

IRVILDLTPNYRGENSWFSTQVDTVATKV

SEQ ID NO:116SLC3A2的外显子4的翻译多肽序列

DALEFWLQAGVDGFQVRDIENLK

SEQ ID NO:117SLC3A2的外显子5的翻译多肽序列

DASSFLAEWQNITKGFSED

SEQ ID NO:118SLC3A2的外显子6的翻译多肽序列

LLIAGTNSSDLQQILSLLESNKDLLLTSSYLSDSGSTGEHTKSLVTQYLNATGNRWCSWS

SEQ ID NO:119SLC3A2的外显子7的翻译多肽序列

LSQARLLTSFLPAQLLRLYQLMLFTLPGTPVFSYGDEIGLDAAALPGQ

SEQ ID NO:120SLC3A2的外显子8的翻译多肽序列

PMEAPVMLWDESSFPDIPGAVSANMTVK

SEQ ID NO:121SLC3A2的外显子9的翻译多肽序列

GQSEDPGSLLSLFRRLSDQRSKERSLLHGDFHAFSAGPGLFSYIRHWDQNERFLVVLNFGDVGLSAGLQASDLPASASLPAKADLLLSTQPGREEGSPLELERLKLEPHEGLLLRFPYAA

SEQ ID NO:122SLC3A2多肽序列

MSQDTEVDMKEVELNELEPEKQPMNAASGAAMSLAGAEKNGLVKIKVAEDEAEAAAAAKFTGLSKEELLKVAGSPGWVRTRWALLLLFWLGWLGMLAGAVVIIVRAPRCRELPAQKWWHTGALYRIGDLQAFQGHGAGNLAGLKGRLDYLSSLKVKGLVLGPIHKNQKDDVAQTDLLQIDPNFGSKEDFDSLLQSAKKKSIRVILDLTPNYRGENSWFSTQVDTVATKVKDALEFWLQAGVDGFQVRDIENLKDASSFLAEWQNITKGFSEDRLLIAGTNSSDLQQILSLLESNKDLLLTSSYLSDSGSTGEHTKSLVTQYLNATGNRWCSWSLSQARLLTSFLPAQLLRLYQLMLFTLPGTPVFSYGDEIGLDAAALPGQPMEAPVMLWDESSFPDIPGAVSANMTVKGQSEDPGSLLSLFRRLSDQRSKERSLLHGDFHAFSAGPGLFSYIRHWDQNERFLVVLNFGDVGLSAGLQASDLPASASLPAKADLLLSTQPGREEGSPLELERLKLEPHEGLLLRFPYAA

NRG1序列信息

SEQ ID NO:125NRG1的外显子1

AGTAAGCCTCCGCAGCCCACTCGGACTGCAGCCTGTTTGCCGCCCGTCCTCCCATTGCAGCACTCGGGGCGACAGAGAGGGAGGAGGCGCGCGGGGACGGGGACGCCCAGGAGGACCCACTCGCGGGTCCCGCTCCGCTCCGGCAGCAGCATGGGGAAAGGACGCGCGGGCCGAGTTGGCACCACAG

SEQ ID NO:126NRG1的外显子2

CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAACCAGTTCTGAATACTCCTCTCTCAGATTCAAGTGGTTCAAGAATGGGAATGAATTGAATCGAAAAAACAAACCACAAAATATCAAGATACAAAAAAAGCCAGG

SEQ ID NO:127NRG1的外显子3

GAAGTCAGAACTTCGCATTAACAAAGCATCACTGGCTGATTCTGGAGAGTATATGTGCAAAGTGATCAGCAAATTAGGAAATGACAGTGCCTCTGCCAATATCACCATCGTGGAATCAAACG

SEQ ID NO:128NRG1的外显子4

AGATCATCACTGGTATGCCAGCCTCAACTGAAGGAGCATATGTGTCTTCAG

SEQ ID NO:129NRG1的外显子5

AGTCTCCCATTAGAATATCAGTATCCACAGAAGGAGCAAATACTTCTTCAT

SEQ ID NO:130NRG1的外显子6

CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCTTCATGGTGAAAGACCTTTCAAACCCCTCGAGATACTTGTGCAA

SEQ ID NO:131NRG1的外显子7

GTGCCCAAATGAGTTTACTGGTGATCGCTGCCAAAACTACGTAATGGCCAGCTTCTACASEQ ID NO:132NRG1的外显子8

AGCATCTTGGGATTGAATTTATGG

SEQ ID NO:133NRG1的外显子9

AGGCGGAGGAGCTGTACCAGAAGAGAGTGCTGACCATAACCGGCATCTGCATCGCCCTCCTTGTGGTCGGCATCATGTGTGTGGTGGCCTACTGCAAAACCAA

SEQ ID NO:134NRG1的外显子10

GAAACAGCGGAAAAAGCTGCATGACCGTCTTCGGCAGAGCCTTCGGTCTGAACGAAACAATATGATGAACATTGCCAATGGGCCTCACCATCCTAACCCACCCCCCGAGAATGTCCAGCTGGTGAAT

SEQ ID NO:135NRG1的外显子11

CAATACGTATCTAAAAACGTCATCTCCAGTGAGCATATTGTTGAGAGAGAAGCAGAGACATCCTTTTCCACCAGTCACTATACTTCCACAGCCCATCACTCCACTACTGTCACCCAGACTCCTAGCCACAG

SEQ ID NO:136NRG1的外显子12

CTGGAGCAACGGACACACTGAAAGCATCCTTTCCGAAAGCCACTCTGTAATCGTGATGTCATCCGTAGAAAACAGTAGGCACAGCAGCCCAACTGGGGGCCCAAGAGGACGTCTTAATGGCACAGGAGGCCCTCGTGAATGTAACAGCTTCCTCAGGCATGCCAGAGAAACCCCTGATTCCTACCGAGACTCTCCTCATAGTGAAAG

SEQ ID NO:137NRG1的外显子13

GTATGTGTCAGCCATGACCACCCCGGCTCGTATGTCACCTGTAGATTTCCACACGCCAAGCTCCCCCAAATCGCCCCCTTCGGAAATGTCTCCACCCGTGTCCAGCATGACGGTGTCCATGCCTTCCATGGCGGTCAGCCCCTTCATGGAAGAAGAGAGACCTCTACTTCTCGTGACACCACCAAGGCTGCGGGAGAAGAAGTTTGACCATCACCCTCAGCAGTTCAGCTCCTTCCACCACAACCCCGCGCATGACAGTAACAGCCTCCCTGCTAGCCCCTTGAGGATAGTGGAGGATGAGGAGTATGAAACGACCCAAGAGTACGAGCCAGCCCAAGAGCCTGTTAAGAAACTCGCCAATAGCCGGCGGGCCAAAAGAACCAAGCCCAATGGCCACATTGCTAACAGATTGGAAGTGGACAGCAACACAAGCTCCCAGAGCAGTAACTCAGAGAGTGAAACAGAAGATGAAAGAGTAGGTGAAGATACGCCTTTCCTGGGCATACAGAACCCCCTGGCAGCCAGTCTTGAGGCAACACCTGCCTTCCGCCTGGCTGACAGCAGGACTAACCCAGCAGGCCGCTTCTCGACACAGGAAGAAATCCAGGCCAGGCTGTCTAGTGTAATTGCTAACCAAGA

CCCTATTGCTGTATAAAACCTAAATAAACACATAGATTCACCTGTAAAACTTTATTTTATA

TAATAAAGTATTCCACCTTAAATTAAACAATTTATTTTATTTTAGCAGTTCTGCAAATAGA

AAACAGGAAAAAAACTTTTATAAATTAAATATATGTATGTAAAAATGTGTTATGTGCCAT

ATGTAGCAATTTTTTACAGTATTTCAAAACGAGAAAGATATCAATGGTGCCTTTATGTTAT

GTTATGTCGAGAGCAAGTTTTGTACAGTTACAGTGATTGCTTTTCCACAGTATTTCTGCA

AAACCTCTCATAGATTCAGTTTTTGCTGGCTTCTTGTGCATTGCATTATGATGTTGACTG

GATGTATGATTTGCAAGACTTGCAACTGTCCCTCTGTTTGCTTGTAGTAGCACCCGATCA

GTATGTCTTGTAATGGCACATCCATCCAGATATGCCTCTCTTGTGTATGAAGTTTTCTTTG

CTTTCAGAATATGAAATGAGTTGTGTCTACTCTGCCAGCCAAAGGTTTGCCTCATTGGG

CTCTGAGATAATAGTAGATCCAACAGCATGCTACTATTAAATACAGCAAGAAACTGCATT

AAGTAATGTTAAATATTAGGAAGAAAGTAATACTGTGATTTAAAAAAAACTATATTATTA

ATCAGAAGACAGCTTGCTCTTACTAAAAGGAGCTCTCATTTACTTTATTTGATTTTATTTT

TCTTGACAAAAAGCAACAGTTTTAGGGATAGCTTAGAAAATGGGTTCTGGCTTGCTATC

AGGGTAAATCTAACACCTTACAAGAGGACTGAGTGTCACTTTCTCTCTGGGGGAATGAT

CCAGCAGCTTATCTAGTTGACAATCAAAACACGGCTGATAAAGGTGCAATCATTTCTGA

CATGTATTTTTCACTGATTTTGAAGCTAGTGATTGGTTGTGTCTTCTTGGCTCAAAAAGA

AGCATATTACGGCACAAAAAGCCCAGCCCAGACAGCACATGCAGCATTTTGTCTGAAA

TACTTCTAGAGTCAAACGTGCCTGCTGTACATAGCGATGACTTGTCATCATAGGGAAGT

ATTTCCATCGTAGAGTGTTCAGAAGGAGTGACTGTATAGGTGGAGAGAAGCTTAGTGA

CTCCGTTGAAATTTTAAAATGTGGATGACCACCCCTTTCTCCCCCTTATTTTTCTTTTATC

TTTCCATGTTGCCTTGATCAGGTCATAACTATGCATGAACATTTTTTATCAGGAATGGCC

GATGTGTATGTGATTTGTAATCACAAGTAATGATTCATCAGGAAATGTCAATCCTGTTGG

AAAGATTGCACCTTTACTTGCAGAAGTGACCCCCACCTGTGTCCTGACCTCTCCATTTA

CAGGCTCTCTCACCCATTTCCCCCACCTCCTTTAATTTTTGCTTTACTGTCATAAAGTAG

GACTAAGATTGGTCTAAGCATTGCATGTTCTTTTGTGATGGTAAATCCAAAGGAAGGCC

TATAAGTATTAACATTTGAAATAACTGCTAATTCAGGAAAATGGAAGAAAAAAAATTATT

TGAAACACAGAACCCATTTCATGGCCTGCCTGATATCTGTGAAATCAGGGCTGGAGCTT

TACTTAGGATTCACATGGCCTCCTAGGAACCATGGGACAAATGGGAAACAGGTTATCGG

GGGATTCATGAAGTCAGTGAGAGTAATTGCTTCTTTTTTGCGGGTGAACTGAATGTATTT

CTTCACCAAATCTTGATGTTAACAATTAAAAAGAAGAAATGACATGCAAGTAGGTCTTA

GCAGAAAAATGCAGGCTGGGCATGAGTCATGTTGTTACCCTCCCACATGCTCCTACAAT

CCACAGAGATGCCTGTCTGCAGGTTCTTGAAGTTATTGTTAGTATTTGGTATCTCAAATT

TTTCGTCACTGTTCACATGCCACTTTCTCTGTGCACAGTGGTATCCTCATTTGCTTTTTAA

CCTACACTGAGGAGTCTTTGTCAGGTTGCACTGATTTTCCAATTCTGCAGTAATGAGTA

AGCTCACGGCATGGGGAAGAAGACAGTCAGTCCAATGAAGTTCTCTAAATTATTTTAAC

ATTGCCTTTGAAGGCCTTGACTCATCCTTAGCTATTTCAATGAAGAAATTCCTACCATGA

ATTTAAAACCCTAAAAATTCTGTTTCAAATTCTTTGGGCATTGGGGTACTCAGATATCCC

ATTGTGGAAGAATTTTAAGAATAAATAGAAGTTTCTGTTGAGAACCATGAGCAACATGT

TTCTTACAATGAGAATTGCTATGCATTTTAAAATTGCAAATATATATGAAAATTGAAGAC

AAGAGGAAATTGTATTTCTAACTTGATTCTGATCACTCACAGAGGTGGCATATTATTATA

GTTGGGACATCCTTTGCACCCTTCATAAAAAAGGCCAGCTGACTGCTCAGCATCACCTG

CCAAGGCCACTAGATTTGTGTTTACAGGGGTATCTCTGTGATGCTTGTCACATCACTCTT

GACCACCTCTGTTAATAAATTCCGACAGTGCAGTGGCGATCGGAGTGTGAACTTATGTT

CCCAGCATATGGAAAGCTATCTTAGGTTTTAAGGTAGTAGAAATTGCCCAGGAGTTTGA

CAGCAACTTTGTTTCCCGGGTCTAAAATCGTATCCCACTGAGGTGTATGCAGTGGAGCA

TAATACATGCAAATACATGCAAAACTCCTTTTGTTTCACCTAAGATTCACTTTCTATCTTA

CTTTCCCTTCCTGCCTAGTGTGACTTTTGCCCCCAAGAGTGCCTGGACAGCATTCTAGT

TTCTACAAAATGGTCCTCTGTGTAGGTGAATGTGTCCCAAACCTGCTATCACTTTCTTGT

TTCAGTGTGACTGTCTTGTTAGAGGTGAAGTTTATCCAGGGTAACTTGCTCACTAACTAT

TCCTTTTTATGGCCTGGGGTTAAAGGGCGCATGGCTCACACTGGTGAAAATAAGGAAG

GCCTGGTCTTATCTTGTATTAATAATACTGGCTGCATTCCACCAGCCAGAGATTTCTATCT

GCGAAGACCTATGAAACACTGAAGAGAAATGTAGGCAGAAGGAAATGGCCACATATCA

CAAGTTCTATTATATATTCTTTTGTAAATACATATTGTATATTACTTGGATGTTTTCTTATAT

CATTTACTGTCTTTTTGAGTTAATGTCAGTTTTTACTCTCTCAACTTACTATGTAACATTG

TAAATAACATAATGTCCTTTATTATTTATATTTAAGCATCTAACATATAGAGTTGTTTTCAT

ATAAGTTTAAGATAAATGTCAAAAATATATGTTCTTTTGTTTTTCTTTGCTTTAAAATTATG

TATCTTTTCCTTTTCTTTTTTTTAAGAATAATTTATTGTTCAGGAGAAAGAATGTATATGTA

ACTGAAACTATCTGAAGAATGCACATTGAAGGCCGTGAGGTACTGATAAACTAAAGAA

TTTATTATTCAAAATACTAAGCAATAAGTAATTGTGATTTATTTAAAGTTTTGTCCATTTTC

CATGAAAGACATACTGCAATAAAAATGCTACTCTGTGGAGACCTGGGAGTGTTGCTCAG

CAGACTACAGCTTCAGTCTGTTAGACCAGCACCTTTCATCTCATTCCCATAGTTATGCTA

ATTTAGGATTGTGTTCCATGGACCCCATGATCACCTTGTCTATACGTTGCTTCTTGTCTGT

CCATTGCTTTTGCCACACCACCTGTTCTCAAATCATCTCCTCCCTACCAATGCTGTTTATC

ACTTTCTTCCTTGTTGAAGAGGCCACACAACCAGACAGTACTATGCTTCCTTTTTCCTC

CATACACAATAACAGAGAGAGAATATTCTAGGGCATGACTGCCTGGATCCTGGCTGTTG

CTATCTTTTGTAGTGGCAGTAAGAAACTCCTTCAGACTAATGAAAATGTCAACGTGCCA

TTCAATCACGAAAGGTAACGAAAAATGCTCTCATGGTTCAAATAGTCCAATGGCCCATA

GTGGCCTAAAAGGCAGCCAGTTGACACCTGGCCATGCTAAGCTTCCTTATACCATCCGC

TAATGACTTTCCATTGGGCCCACAATTTACGGATTCATAATTTTAAAAGAGGAGAAGGC

CAAGTTAGGTTCATTCCCCTTATTCTGTCAATAAAACAAATCAAACTCATGTCTATCTAA

CTGCTCAGGGAGGAGCCTTTGCATGAGAAAATTCTCATATTCTAAGACTGAGTCATAGA

AATGAGGGTATTACTTTTCTTACTGCAATTAACCTAAACAAAAGCCATATTTTAACAAAT

AGATATTTGCATGGTACCCTTCATATATTCCAAGCATTTCACTCATTATTCCAGGTAGGTT

AAGAGCTTCTGAAGTGTATGAAGTAAAGGTCAGCAATCCTTTGGGGTGAACAGTGGCC

TCCTTTGGAGTTTGGGGGTAACCTGAGACTTCCCACCAATGTCCACCTCCATCTGTGTA

CCTAATTCCTATTACCTAGTTATGGCTCCTCTAGGATCATTTCCAAACACTCTGGATGTCC

AGGAAATTTAAATTGTAGCTTTTGACTGAGCTAGTTTTTCCTATTTATATTAATAAATTTT

CAAAAATGCTTGAAATCTTCACATTTGCAACAACTTTAGTTTTCATGCACATACAAACA

CAGAGAGACAAAAATTCCAAACAGACACTCTCCAAAAGCCACCACACTCTTTCACTTG

CTCTATAGTCATTTAGCCAACCAGCCATGCAGAGAATATTTAAAACTTAAAGATTGAGAC

ATTATTCTCAGTTTTTGCTGAGGCTTTGTAACGAAATTGAACACTATAAGCAGCTATTGT

AGTAATTTTGGTTAAAATTGTTTGCCTGGGATATAGTATTTGAGGCAGAAGCACGTGTGT

GAAGGAGGTGAGGTGGTTTGGAAAGAGTGAAGACTCGCAGCCAGATTGAATGTCTGG

ATAATTACTATAATTCTCCCTTCTTGGTTGAAACCATGTTCTCTCTTGATTTTTAAACCCA

GGCTGCCTCTGGAAACAAGCAAACCTGAGTCTTTCTAACCTGAGTCTTCCCAATCATTA

GATTTCTTTTCTGTCCTAACGATGAATGATAAAAGGACTTGATGTTCACAATTTGGGGTT

ATAAGGCAGGTCTGAAATCTGGAGACTCAAGATGCTGGAAGGAGTGGAAAGTTTCGAT

GACTTTATATGAATCACTTTGCACTCTATGTTTGGCTTGTCCTCTTTGAAACTGATTTACT

AAAATAAATGTAAGGGAACTATTACTCCAAAAGATTAACTTGGCAGGAAATACCAATAC

TTTCAGTTTATGAAAGACAAAACTGTCTTGTTGCTACAGGAAGCTGCAATGTTCCTAAC

CTTTAAGGTTGGTGTTGAATAGGGTGGTCATGCCCTCCCCTGCAGGTATCTTTAGGCTCC

TGTTGACCTCCTGGTACTATAACTGTTCGTCTTCTCTGGGTAGCTATTGATTTTGAACTTT

AACATGCTTCAAAACTTTATTCATCAGGGAAATAGGAAAAGAGTTTTGTTACCTGGAGG

AAATCTATTGTGATCTACCTGAGCTTTTTAAAAACAGACCAGGAGAAGGAAACCAGTA

ATTTTTAAAGAAGAGACAGAGAATGGGATAATAGTTTCACCCAGGATCTCTTTCTAACC

CTTTCCCTTCAAATGAACTTATTGGAACAGAATTGGAAAGAAGAAAGGACATCTCTGCC

CACCCCACAGGATGCCAAAAAGGCTAAAGAATTACCTCTGTAGATTTAAACATCTTTAA

TGGCTTATGTATAGATTTGCTAATACAGAGAGAAATGAACTATTAAATAAAAATCACATT

TTATAATATTTTTATGGCTTAAAACATCCTTTATCTCCTTTTTGTTCTCTCTACATGATATG

GTAAGTGATGAGGAAAATTTAGGCTCAGGAAGGTTAAAATCTTTCTTGGAGTTACACAT

CTAAGAGAGCTGCAGAGCTGACACTTGTACCCAGGTTTTCTGACTGCAAATCCAGTTTC

TTTCTATTGCGTTCTTCCCCTTTCCCTGCCTCAAGCAGAAACAGGTTTTTTATTTTCAAC

CTTTATGTATACAGTATGTTATGTTACATCTACAGCTAAGTTTCTTTTTAGAAGAATGTGA

GCCCTTCTAGCTTTGGTTTAGAGTGATTCTAGAAGCCAATTTCCTTGGCTTAGTGATTCT

ATGCACCTTTCCTAAACTTAGCTTTCTAAGGAAATGAAGTGTACGAGTGAGAATGAATT

CACAATTTCGACATGTAGGTAGCATCCTAAAGTGAAAAGAGGAGGAAATTTGTGGTCA

AAGCACTCTCCCCACCACTTAGAAACTTACTGACTGTGGGCAGCTTCCTCCTCCAAGTT

TCCTTCCTGATTTACAAGACCGTGGTGTGGTCAGGATTAAACTTGAATACATGTAAGGA

AGCCTGAAAGTGTCTAACACATAGCGAGTATTCAAATGCCACCTTCTATTTGATCCTTCC

CCTCCAGTTCCTTAAGTTTTGGAATCTAGGTTTCTCAGTTCCAAATGGATTGACATTTGC

ATATCCCCATTGCACAATGGATCAAATAAACTTTATGTTATCATTTCTCCAACATAGTGCC

AGTAAGCAAATCCTTTTTAATAACAACAGTATGTTGAGAAACATATCACCAAATAATATT

TAACTTTGTAGCTTTGATAAGTTCTTTAGGTTTTGGTTTTGGTTTTGTTTTCTGAGACAG

GGTCTTGATCTGTCACCCAGACTGGAGTGCAATGGTTCAATTTTAGCTCACTGCAACCT

GTAACTCCTGAGCTCAAGTGATCCTCCCACCTCAGCCTCTCAAGTAGCTGGGACTACAG

GTGTGCTCCACCATGCCCAGCGATTTTTTTTTTTTTTTTTTTTTTTTTTTTTGGTAGGGAC

AAGGTCTCGCTATGTTGCCCAGGCTGGTCTTCAATTCCTGGCCTTAAGTGATCCTCCTGC

CTCGGCCTCCCAAAGTGCTGGAATTACAGGCATGAGCCACCACCCATAACTTTATGTTT

GTTTTTTTGATGCAGTATAAGTTCAGCTTGCTTCTTATGCAGCCATACCATTTCATGTTAA

CTCTGATTTTTAGCAGCTTATTACATTAGTGTTTTATTATTAATATAATTTTACAGAAATTT

ACTAAACCATGACTCTGTAGAGTTTTAATAATACTACCTCCAAACATCATTGCAAACATC

TAGAAGAATGAACAAAAATGATCTTAGATCGACAGTATATCTGTTTGTCTTAGTTTCTAC

ACAGGATGTTCAGACATATTCCATTTCTTTAAAAAAAAAATATATATATATATATATATATAT

AGGCCTGGCACGGTGGCTCATGACTGTAATCCCAGCACTTTGGGAGGCTTAGGCAGGC

AAATCACCTGAGGTCAGGAGTTTGAGACTGGCCTGACCAACATGGTGAAACCTCGTCT

CTATTAAAATTACAAAAATTAGCCGGGCGTGGTGGCACATGCCTGTAATCCCAGCTACT

CGGGAGGCTGAGGCAGGAGAATCACTTGAACCTGGGAGGCAGAGGTTGCAGTGAGTT

GAGATCACGCCATTGCACTCCAGCCTTGGTGACAAGAGTGAAACTCCGTCTCAAAAAA

AAAAAAAATATGTATATATATATATATATATATATATATATATATATATATATATATATAAAATCC

CACCAAAAGTCTGCAGAGTGACCAAATTAGACGGCTCTGGTTTCAGATTAAATTCTAAA

TGTGAGAAACCACATAGCTCCCATGATCCATCCAATAATTCCTCACGTCCTCTTCACTCT

TTACTCCATGCATAAAACAGAATTTTTTTTTCTCATCCTGGGTATGAAGCAATTAATAATT

TACGGATTTAGCCTATTTGGATTCAATCCCTTCAAACTCCATACTACATCCAAGGTGGAA

GTGACTTAAACTCTGATATCAATCATCAGGCTTGTAATATAGGCTTTGTTAATGGCAGGA

GAGTCTAATAAAACTTTCTGTTCCTTATCCTTCATTTAAATGAAAAACTTTTTATTGAAA

ACAATCATAACTCTAGCTCATCATAAATATAATTCATGAGGACATTTTATTATTTTTATATT

AAAGAAATAATATTATAGATGTAAACTTTGCACCTTTCTAATTATTATCATGAGTTAAGCT

AATACTTGTCTTCTGGTCCCTAGATGATGATTCTTTTTTGCCTTACTGGAGGAGCCCTTG

TCTTGAAGTGAGTTGCTTCAACAGCAGAGGACTTCTAGTTTCTCCCAGTTGAGCCTAAA

GTGAACTTTTCATCTTCTTCAGAGGAAGGGGCTTCCTTGATTTGTACTTTTGTGGCTCCT

CAGATAACACAGACAATTTTATCTTGGATCCCAGGTTCTCTTCACCATTAAGAATAAGAA

AGAGAGAAAATGCTGTGCATGACAGCCACCTACTCCAAACTACCCAACCCCCTGTAAC

CAGGTACCTTCCAACAACGAGATGATTCTGCCCTCACTCAAGAGTCTCCCCCACAAAG

ATTCCATTCTCCCTTTACTTTTTATTTTTTATTTTTTTGCAAAACAAAGGCCTCCTTTAGTA

CCTCCTTAGTTTATAACCCTTATCTTCCCAGCTCTTCCCTTCACTGATACCTCTGATTTCA

AAAGTTCTGAAGTCGGAAGACCACACAATTTCAGACTGTGAACAGAAATTCAGTCAGA

AATTATTGGAGTTAGAAAGAATTTAGAGAAATTGTATTGAACTAGAAAGTCCTCTTTGAT

TAGTGGTGGCCCTTTAGAAAGTTCTAGGGCAGAGTCCCATGGTGTTTCATCTTTTCCATG

ATTTGCTTGACCAAAAACTTTTCTTTCACAACATGAAAATATGCTAATCCACCACACATT

TTGGATTCTGCTCTGTTTGCCTGAGGTGTTAGATCTCTAGCCAGGACTGTGAAGGGAAG

GAACTTGAATCCTTCCTATTGAGCTATTAATGCAGAGTCAGTGAGATGAAGGGTTCCAC

TCGGGGTCAAAATCATGTCAGTTACCAAGCAAAGGAGCAAGTAAGGGGAAACATCTCC

TCATCTGGTTAGTGGAGCCACATTTCACCCACTGATCAAGCCAGACCTGAGCAATAGTC

TAGATTTCTCCCTCCACATCTAATTGGTGACAATGGTGATTGTACCACTGACAGGTCACA

CAAGTCCACACCCTCCTTCACAGCCTCACTGCTTCGGCTCTTGTTTATGCTCTTATCAGC

ATCTGTCACTAGGATCCATTTGTCTCCTGACTCATCTACTTCCTTTCACTCCCCTGGGCCATCCTTCACATCATGCTAGAAGACTGTGTCTAACTTGCAGAACTTATTGTGTCAATCTCCTGGTTACGGCCCCTCCATGGCTCCCCACCTGACATAGGAGGCCCTTCACAATCTGGCTTCTGTCACTCATAACTTGTCTCCAGCCTTCATTCTTCAGTCTGATTTTATGGTTTTCTAGTTCCCCAATACACCACACCAGTGTTTATGAAACCCTAGTCATTGGCCTACGAACTTTATGATTATTGACATATTCATGTACCACCTGTATTATTTTTTGCATAGTGTTTATTTTTAATTGACTACATTTTTAACTACAATAAAGTAATTTCAACTAAAA

SEQ ID NO:138NRG1的全部13个外显子1-13按顺序排列的多核苷酸序列

SEQ ID NO:139NRG1的外显子1的翻译多肽序列

MGKGRAGRVGTT

SEQ ID NO:140NRG1的外显子2的翻译多肽序列

LPPRLKEMKSQESAAGSKLVLRCETSSEYSSLRFKWFKNGNELNRKNKPQNIKIQKKP

SEQ ID NO:141NRG1的外显子3的翻译多肽序列

KSELRINKASLADSGEYMCKVISKLGNDSASANITIVESN

SEQ ID NO:142NRG1的外显子4的翻译多肽序列

IITGMPASTEGAYVSS

SEQ ID NO:143NRG1的外显子5的翻译多肽序列

SPIRISVSTEGANTSS

SEQ ID NO:144NRG1的外显子6的翻译多肽序列

TSTSTTGTSHLVKCAEKEKTFCVNGGECFMVKDLSNPSRYLC

SEQ ID NO:145NRG1的外显子7的翻译多肽序列

CPNEFTGDRCQNYVMASFY

SEQ ID NO:146NRG1的外显子8的翻译多肽序列

HLGIEFM

SEQ ID NO:147NRG1的外显子9的翻译多肽序列

AEELYQKRVLTITGICIALLVVGIMCVVAYCKT

SEQ ID NO:148NRG1的外显子10的翻译多肽序列

KQRKKLHDRLRQSLRSERNNMMNIANGPHHPNPPPENVQLVN

SEQ ID NO:149NRG1的外显子11的翻译多肽序列

QYVSKNVISSEHIVEREAETSFSTSHYTSTAHHSTTVTQTPSH

SEQ ID NO:150NRG1的外显子12的翻译多肽序列

WSNGHTESILSESHSVIVMSSVENSRHSSPTGGPRGRLNGTGGPRECNSFLRHARETPDSYRDSPHSE

SEQ ID NO:151NRG1的外显子13的翻译多肽序列

YVSAMTTPARMSPVDFHTPSSPKSPPSEMSPPVSSMTVSMPSMAVSPFMEEERPLLLVTPPRLREKKFDHHPQQFSSFHHNPAHDSNSLPASPLRIVEDEEYETTQEYEPAQEPVKKLANSRRAKRTKPNGHIANRLEVDSNTSSQSSNSESETEDERVGEDTPFLGIQNPLAASLEATPAFRLADSRTNPAGRFSTQEEIQARLSSVIANQDPIAV

SEQ ID NO:152NRG1多肽序列

MGKGRAGRVGTTALPPRLKEMKSQESAAGSKLVLRCETSSEYSSLRFKWFKNGNELNRKNKPQNIKIQKKPGKSELRINKASLADSGEYMCKVISKLGNDSASANITIVESNEIITGMPASTEGAYVSSESPIRISVSTEGANTSSSTSTSTTGTSHLVKCAEKEKTFCVNGGECFMVKDLSNPSRYLCKCPNEFTGDRCQNYVMASFYKHLGIEFMEAEELYQKRVLTITGICIALLVVGIMCVVAYCKTKKQRKKLHDRLRQSLRSERNNMMNIANGPHHPNPPPENVQLVNQYVSKNVISSEHIVEREAETSFSTSHYTSTAHHSTTVTQTPSHSWSNGHTESILSESHSVIVMSSVENSRHSSPTGGPRGRLNGTGGPRECNSFLRHARETPDSYRDSPHSERYVSAMTTPARMSPVDFHTPSSPKSPPSEMSPPVSSMTVSMPSMAVSPFMEEERPLLLVTPPRLREKKFDHHPQQFSSFHHNPAHDSNSLPASPLRIVEDEEYETTQEYEPAQEPVKKLANSRRAKRTKPNGHIANRLEVDSNTSSQSSNSESETEDERVGEDTPFLGIQNPLAASLEATPAFRLADSRTNPAGRFSTQEEIQARLSSVIANQDPIAV

SEQ ID NO:153NRG1的全部12个外显子2-13按顺序排列的多核苷酸序列

SEQ ID NO:154NRG1的外显子2-13的翻译多肽序列

LPPRLKEMKSQESAAGSKLVLRCETSSEYSSLRFKWFKNGNELNRKNKPQNIKIQKKPGKSELRINKASLADSGEYMCKVISKLGNDSASANITIVESNEIITGMPASTEGAYVSSESPIRISVSTEGANTSSSTSTSTTGTSHLVKCAEKEKTFCVNGGECFMVKDLSNPSRYLCKCPNEFTGDRCQNYVMASFYKHLGIEFMEAEELYQKRVLTITGICIALLVVGIMCVVAYCKTKKQRKKLHDRLRQSLRSERNNMMNIANGPHHPNPPPENVQLVNQYVSKNVISSEHIVEREAETSFSTSHYTSTAHHSTTVTQTPSHSWSNGHTESILSESHSVIVMSSVENSRHSSPTGGPRGRLNGTGGPRECNSFLRHARETPDSYRDSPHSERYVSAMTTPARMSPVDFHTPSSPKSPPSEMSPPVSSMTVSMPSMAVSPFMEEERPLLLVTPPRLREKKFDHHPQQFSSFHHNPAHDSNSLPASPLRIVEDEEYETTQEYEPAQEPVKKLANSRRAKRTKPNGHIANRLEVDSNTSSQSSNSESETEDERVGEDTPFLGIQNPLAASLEATPAFRLADSRTNPAGRFSTQEEIQARLSSVIANQDPIAV

SEQ ID NO:155NRG1的全部8个外显子6-13按顺序排列的多核苷酸序列

SEQ ID NO:156NRG1的外显子6-13的翻译多肽序列

TSTSTTGTSHLVKCAEKEKTFCVNGGECFMVKDLSNPSRYLCKCPNEFTGDRCQNYVMASFYKHLGIEFMEAEELYQKRVLTITGICIALLVVGIMCVVAYCKTKKQRKKLHDRLRQSLRSERNNMMNIANGPHHPNPPPENVQLVNQYVSKNVISSEHIVEREAETSFSTSHYTSTAHHSTTVTQTPSHSWSNGHTESILSESHSVIVMSSVENSRHSSPTGGPRGRLNGTGGPRECNSFLRHARETPDSYRDSPHSERYVSAMTTPARMSPVDFHTPSSPKSPPSEMSPPVSSMTVSMPSMAVSPFMEEERPLLLVTPPRLREKKFDHHPQQFSSFHHNPAHDSNSLPASPLRIVEDEEYETTQEYEPAQEPVKKLANSRRAKRTKPNGHIANRLEVDSNTSSQSSNSESETEDERVGEDTPFLGIQNPLAASLEATPAFRLADSRTNPAGRFSTQEEIQARLSSVIANQDPIAV

SEQ ID NO:157NRG1的全部8个外显子6-13按顺序排列的多核苷酸序列(不包括外显子5的核苷酸CAT)

SEQ ID NO:158NRG1的外显子5+CAT及外显子6-13的翻译多肽序列

STSTSTTGTSHLVKCAEKEKTFCVNGGECFMVKDLSNPSRYLCKCPNEFTGDRCQNYVMASFYKHLGIEFMEAEELYQKRVLTITGICIALLVVGIMCVVAYCKTKKQRKKLHDRLRQSLRSERNNMMNIANGPHHPNPPPENVQLVNQYVSKNVISSEHIVEREAETSFSTSHYTSTAHHSTTVTQTPSHSWSNGHTESILSESHSVIVMSSVENSRHSSPTGGPRGRLNGTGGPRECNSFLRHARETPDSYRDSPHSERYVSAMTTPARMSPVDFHTPSSPKSPPSEMSPPVSSMTVSMPSMAVSPFMEEERPLLLVTPPRLREKKFDHHPQQFSSFHHNPAHDSNSLPASPLRIVEDEEYETTQEYEPAQEPVKKLANSRRAKRTKPNGHIANRLEVDSNTSSQSSNSESETEDERVGEDTPFLGIQNPLAASLEATPAFRLADSRTNPAGRFSTQEEIQARLSSVIANQDPIAV

SEQ ID NO:161NRG1的全部5个外显子1-5按顺序排列的多核苷酸序列(不包括外显子5的核苷酸CAT)

AGTAAGCCTCCGCAGCCCACTCGGACTGCAGCCTGTTTGCCGCCCGTCCTCCCATTGCAGCACTCGGGGCGACAGAGAGGGAGGAGGCGCGCGGGGACGGGGACGCCCAGGAGGACCCACTCGCGGGTCCCGCTCCGCTCCGGCAGCAGCATGGGGAAAGGACGCGCGGGCCGAGTTGGCACCACAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAACCAGTTCTGAATACTCCTCTCTCAGATTCAAGTGGTTCAAGAATGGGAATGAATTGAATCGAAAAAACAAACCACAAAATATCAAGATACAAAAAAAGCCAGGGAAGTCAGAACTTCGCATTAACAAAGCATCACTGGCTGATTCTGGAGAGTATATGTGCAAAGTGATCAGCAAATTAGGAAATGACAGTGCCTCTGCCAATATCACCATCGTGGAATCAAACGAGATCATCACTGGTATGCCAGCCTCAACTGAAGGAGCATATGTGTCTTCAGAGTCTCCCATTAGAATATCAGTATCCACAGAAGGAGCAAATACTTCTT

SEQ ID NO:162NRG1外显子1-5的翻译多肽序列，不包括经翻译外显子5的最C端氨基酸(S)

MGKGRAGRVGTTALPPRLKEMKSQESAAGSKLVLRCETSSEYSSLRFKWFKNGNELNRKNKPQNIKIQKKPGKSELRINKASLADSGEYMCKVISKLGNDSASANITIVESNEIITGMPASTEGAYVSSESPIRISVSTEGANTS

SEQ ID NO:163根据SEQ ID NO:152的NRG1序列的EGF样结构域HLVKCAEKEKTFCVNGGECFMVKDLSNPSRYLCKCPNEFTGDRCQNYVMASF

VTCN1序列信息

SEQ ID NO:164VTCN1-NRG1融合物5’处的VTCN1外显子2序列

CATAATTAGCATCATCATTATTCTGGCTGGAGCAATTGCACTCATCATTGGCTTTGGTATTTCAG

SEQ ID NO:165VTCN1-NRG1融合物3’处的NRG1外显子2序列

CCTTGCCTCCCCGATTGAAAGAGATGAA

SEQ ID NO:166VTCN1-NRG1多核苷酸序列

CATAATTAGCATCATCATTATTCTGGCTGGAGCAATTGCACTCATCATTGGCTTTGGTATTTCAGCCTTGCCTCCCCGATTGAAAGAGATGAA

SEQ ID NO:167VTCN1-NRG1多肽序列

IISIIIILAGAIALIIGFGISALPPRLKEM

SEQ ID NO:168VTCN1的外显子1

GTGAGTCACCAAGGAAGGCAGCGGCAGCTCCACTCAGCCAGTACCCAGATACGCTGGGAACCTTCCCCAGCCATGGCTTCCCTGGGGCAGATCCTCTTCTGGAG

SEQ ID NO:169VTCN1的外显子2

CATAATTAGCATCATCATTATTCTGGCTGGAGCAATTGCACTCATCATTGGCTTTGGTATTTCAG

SEQ ID NO:170VTCN1的外显子3

GGAGACACTCCATCACAGTCACTACTGTCGCCTCAGCTGGGAACATTGGGGAGGATGGAATCCTGAGCTGCACTTTTGAACCTGACATCAAACTTTCTGATATCGTGATACAATGGCTGAAGGAAGGTGTTTTAGGCTTGGTCCATGAGTTCAAAGAAGGCAAAGATGAGCTGTCGGAGCAGGATGAAATGTTCAGAGGCCGGACAGCAGTGTTTGCTGATCAAGTGATAGTTGGCAATGCCTCTTTGCGGCTGAAAAACGTGCAACTCACAGATGCTGGCACCTACAAATGTTATATCATCACTTCTAAAGGCAAGGGGAATGCTAACCTTGAGTATAAAACTGGAG

SEQ ID NO:171VTCN1的外显子4

CCTTCAGCATGCCGGAAGTGAATGTGGACTATAATGCCAGCTCAGAGACCTTGCGGTGTGAGGCTCCCCGATGGTTCCCCCAGCCCACAGTGGTCTGGGCATCCCAAGTTGACCAGGGAGCCAACTTCTCGGAAGTCTCCAATACCAGCTTTGAGCTGAACTCTGAGAATGTGACCATGAAGGTTGTGTCTGTGCTCTACAATGTTACGATCAACAACACATACTCCTGTATGATTGAAAATGACATTGCCAAAGCAACAGGGGATATCAAAGTGACAG

SEQ ID NO:172VTCN1的外显子5

AATCGGAGATCAAAAGGCGGAGTCACCTACAGCTGCTAAACTCAAAGGCTTCTCTGTGTGTCTCTTCTTTCTTTGCCATCAGCTGGGCACTTCTGCCTCTCAGCCCTTACCTGATGCTAAAATAATGTGCCTCGGCCACAAAAAAGCATGCAAAGTCATTGTTACAACAG

SEQ ID NO:173VTCN1的外显子6

GGATCTACAGAACTATTTCACCACCAGATATGACCTAGTTTTATATTTCTGGGAGGAAATGAATTCATATCTAGAAGTCTGGAGTGAGCAAACAAGAGCAAGAAACAAAAAGAAGCCAAAAGCAGAAGGCTCCAATATGAACAAGATAAATCTATCTTCAAAGACATATTAGAAGTTGGGAAAATAATTCATGTGAACTAGACAAGTGTGTTAAGAGTGATAAGTAAAATGCACGTGGAGACAAGTGCATCCCCAGATCTCAGGGACCTCCCCCTGCCTGTCACCTGGGGAGTGAGAGGACAGGATAGTGCATGTTCTTTGTCTCTGAATTTTTAGTTATATGTGCTGTAATGTTGCTCTGAGGAAGCCCCTGGAAAGTCTATCCCAACATATCCACATCTTATATTCCACAAATTAAGCTGTAGTATGTACCCTAAGACGCTGCTAATTGACTGCCACTTCGCAACTCAGGGGCGGCTGCATTTTAGTAATGGGTCAAATGATTCACTTTTTATGATGCTTCCAAAGGTGCCTTGGCTTCTCTTCCCAACTGACAAATGCCAAAGTTGAGAAAAATGATCATAATTTTAGCATAAACAGAGCAGTCGGCGACACCGATTTTATAAATAAACTGAGCACCTTCTTTTTAAACAAACAAATGCGGGTTTATTTCTCAGATGATGTTCATCCGTGAATGGTCCAGGGAAGGACCTTTCACCTTGTCTATATGGCATTATGTCATCACAAGCTCTGAGGCTTCTCCTTTCCATCCTGCGTGGACAGCTAAGACCTCAGTTTTCAATAGCATCTAGAGCAGTGGGACTCAGCTGGGGTGATTTCGCCCCCCATCTCCGGGGGAATGTCTGAAGACAATTTTGGTTACCTCAATGAGGGAGTGGAGGAGGATACAGTGCTACTACCAACTAGTGGATAGAGGCCAGGGATGCTGCTCAACCTCCTACCATGTACAGGACGTCTCCCCATTACAACTACCCAATCCGAAGTGTCAACTGTGTCAGGGCTAAGAAACCCTGGTTTTGAGTAGAAAAGGGCCTGGAAAGAGGGGAGCCAACAAATCTGTCTGCTTCCTCACATTAGTCATTGGCAAATAAGCATTCTGTCTCTTTGGCTGCTGCCTCAGCACAGAGAGCCAGAACTCTATCGGGCACCAGGATAACATCTCTCAGTGAACAGAGTTGACAAGGCCTATGGGAAATGCCTGATGGGATTATCTTCAGCTTGTTGAGCTTCTAAGTTTCTTTCCCTTCATTCTACCCTGCAAGCCAAGTTCTGTAAGAGAAATGCCTGAGTTCTAGCTCAGGTTTTCTTACTCTGAATTTAGATCTCCAGACCCTGCCTGGCCACAATTCAAATTAAGGCAACAAACATATACCTTCCATGAAGCACACACAGACTTTTGAAAGCAAGGACAATGACTGCTTGAATTGAGGCCTTGAGGAATGAAGCTTTGAAGGAAAAGAATACTTTGTTTCCAGCCCCCTTCCCACACTCTTCATGTGTTAACCACTGCCTTCCTGGACCTTGGAGCCACGGTGACTGTATTACATGTTGTTATAGAAAACTGATTTTAGAGTTCTGATCGTTCAAGAGAATGATTAAATATACATTTCCTACACCA

SEQ ID NO:174VTCN1的全部6个外显子1-6按顺序排列的多核苷酸序列

SEQ ID NO:175VTCN1的外显子1的翻译多肽序列

MASLGQILFW

SEQ ID NO:176VTCN1的外显子2的翻译多肽序列

IISIIIILAGAIALIIGFGIS

SEQ ID NO:177VTCN1的外显子3的翻译多肽序列

RHSITVTTVASAGNIGEDGILSCTFEPDIKLSDIVIQWLKEGVLGLVHEFKEGKDELSEQDEMFRGRTAVFADQVIVGNASLRLKNVQLTDAGTYKCYIITSKGKGNANLEYKTG

SEQ ID NO:178VTCN1的外显子4的翻译多肽序列

FSMPEVNVDYNASSETLRCEAPRWFPQPTVVWASQVDQGANFSEVSNTSFELNSENVTMKVVSVLYNVTINNTYSCMIENDIAKATGDIKVT

SEQ ID NO:179VTCN1的外显子5的翻译多肽序列

SEIKRRSHLQLLNSKASLCVSSFFAISWALLPLSPYLMLK

SEQ ID NO:180VTCN1多肽序列

MASLGQILFWSIISIIIILAGAIALIIGFGISGRHSITVTTVASAGNIGEDGILSCTFEPDIKLSDIVIQWLKEGVLGLVHEFKEGKDELSEQDEMFRGRTAVFADQVIVGNASLRLKNVQLTDAGTYKCYIITSKGKGNANLEYKTGAFSMPEVNVDYNASSETLRCEAPRWFPQPTVVWASQVDQGANFSEVSNTSFELNSENVTMKVVSVLYNVTINNTYSCMIENDIAKATGDIKVTESEIKRRSHLQLLNSKASLCVSSFFAISWALLPLSPYLMLK

SEQ ID NO:181VTCN1的外显子1和2

GTGAGTCACCAAGGAAGGCAGCGGCAGCTCCACTCAGCCAGTACCCAGATACGCTGGGAACCTTCCCCAGCCATGGCTTCCCTGGGGCAGATCCTCTTCTGGAGCATAATTAGCATCATCATTATTCTGGCTGGAGCAATTGCACTCATCATTGGCTTTGGTATTTCAG

SEQ ID NO:182VTCN1的外显子1和2的翻译多肽序列

MASLGQILFWSIISIIIILAGAIALIIGFGIS

CDH1序列信息

SEQ ID NO:184 CDH1-NRG1融合物5’处的CDH1外显子11序列

CTGGCTGGAGATTAATCCGGACACTGGTGCCATTTCCACTCGGGCTGAGCTGGACAGGGAGGATTTTGAGCACGTGAAGAACAGCACGTACACAGCCCTAATCATAGCTACAGACAATG

SEQ ID NO:185 CDH1-NRG1融合物3’处的NRG1外显子2序列

CCTTGCCTCCCCGATTGAAAGAGATGAAAA

SEQ ID NO:186 CDH1-NRG1多核苷酸序列

CTGGCTGGAGATTAATCCGGACACTGGTGCCATTTCCACTCGGGCTGAGCTGGACAGGGAGGATTTTGAGCACGTGAAGAACAGCACGTACACAGCCCTAATCATAGCTACAGACAATGCCTTGCCTCCCCGATTGAAAGAGATGAAA

SEQ ID NO:187 CDH1-NRG1多肽序列

WLEINPDTGAISTRAELDREDFEHVKNSTYTALIIATDNALPPRLKEMK

SEQ ID NO:188 CDH1的外显子1

AGTGGCGTCGGAACTGCAAAGCACCTGTGAGCTTGCGGAAGTCAGTTCAGACTCCAGCCCGCTCCAGCCCGGCCCGACCCGACCGCACCCGGCGCCTGCCCTCGCTCGGCGTCCCCGGCCAGCCATGGGCCCTTGGAGCCGCAGCCTCTCGGCGCTGCTGCTGCTGCTGCAG

SEQ ID NO:189 CDH1的外显子2

GTCTCCTCTTGGCTCTGCCAGGAGCCGGAGCCCTGCCACCCTGGCTTTGACGCCGAGAGCTACACGTTCACGGTGCCCCGGCGCCACCTGGAGAGAGGCCGCGTCCTGGGCAGAGSEQ ID NO:190 CDH1的外显子3

TGAATTTTGAAGATTGCACCGGTCGACAAAGGACAGCCTATTTTTCCCTCGACACCCGATTCAAAGTGGGCACAGATGGTGTGATTACAGTCAAAAGGCCTCTACGGTTTCATAACCCACAGATCCATTTCTTGGTCTACGCCTGGGACTCCACCTACAGAAAGTTTTCCACCAAAGTCACGCTGAATACAGTGGGGCACCACCACCGCCCCCCGCCCCATCAG

SEQ ID NO:191 CDH1的外显子4

GCCTCCGTTTCTGGAATCCAAGCAGAATTGCTCACATTTCCCAACTCCTCTCCTGGCCTCAGAAGACAGAAGAGAGACTGGGTTATTCCTCCCATCAGCTGCCCAGAAAATGAAAAAGGCCCATTTCCTAAAAACCTGGTTCAG

SEQ ID NO:192 CDH1的外显子5

ATCAAATCCAACAAAGACAAAGAAGGCAAGGTTTTCTACAGCATCACTGGCCAAGGAGCTGACACACCCCCTGTTGGTGTCTTTATTATTGAAAGAGAAACAGGATGGCTGAAGGTGACAGAGCCTCTGGATAGAGAACGCATTGCCACATACACT

SEQ ID NO:193 CDH1的外显子6

CTCTTCTCTCACGCTGTGTCATCCAACGGGAATGCAGTTGAGGATCCAATGGAGATTTTGATCACGGTAACCGATCAGAATGACAACAAGCCCGAATTCACCCAGGAGGTCTTTAAGGGGTCTGTCATGGAAGGTGCTCTTCCAG

SEQ ID NO:194 CDH1的外显子7

GAACCTCTGTGATGGAGGTCACAGCCACAGACGCGGACGATGATGTGAACACCTACAATGCCGCCATCGCTTACACCATCCTCAGCCAAGATCCTGAGCTCCCTGACAAAAATATGTTCACCATTAACAGGAACACAGGAGTCATCAGTGTGGTCACCACTGGGCTGGACCGAGAG

SEQ ID NO:195 CDH1的外显子8

AGTTTCCCTACGTATACCCTGGTGGTTCAAGCTGCTGACCTTCAAGGTGAGGGGTTAAGCACAACAGCAACAGCTGTGATCACAGTCACTGACACCAACGATAATCCTCCGATCTTCAATCCCACCACG

SEQ ID NO:196 CDH1的外显子9

TACAAGGGTCAGGTGCCTGAGAACGAGGCTAACGTCGTAATCACCACACTGAAAGTGACTGATGCTGATGCCCCCAATACCCCAGCGTGGGAGGCTGTATACACCATATTGAATGATGATGGTGGACAATTTGTCGTCACCACAAATCCAGTGAACAACGATGGCATTTTGAAAACAGCAAAGGTTTGTATGGTACCTGGCAAGATGCAGAAACTGGCATCCTCACAGCTGTTCATACCCTTGTCCCCTG

SEQ ID NO:197 CDH1的外显子10

GGCTTGGATTTTGAGGCCAAGCAGCAGTACATTCTACACGTAGCAGTGACGAATGTGGTACCTTTTGAGGTCTCTCTCACCACCTCCACAGCCACCGTCACCGTGGATGTGCTGGATGTGAATGAAGCCCCCATCTTTGTGCCTCCTGAAAAGAGAGTGGAAGTGTCCGAGGACTTTGGCGTGGGCCAGGAAATCACATCCTACACTGCCCAGGAGCCAGACACATTTATGGAACAGAAAATAAC

SEQ ID NO:198 CDH1的外显子11

ATATCGGATTTGGAGAGACACTGCCAACTGGCTGGAGATTAATCCGGACACTGGTGCCATTTCCACTCGGGCTGAGCTGGACAGGGAGGATTTTGAGCACGTGAAGAACAGCACGTACACAGCCCTAATCATAGCTACAGACAATG

SEQ ID NO:199 CDH1的外显子12

GTTCTCCAGTTGCTACTGGAACAGGGACACTTCTGCTGATCCTGTCTGATGTGAATGACAACGCCCCCATACCAGAACCTCGAACTATATTCTTCTGTGAGAGGAATCCAAAGCCTCAGGTCATAAACATCATTGATGCAGACCTTCCTCCCAATACATCTCCCTTCACAGCAGAACTAACACACGGGGCGAGTGCCAACTGGACCATTCAGTACAACGACCCAA

SEQ ID NO:200 CDH1的外显子13

CCCAAGAATCTATCATTTTGAAGCCAAAGATGGCCTTAGAGGTGGGTGACTACAAAATCAATCTCAAGCTCATGGATAACCAGAATAAAGACCAAGTGACCACCTTAGAGGTCAGCGTGTGTGACTGTGAAGGGGCCGCTGGCGTCTGTAGGAAGGCACAGCCTGTCGAAGCAGGATTGCAAATTCCTGCCATTCTGGGGATTCTTGGAGGAATTCTTGCTTTGCTAA

SEQ ID NO:201 CDH1的外显子14

TTCTGATTCTGCTGCTCTTGCTGTTTCTTCGGAGGAGAGCGGTGGTCAAAGAGCCCTTACTGCCCCCAGAGGATGACACCCGGGACAACGTTTATTACTATGATGAAGAAGGAGGCGGAGAAGAGGACCAG

SEQ ID NO:202 CDH1的外显子15

GACTTTGACTTGAGCCAGCTGCACAGGGGCCTGGACGCTCGGCCTGAAGTGACTCGTAACGACGTTGCACCAACCCTCATGAGTGTCCCCCGGTATCTTCCCCGCCCTGCCAATCCCGATGAAATTGGAAATTTTATTGATGAA

SEQ ID NO:203 CDH1的外显子16

AATCTGAAAGCGGCTGATACTGACCCCACAGCCCCGCCTTATGATTCTCTGCTCGTGTTTGACTATGAAGGAAGCGGTTCCGAAGCTGCTAGTCTGAGCTCCCTGAACTCCTCAGAGTCAGACAAAGACCAGGACTATGACTACTTGAACGAATGGGGCAATCGCTTCAAGAAGCTGGCTGACATGTACGGAGGCGGCGAGGACGACTAGGGGACTCGAGAGAGGCGGGCCCCAGACCCATGTGCTGGGAAATGCAGAAATCACGTTGCTGGTGGTTTTTCAGCTCCCTTCCCTTGAGATGAGTTTCTGGGGAAAAAAAAGAGACTGGTTAGTGATGCAGTTAGTATAGCTTTATACTCTCTCCACTTTATAGCTCTAATAAGTTTGTGTTAGAAAAGTTTCGACTTATTTCTTAAAGCTTTTTTTTTTTTCCCATCACTCTTTACATGGTGGTGATGTCCAAAAGATACCCAAATTTTAATATTCCAGAAGAACAACTTTAGCATCAGAAGGTTCACCCAGCACCTTGCAGATTTTCTTAAGGAATTTTGTCTCACTTTTAAAAAGAAGGGGAGAAGTCAGCTACTCTAGTTCTGTTGTTTTGTGTATATAATTTTTTAAAAAAAATTTGTGTGCTTCTGCTCATTACTACACTGGTGTGTCCCTCTGCCTTTTTTTTTTTTTTAAGACAGGGTCTCATTCTATCGGCCAGGCTGGAGTGCAGTGGTGCAATCACAGCTCACTGCAGCCTTGTCCTCCCAGGCTCAAGCTATCCTTGCACCTCAGCCTCCCAAGTAGCTGGGACCACAGGCATGCACCACTACGCATGACTAATTTTTTAAATATTTGAGACGGGGTCTCCCTGTGTTACCCAGGCTGGTCTCAAACTCCTGGGCTCAAGTGATCCTCCCATCTTGGCCTCCCAGAGTATTGGGATTACAGACATGAGCCACTGCACCTGCCCAGCTCCCCAACTCCCTGCCATTTTTTAAGAGACAGTTTCGCTCCATCGCCCAGGCCTGGGATGCAGTGATGTGATCATAGCTCACTGTAACCTCAAACTCTGGGGCTCAAGCAGTTCTCCCACCAGCCTCCTTTTTATTTTTTTGTACAGATGGGGTCTTGCTATGTTGCCCAAGCTGGTCTTAAACTCCTGGCCTCAAGCAATCCTTCTGCCTTGGCCCCCCAAAGTGCTGGGATTGTGGGCATGAGCTGCTGTGCCCAGCCTCCATGTTTTAATATCAACTCTCACTCCTGAATTCAGTTGCTTTGCCCAAGATAGGAGTTCTCTGATGCAGAAATTATTGGGCTCTTTTAGGGTAAGAAGTTTGTGTCTTTGTCTGGCCACATCTTGACTAGGTATTGTCTACTCTGAAGACCTTTAATGGCTTCCCTCTTTCATCTCCTGAGTATGTAACTTGCAATGGGCAGCTATCCAGTGACTTGTTCTGAGTAAGTGTGTTCATTAATGTTTATTTAGCTCTGAAGCAAGAGTGATATACTCCAGGACTTAGAATAGTGCCTAAAGTGCTGCAGCCAAAGACAGAGCGGAACTATGAAAAGTGGGCTTGGAGATGGCAGGAGAGCTTGTCATTGAGCCTGGCAATTTAGCAAACTGATGCTGAGGATGATTGAGGTGGGTCTACCTCATCTCTGAAAATTCTGGAAGGAATGGAGGAGTCTCAACATGTGTTTCTGACACAAGATCCGTGGTTTGTACTCAAAGCCCAGAATCCCCAAGTGCCTGCTTTTGATGATGTCTACAGAAAATGCTGGCTGAGCTGAACACATTTGCCCAATTCCAGGTGTGCACAGAAAACCGAGAATATTCAAAATTCCAAATTTTTTTCTTAGGAGCAAGAAGAAAATGTGGCCCTAAAGGGGGTTAGTTGAGGGGTAGGGGGTAGTGAGGATCTTGATTTGGATCTCTTTTTATTTAAATGTGAATTTCAACTTTTGACAATCAAAGAAAAGACTTTTGTTGAAATAGCTTTACTGTTTCTCAAGTGTTTTGGAGAAAAAAATCAACCCTGCAATCACTTTTTGGAATTGTCTTGATTTTTCGGCAGTTCAAGCTATATCGAATATAGTTCTGTGTAGAGAATGTCACTGTAGTTTTGAGTGTATACATGTGTGGGTGCTGATAATTGTGTATTTTCTTTGGGGGTGGAAAAGGAAAACAATTCAAGCTGAGAAAAGTATTCTCAAAGATGCATTTTTATAAATTTTATTAAACAATTTTGTTAAA

SEQ ID NO:204 CDH1的全部16个外显子1-16按顺序排列的多核苷酸序列

SEQ ID NO:205 CDH1的外显子10的翻译多肽序列

MEQKI

SEQ ID NO:206 CDH1的外显子11的翻译多肽序列

YRIWRDTANWLEINPDTGAISTRAELDREDFEHVKNSTYTALIIATDN

SEQ ID NO:207 CDH1的外显子12的翻译多肽序列

SPVATGTGTLLLILSDVNDNAPIPEPRTIFFCERNPKPQVINIIDADLPPNTSPFTAELTHGASANWTIQYNDP

SEQ ID NO:208 CDH1的外显子13的翻译多肽序列

QESIILKPKMALEVGDYKINLKLMDNQNKDQVTTLEVSVCDCEGAAGVCRKAQPVEAGLQIPAILGILGGILALL

SEQ ID NO:209 CDH1的外显子14的翻译多肽序列

LILLLLLFLRRRAVVKEPLLPPEDDTRDNVYYYDEEGGGEEDQ

SEQ ID NO:210 CDH1的外显子15的翻译多肽序列

DFDLSQLHRGLDARPEVTRNDVAPTLMSVPRYLPRPANPDEIGNFIDE

SEQ ID NO:211 CDH1的外显子16的翻译多肽序列

NLKAADTDPTAPPYDSLLVFDYEGSGSEAASLSSLNSSESDKDQDYDYLNEWGNRFKKLADMYGGGEDD

SEQ ID NO:212 CDH1多肽序列

MEQKITYRIWRDTANWLEINPDTGAISTRAELDREDFEHVKNSTYTALIIATDNGSPVATGTGTLLLILSDVNDNAPIPEPRTIFFCERNPKPQVINIIDADLPPNTSPFTAELTHGASANWTIQYNDPTQESIILKPKMALEVGDYKINLKLMDNQNKDQVTTLEVSVCDCEGAAGVCRKAQPVEAGLQIPAILGILGGILALLILILLLLLFLRRRAVVKEPLLPPEDDTRDNVYYYDEEGGGEEDQDFDLSQLHRGLDARPEVTRNDVAPTLMSVPRYLPRPANPDEIGNFIDENLKAADTDPTAPPYDSLLVFDYEGSGSEAASLSSLNSSESDKDQDYDYLNEWGNRFKKLADMYGGGEDD

SEQ ID NO:213 CDH1的全部11个外显子1-11按顺序排列的多核苷酸序列

SEQ ID NO:214外显子1-11的翻译多肽序列

MEQKIYRIWRDTANWLEINPDTGAISTRAELDREDFEHVKNSTYTALIIATDN

CXADR序列信息

SEQ ID NO:215 CXADR-NRG1融合物5’处的CXADR外显子1序列

ATGGCGCTCCTGCTGTGCTTCGTGCTCCTGTGCGGAGTAGTGG

SEQ ID NO:216 CXADR-NRG1融合物3’处的NRG1外显子2序列

CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACT

SEQ ID NO:217 CXADR-NRG1多核苷酸序列

ATGGCGCTCCTGCTGTGCTTCGTGCTCCTGTGCGGAGTAGTGGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACT

SEQ ID NO:218 CXADR-NRG1多肽序列

MALLLCFVLLCGVVALPPRLKEMKSQESAAGSK

SEQ ID NO:219CXADR的外显子1

AGTCGGGAGCGCGCGAGGCGCGGGGAGCCTGGGACCAGGAGCGAGAGCCGCCTACCTGCAGCCGCCGCCCACGGCACGGCAGCCACCATGGCGCTCCTGCTGTGCTTCGTGCTCCTGTGCGGAGTAGTGG

SEQ ID NO:220CXADR的外显子2

ATTTCGCCAGAAGTTTGAGTATCACTACTCCTGAAGAGATGATTGAAAAAGCCAAAGGGGAAACTGCCTATCTGCCATGCAAATTTACGCTTAGTCCCGAAGACCAGGGACCGCTGGACATCGAGTGGCTGATATCACCAGCTGATAATCAGAAGGTGGATCAAGTG

SEQ ID NO:221CXADR的外显子3

ATTATTTTATATTCTGGAGACAAAATTTATGATGACTACTATCCAGATCTGAAAGGCCGAGTACATTTTACGAGTAATGATCTCAAATCTGGTGATGCATCAATAAATGTAACGAATTTACAACTGTCAGATATTGGCACATATCAGTGCAAAGTGAAAAAAGCTCCTGGTGTTGCAAATAAGAAGATTCATCTGGTAGTTCTTG

SEQ ID NO:222CXADR的外显子4

TTAAGCCTTCAGGTGCGAGATGTTACGTTGATGGATCTGAAGAAATTGGAAGTGACTTTAAGATAAAATGTGAACCAAAAGAAGGTTCACTTCCATTACAGTATGAGTGGCAAAAATTGTCTGACTCACAGAAAATGCCCACTTCATGGTTAGCAG

SEQ ID NO:223CXADR的外显子5

GGAAGATGTGCCACCTCCAAAGAGCCGTACGTCCACTGCCAGAAGCTACATCGGCAGTAATCATTCATCCCTGGGGTCCATGTCTCCTTCCAACATGGAAGGATATTCCAAGACTCAGTATAACCAAGTACCAAGTGAAGACTTTGAACGCACTCCTCAGAGTCCGACTCTCCCACCTGCTAAGGTAGCTGCCCCTAATCTAAGTCGAATGGGTGCGATTCCTGTGATGATTCCAGCACAGAGCAAGGATGGGTCTATAGTATAGAGCCTCCATATGTCTCATCTGTGCTCTCCGTGTTCCTTTCCTTTTTTTGATATATGAAAACCTATTCTGGTCTAAATTGTGTTACTAGCCTCAAAATACATCAAAAAATAAGTTAATCAGGAACTGTACGGAATATATTTTTAAAAATTTTTGTTTGGTTATATCGAAATAGTTACAGGCACTAAAGTTAGTAAAGAAAAGTTTACCATCTGAAAAAGCTGGATTTTCTTTAAGAGGTTGATTATAAAGTTTTCTAAATTTATCAGTACCTAAGTAAGATGTAGCGCTTTGAATATGAAATCATAGGTGAAGACATGGGTGAACTTACTTGCATACCAAGTTGATACTTGAATAACCATCTGAAAGTGGTACTTGATCATTTTTACCATTATTTTTAGGATGTGTATTTCATTTATTTATGGCCCACCAGTCTCCCCCAAATTAGTACAGAAATATCCATGACAAAATTACTTACGTATGTTTGTACTTGGTTTTACAGCTCCTTTGAAAACTCTGTGTTTGGAATATCTCTAAAAACATAGAAAACACTACAGTGGTTTAGAAATTACTAATTTTACTTCTAAGTCATTCATAAACCTTGTCTATGAAATGACTTCTTAAATATTTAGTTGATAGACTGCTACAGGTAATAGGGACTTAGCAAGCTCTTTTATATGCTAAAGGAGCATCTATCAGATTAAGTTAGAACATTTGCTGTCAGCCACATATTGAGATGACACTAGGTGCAATAGCAGGGATAGATTTTGTTGGTGAGTAGTCTCATGCCTTGAGATCTGTGGTGGTCTTCAAAATGGTGGCCAGCCAGATCAAGGATGTAGTATCTCATAGTTCCCAGGTGATATTTTTCTTATTAGAAAAATATTATAACTCATTTGTTGTTTGACACTTATAGATTGAAATTTCCTAATTTATTCTAAATTTTAAGTGGTTCTTTGGTTCCAGTGCTTTATGTTGTTGTTGTTTTTGGATGGTGTTACATATTATATGTTCTAGAAACATGTAATCCTAAATTTACCCTCTTGAATATAATCCCTGGATGATATTTTTTATCATAAATGCAGAATAATCAAATACATTTTAAGCAAGTTAAGTGTCCTCCATCAATTCTGTATTCCAGACTTGGGAGGATGTACAGTTGCTGTTGTGTGATCAAACATGTCTCTGTGTAGTTCCAGCAAATCAAGCTGAGCTTTGAAAAAGTTTGTCTTAGTTTTGTGAAGGTGATTTATTCTTAAAAAAAAAAAAGAAAGAAAAAGAAAAAAAGATAAGAAGGAGGAGTAAAGGGACTACTCCTCCTTGCCAAATGTGCTAAATATCATTTTAGGAGAAGAAAGTGGGTTTATTGTATTTCCCTTAAGATTGTGAGGGAGTGTGGATACAGTAGAATGAGCCAACAGTTTCTTTATAATAAATACGGTCTGCAATAAATTATTTCACTAGCTCTAAAACCTTTCCCTAGATTTTAGTAGGGAGTTGGTTTCTGTTAATATCTTTGGGTGCTGTGGTGGTAAATGCTATATTATGAACGGTGGCATGTATTTACAGTTAGAGTATTGTGTGTACACTTTTTAATGGTAAACTTAAGCTGAATGTGTAATGGATTTGTGTATAGTTTTACATATTTGGAAGCATTTTAAAAACAGGTTTTAACCTTATGTAAAATTACTTTTATACTCGTGTTAACATTTTCATCTGTGCCTTTTGGTAATTTAATTTCTATTATGAATTTCTGGTGCCTATGAGCTAGCTATCACCTACCTGAAAGGTGCTTAGAGGTGAAGGTACTGTTTCTAAAAACACATCACTGTGATACCTTTCTATCCTCACATTTTCAAGCTTGCCTCTTTTCTGTTCTTTGTGGATATAACTTAAGCAATTGTGTTATTCATAAAGGTTTAGAAATTTCAATATTCCCAACACTCTATGTTTCTGATTTTATAACAGTAGCCATTTTTGAAAGTCAGATGTTTGGCCTGTTTTATATGAATAAAGTTTATTTATAAAATATTATAAAAAATAAGTAAATAAACAGAACATTAATAATAAAGTTTTGGTTCTTCCTATTCCTGACTTTCATATAATGAAAATTATCCTATTGATCTAAGTAGAAGTTATCATAGAAAGTGGACACGTATAAGACTTTCCTTCCTTTTTTTTTTTAATAACATATGAGGAACAAGACTTCTCTTCCCATATACTTCATATTTTAGAGGACATTGTTTTAAAGGCTTATGTCTCACTGTAAAATTCTGTCAGCCAAATAGTACCAATACGTTTTCAAGTAGTTCTCACTGATAATTTAGTTGAACCAGAGATCAAATATTTGCTCCCGAATTACTACTGGTAATCAAGTAGTTGAACAAAAAATTACTAAAGCATTTCCGTTAGATCAGTCAAGGACAGTACTGCATCTTTTTTTTTTTTTTTTTTTTTAAGACGGAGTCTCGGTCTGTCACCCAGGCTGGAGTGCAGTGGCGGGATCTCGGCTCACTGCAAGCTCCGCCTCCCAGGTTCACGCCATTCTCCTGCCTCAGCCTCCCGAGCAGCTGGGACTACAGGCTCCCATCACCACGCTCGGCTAAGTTTTTGTAATTTTAGTAGAGACAGGGTTTCACCGTGTTAGCCAGGATGGTCTCGATCTCCTGACCTCGTGATCTGCCTGCCTCGGCCTCCCAAAGTGCTGGGATTACAGGCGTGAACCACTGCACCCGGCCCAGTACTGCATCTTAACAGCAAAGCCATTTTATTCTACTTTATAACTGAGAGACTTGATACCATCCATCTCTTTAGGTTACAGAGGATAATTTGAAGAGAAATGTTACTGTAGAATATATAGTTCTGTACTTTTTTTTTTTTTTTTTAAGAGATAGGGTTTCACTATTGCTCAGGCTGGTCTCAAACTGCTGGGCTCAGGAGATCCTCCTGCCTTGGCCTCCCAAATTGCTGGGATTACAGGTGTGAGCCGCAGCATCCAGCCAGTTCTGTACTTTGAATATGGAGTAGTTTACAGCTATTTTTTTTTCTTACTGGTAATCTTAACTAATATGATTCCCTTGTTAGAGAGCCTCTCACTCCCCCACCCCCAAAAATGTCTACTATTCATGACAGTAACCAATTATTCTGGACAAATTGCTTCTTTTTAATTTGAGCTATCTGCCATGGACTTTCTAAAATGGAAACACAGCCTGAGTGTATCTTAGGGAGAGTTTGATTGAAAAAATCCAAATCACTATCCATATAGATCATGGATATAAAGAGATACCTGATTTTTATTAAAAAGATACTTTTTCAAATTTAAGAGTTAATCTTGGAAATTTGGAACAAGTAAAGGGGCAAGTAAACCTTTTGATGAAATATAAAAGGAACTCATTGCATGAAGTTGACTATCAAATTCTGTGATGTGTGGCTTCTTAAAAATATTCTCAGTGTCTTTTGTGTGCGTGCAGCATGTACATTTGATGTTATGTGAATGTTGAGTTTTTTCTTCTAATTTTCACTTCAGCAGTGTTTAGGGCTTTCAGATGCCTTATTCCAGTGTGAACAGAAAAAGTTCATATTTTATGTGGTTAATGCTTTGATGTGTCACATAAAGAGTAGTTTGTAGAAAATGTTGGCACAATTTTAACTTCTTAGTGGCTTGTGACATTATATATTATATATATATATGTACATATATCTTTATAACATTCCTGTGTTTAGTAGTGTAAATGTTCTGGGCAAGTTTTAATATTTTGAATGCCTTTGGATATTCCAGCAATAAAGGCATCATGTTCTGCAATAGGATTTCTTACTCATTTACCTATTTTAACACTAAAATAGACCACAACTGAGCACAAATTCCTTTTATAAATGTTATAGAAGCAGGGAAGAATAATAAACACATTTGTGAATTGTGGTTCAGTTTATTTATCTTTAGGGAAGGCTGATCATTTATCTTATAGCAGATAACCCCAGCCTCTTATTCATTATGGTTAACTTTTATAATTTATCTTATTTTATAATTTAAGAATATAGTACATATCAGTTGGGTTTGGTTTTGGTCATCGAGACTAAAAGCTCCATCAAAACAGAACTTTGTGTTTTCTGCTAACTTATTTAATGACACAAGTTTTAAGAGAACCACAATTCATTGATTCACTTATTCTTTTCCCTAATTGTGAATTTTAGTGATAAATACACCTGTACTACTGAGGAAAATATTCTGACACTTCACGTGTGCAAAGTATAGAACTGACAGTGTCAGTTTCAGATTTTGTATGTACGATTTCTGGCTTATATATCCAATGGTGCAGATTTTGAAATTTGTAAGAACAAAATTTGTTAAGAAAAACAACTTGCTCTAGTTTTGTGACCTTGTGTACTTTTGAAATAAAATCAAGAAAGCAGTTCTCTGCCTC

SEQ ID NO:224CXADR的全部5个外显子1-5按顺序排列的多核苷酸序列

SEQ ID NO:225CXADR的外显子1的翻译多肽序列

MALLLCFVLLCGVV

SEQ ID NO:226CXADR的外显子2的翻译多肽序列

FARSLSITTPEEMIEKAKGETAYLPCKFTLSPEDQGPLDIEWLISPADNQKVDQV

SEQ ID NO:227CXADR的外显子3的翻译多肽序列

IILYSGDKIYDDYYPDLKGRVHFTSNDLKSGDASINVTNLQLSDIGTYQCKVKKAPGVANKKIHLVVL

SEQ ID NO:228CXADR的外显子4的翻译多肽序列

KPSGARCYVDGSEEIGSDFKIKCEPKEGSLPLQYEWQKLSDSQKMPTSWLA

SEQ ID NO:229CXADR的外显子5的翻译多肽序列

KMCHLQRAVRPLPEATSAVIIHPWGPCLLPTWKDIPRLSITKYQVKTLNALLRVRLSHLLR

SEQ ID NO:230CDAXR多肽序列

MALLLCFVLLCGVVDFARSLSITTPEEMIEKAKGETAYLPCKFTLSPEDQGPLDIEWLISPADNQKVDQVIILYSGDKIYDDYYPDLKGRVHFTSNDLKSGDASINVTNLQLSDIGTYQCKVKKAPGVANKKIHLVVLVKPSGARCYVDGSEEIGSDFKIKCEPKEGSLPLQYEWQKLSDSQKMPTSWLAGKMCHLQRAVRPLPEATSAVIIHPWGPCLLPTWKDIPRLSITKYQVKTLNALLRVRLSHLLR

GTF2E2序列信息

SEQ ID NO:231GTF2E2-NRG1融合物5’处的GTF2E2外显子2序列GGGAGCTGTTCAAAAAACGAGCTCTTTCTACTCCTGTAGTAGAAAAACGTTCAGCATCTTCTGAGTCATCATCATCATCGTCAAAGAAGAAGAAAACAAAGGTAGAACATGGAGGATCGTCAGGCTCTAAACAAAATTCTG

SEQ ID NO:232GTF2E2-NRG1融合物3’处的NRG1外显子2序列CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAACCAGTTCTGAATACTCCTCTCTCAGATTCAAGTGGTTCAAGAATGGGAATGA

SEQ ID NO:233GTF2E2-NRG1多核苷酸序列

GGGAGCTGTTCAAAAAACGAGCTCTTTCTACTCCTGTAGTAGAAAAACGTTCAGCATCTTCTGAGTCATCATCATCATCGTCAAAGAAGAAGAAAACAAAGGTAGAACATGGAGGATCGTCAGGCTCTAAACAAAATTCTGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAACCAGTTCTGAATACTCCTCTCTCAGATTCAAGTGGTTCAAGAATGGGAATGA

SEQ ID NO:234GTF2E2-NRG1多肽序列

ELFKKRALSTPVVEKRSASSESSSSSSKKKKTKVEHGGSSGSKQNSALPPRLKEMKSQESAAGSKLVLRCETSSEYSSLRFKWFKNGN

SEQ ID NO:235GTF2E2的外显子1

ACTGAGCTCCTAGCACCCGATCGGGAAGTGGCGGGCGGAGTCCCGGGTCCAGTCGCCGCCTCAGCTACCGCCGCTGCCGCCGCCGCCGCCGCCACCGCCAGTGGTGAGACCCCGACCTGGCGGGTCAGCGCTGGGCGTGCGTGCGGGCAGGCGGGGGCGCTGACGAGAAGCAGGAAGAGGGTGCAGTGCCGGCGTGGGCGGCCGGCCGAGGCGGAGGCGCAGGAAGGGGGCGGCGAGTCGTGCGAGGCTGCCCTTCTCACTCAG

SEQ ID NO:236GTF2E2的外显子2

CATTATGGATCCAAGCCTGTTGAGAGAAAGGGAGCTGTTCAAAAAACGAGCTCTTTCTACTCCTGTAGTAGAAAAACGTTCAGCATCTTCTGAGTCATCATCATCATCGTCAAAGAAGAAGAAAACAAAGGTAGAACATGGAGGATCGTCAGGCTCTAAACAAAATTCTG

SEQ ID NO:237GTF2E2的外显子3

ATCATAGCAATGGATCATTTAACTTGAAAGCTTTGTCAGGAAGCTCTGGATATAAGTTTGGTGTTCTTGCTAAGATTGTGAATTACATGAAG

SEQ ID NO:238GTF2E2的外显子4

ACACGGCATCAGCGAGGAGATACGCATCCTCTAACCTTAGATGAAATTTTGGATGAAACACAACATTTAGATATTGGACTCAAGCAGAAACAATGGCTAATGACTGAG

SEQ ID NO:239GTF2E2的外显子5

GCTTTAGTCAACAATCCCAAAATTGAAGTAATAGATGGGAAGTATGCTTTCAAGCCCAAGTACAACGTGAGAGATAAGAAGGCCCTACTTAGGCTCTTAGATCAGCATGACCAGCGAGGATTAGGAGGAATTCTTTTAGAAGACATAGAAGAAGCACTGCCCAATTCCCAGAAAGCTGTCAAG

SEQ ID NO:240GTF2E2的外显子6

GCTTTGGGGGACCAGATACTATTTGTAAATCGTCCCGATAAGAAGAAAATACTTTTCTTCAATGATAAGAGCTGTCAGTTTTCTGTGGATGAAG

SEQ ID NO:241GTF2E2的外显子7

AATTTCAGAAACTGTGGAGGAGTGTCACTGTAGATTCCATGGACGAGGAGAAAATTGAAGAATATCTGAAGCGACAGGGTATTTCTTCCATGCAGGAATCTGGACCAAAGAAAGTGSEQ ID NO:242GTF2E2的外显子8

GCCCCTATTCAGAGAAGGAAAAAGCCTGCTTCACAGAAAAAGCGACGCTTTAAGACTCATAACGAACACTTGGCTGGAGTGCTGAAGGATTACTCTGACATTACTTCCAGCAAATAGGGAACAGTTTTGCCCTGGAACAGAGTTACAGATACACAATCAAGAGTGTTCTTGCTGATGCTCGGGGTCTGAAGACTGTCTTCCTATCTGCTTCTTGCGGCTGAGGAGAGGAGCAGTTCAGTTTACAAAACAAGTGCAAATTACCAAACTCAAAGCTTATTTGAGTAGAATGGGCTCATGGGCAATGTGATGTTCCCTGTTAACCTTCTGTTACTCCCTGGGAGAAAGGCGCTGAGCGTGGCATGCAGGTGTCTTTGCTGTGTTTTTCTCCACTTCTAAATGGTTCCTGGTTCCTTTCTTCCTCGTTTGTTACTTTAGAGCAAGTTTGCCCATAGTCTTGAATGCAATATTTGTTTATTCCAAAAGAACATATTTATAATAAAATCACTGTAGAAGGATTTTTAAGATGTTAGTGAATTCTGTTTCTTTTCATTCTCGGAAATGGCAGGAAGCAGCTCCAGTCTCTGATTTCCATGGGTCACGTGCTGGGGATGTGATGAAGCCTGCAGTCTGCACTGTGTTGCTGAGCACATGGATTTCACCACTGGAACACAGGTGTGCTGCTTGTTAGCAAGCAGAGCAATAAAGATGTGCTGGATGTCA

SEQ ID NO:243GTF2E2的全部8个外显子1-8按顺序排列的多核苷酸序列

SEQ ID NO:244GTF2E2的外显子2的翻译多肽序列

MDPSLLRERELFKKRALSTPVVEKRSASSESSSSSSKKKKTKVEHGGSSGSKQNS

SEQ ID NO:245GTF2E2的外显子3的翻译多肽序列

HSNGSFNLKALSGSSGYKFGVLAKIVNYMK

SEQ ID NO:246GTF2E2的外显子4的翻译多肽序列

TRHQRGDTHPLTLDEILDETQHLDIGLKQKQWLMTE

SEQ ID NO:247GTF2E2的外显子5的翻译多肽序列

ALVNNPKIEVIDGKYAFKPKYNVRDKKALLRLLDQHDQRGLGGILLEDIEEALPNSQKAVK

SEQ ID NO:248GTF2E2的外显子6的翻译多肽序列

ALGDQILFVNRPDKKKILFFNDKSCQFSVDE

SEQ ID NO:249GTF2E2的外显子7的翻译多肽序列

FQKLWRSVTVDSMDEEKIEEYLKRQGISSMQESGPKKV

SEQ ID NO:250GTF2E2的外显子8的翻译多肽序列

APIQRRKKPASQKKRRFKTHNEHLAGVLKDYSDITSSK

SEQ ID NO:251全蛋白质序列

MDPSLLRERELFKKRALSTPVVEKRSASSESSSSSSKKKKTKVEHGGSSGSKQNSDHSNGSFNLKALSGSSGYKFGVLAKIVNYMKTRHQRGDTHPLTLDEILDETQHLDIGLKQKQWLMTEALVNNPKIEVIDGKYAFKPKYNVRDKKALLRLLDQHDQRGLGGILLEDIEEALPNSQKAVKALGDQILFVNRPDKKKILFFNDKSCQFSVDEEFQKLWRSVTVDSMDEEKIEEYLKRQGISSMQESGPKKVAPIQRRKKPASQKKRRFKTHNEHLAGVLKDYSDITSSK

SEQ ID NO:252外显子1-2

ACTGAGCTCCTAGCACCCGATCGGGAAGTGGCGGGCGGAGTCCCGGGTCCAGTCGCCGCCTCAGCTACCGCCGCTGCCGCCGCCGCCGCCGCCACCGCCAGTGGTGAGACCCCGACCTGGCGGGTCAGCGCTGGGCGTGCGTGCGGGCAGGCGGGGGCGCTGACGAGAAGCAGGAAGAGGGTGCAGTGCCGGCGTGGGCGGCCGGCCGAGGCGGAGGCGCAGGAAGGGGGCGGCGAGTCGTGCGAGGCTGCCCTTCTCACTCAGCATTATGGATCCAAGCCTGTTGAGAGAAAGGGAGCTGTTCAAAAAACGAGCTCTTTCTACTCCTGTAGTAGAAAAACGTTCAGCATCTTCTGAGTCATCATCATCATCGTCAAAGAAGAAGAAAACAAAGGTAGAACATGGAGGATCGTCAGGCTCTAAACAAAATTCTG

CSMD1序列信息

SEQ ID NO:253 CSMD1-NRG1融合物5’处的CSMD1外显子23序列

ATCCTAAACAGCACATCCAATCACCTGTGGCTAGAGTTCAACACCAATGGATCTGACACCGACCAAGGTTTTCAACTCACCTATACCA

SEQ ID NO:254 CSMD1-NRG1融合物3’处的NRG1外显子6序列

CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACT

SEQ ID NO:255 CSMD1-NRG1多核苷酸序列ATCCTAAACAGCACATCCAATCACCTGTGGCTAGAGTTCAACACCAATGGATCTGACACCGACCAAGGTTTTCAACTCACCTATACCACTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACT

SEQ ID NO:256 CSMD1-NRG1多肽序列

ILNSTSNHLWLEFNTNGSDTDQGFQLTYTTTSTSTTGTSHLVKCAEKEKT

SEQ ID NO:257CSMD1的外显子1

CTCCACGGCAGCGGCTCCTTGTGCCACTAGCAGCCCTTCTTCTGCGCTCTCCGCCTTTTCTCTCTAGACTGGATCTCTCCTCCCCCCCGCGCCCCCCTCCCCGCATCTCCCACTCGCTGGCTCTCTCTCCAGCTGCCTCCTCTCCAGGTCTCTCCTGGCTGCGCGCGCTCCTCTCCCCGCTTCTCCCCCTCCCGCAGCCTCGCCGCCTTGGTGCCTTCCTGCCCGGCTCGGCCGGCGCTCGTCCCCGGCCCCGGCCCCGCCAGCCCGGGTCTCCGCGCTCGGAGCAGCTCAGCCCTGCAGTGGCTCGGGACCCGATGCTATGAGAGGGAAGCGAGCCGGGCGCCCAGACCTTCAGGAGGCGTCGGATGCGCGGCGGGTCTTGGGACCGGGCTCTCTCTCCGGCTCGCCTTGCCCTCGGGTGATTATTTGGCTCCGCTCATAGCCCTGCCTTCCTCGGAGGAGCCATCGGTGTCGCGTGCGTGTGGAGTATCTGCAGACATGACTGCGTGGAGGAGATTCCAGTCGCTGCTCCTGCTTCTCGGGCTGCTGGTGCTGTGCGCGAGGCTCCTCACTGCAGCGAAGG

SEQ ID NO:258CSMD1的外显子2

GTCAGAACTGTGGAGGCTTAGTCCAGGGTCCCAATGGCACTATTGAGAGCCCAGGGTTTCCTCACGGGTATCCGAACTATGCCAACTGCACCTGGATCATCATCACGGGCGAGCGCAATAGGATACAGTTGTCCTTCCATACCTTTGCTCTTGAAGAAGATTTTGATATTTTATCAGTTTACGATGGACAGCCTCAACAAGGGAATTTAAAAGTGAG

SEQ ID NO:259CSMD1的外显子3

ATTATCGGGATTTCAGCTGCCCTCCTCTATAGTGAGTACAGGATCTATCCTCACTCTGTGGTTCACGACAGACTTCGCTGTGAGTGCCCAAGGTTTCAAAGCATTATATGAAG

SEQ ID NO:260CSMD1的外显子4

TTTTACCTAGCCACACTTGTGGAAATCCTGGAGAAATCCTGAAAGGAGTTCTGCATGGAACGAGATTCAACATAGGAGACAAAATCCGGTACAGCTGCCTCCCTGGCTACATCTTGGAAGGCCACGCCATCCTGACCTGCATCGTCAGCCCAGGAAATGGTGCATCGTGGGACTTCCCAGCTCCCTTTTGCAGAG

SEQ ID NO:261CSMD1的外显子5

CTGAGGGAGCCTGCGGAGGAACCTTACGCGGGACCAGCAGCTCCATCTCCAGCCCGCACTTCCCTTCAGAGTACGAGAACAACGCGGACTGCACCTGGACCATTCTGGCTGAGCCCGGGGACACCATTGCGCTGGTCTTCACTGACTTTCAGCTAGAAGAAGGATATGATTTCTTAGAGATCAGTGGCACGGAAGCTCCATCCATATG

SEQ ID NO:262CSMD1的外显子6

GCTAACTGGCATGAACCTCCCCTCTCCAGTTATCAGTAGCAAGAATTGGCTACGACTCCATTTCACCTCTGACAGCAACCACCGACGCAAAGGATTTAACGCTCAGTTCCAAG

SEQ ID NO:263CSMD1的外显子7

TGAAAAAGGCGATTGAGTTGAAGTCAAGAGGAGTCAAGATGCTGCCCAGCAAGGATGGAAGCCATAAAAACTCTGTCT

SEQ ID NO:264CSMD1的外显子8

TGAGCCAAGGAGGTGTTGCATTGGTCTCTGACATGTGTCCAGATCCTGGGATTCCAGAAAATGGTAGAAGAGCAGGTTCCGACTTCAG

SEQ ID NO:265CSMD1的外显子9

GGTTGGTGCAAATGTACAGTTTTCATGTGAGGACAATTACGTGCTCCAGGGATCTAAAAGCATCACCTGTCAGAGAGTTACAGAGACGCTCGCTGCTTGGAGTGACCACAGGCCCATCTGCCGAG

SEQ ID NO:266CSMD1的外显子10

CGAGAACATGTGGATCCAATCTGCGTGGGCCCAGCGGCGTCATTACCTCCCCTAATTATCCGGTTCAGTATGAAGATAATGCACACTGTGTGTGGGTCATCACCACCACCGACCCGGACAAG

SEQ ID NO:267CSMD1的外显子11

GTCATCAAGCTTGCCTTTGAAGAGTTTGAGCTGGAGCGAGGCTATGACACCCTGACGGTTGGTGATGCTGGGAAGGTGGGAGACACCAGATCGGTCTTGTACGT

SEQ ID NO:268CSMD1的外显子12

GCTCACGGGATCCAGTGTTCCTGACCTCATTGTGAGCATGAGCAACCAGATGTGGCTACATCTGCAGTCGGATGATAGCATTGGCTCACCTGGGTTTAAAGCTGTTTACCAAG

SEQ ID NO:269CSMD1的外显子13

AAATTGAAAAGGGAGGGTGTGGGGATCCTGGAATCCCCGCCTATGGGAAGCGGACGGGCAGCAGTTTCCTCCATGGAGATACACTCACCTTTGAATGCCCGGCGGCCTTTGAGCTGGTGGGGGAGAGAGTTATCACCTGTCAGCAGAACAATCAGTGGTCTGGCAACAAGCCCAGCTGTGTAT

SEQ ID NO:270CSMD1的外显子14

TTTCATGTTTCTTCAACTTTACGGCATCATCTGGGATTATTCTGTCACCAAATTATCCAGAGGAATATGGGAACAACATGAACTGTGTCTGGTTGATTATCTCGGAGCCAGGAAGTCGAATTCACCTAATCTTTAATGATTTTGATGTTGAGCCTCAGTTTGACTTTCTCGCGGTCAAGGATGATGGCATTTCTGACATAACTGTCCTGGGTACTTTTTCTGGCAATGAAGTGCCTTCCCAGCTGGCCAGCAGTGGGCATATAGTTCGCTTGGAATTTCAGTCTGACCATTCCACTACTGGCAGAGGGTTCAACATCACTTACACCA

SEQ ID NO:271CSMD1的外显子15

CATTTGGTCAGAATGAGTGCCATGATCCTGGCATTCCTATAAACGGACGACGTTTTGGTGACAGGTTTCTACTCGGGAGCTCGGTTTCTTTCCACTGTGATGATGGCTTTGTCAAGACCCAGGGATCCGAGTCCATTACCTGCATACTGCAAGACGGGAACGTGGTCTGGAGCTCCACCGTGCCCCGCTGTGAAG

SEQ ID NO:272CSMD1的外显子16

CTCCATGTGGTGGACATCTGACAGCGTCCAGCGGAGTCATTTTGCCTCCTGGATGGCCAGGATATTATAAGGATTCTTTACATTGTGAATGGATAATTGAAGCAAAACCAGGCCACTCTATCAAAATAACTTTTGACAG

SEQ ID NO:273CSMD1的外显子17

ATTTCAGACAGAGGTCAATTATGACACCTTGGAGGTCAGAGATGGGCCAGCCAGTTCGTCCCCACTGATCGGCGAGTACCACGGCACCCAGGCACCCCAGTTCCTCATCAGCACCGGGAACTTCATGTACCTGCTGTTCACCACTGACAACAGCCGCTCCAGCATCGGCTTCCTCATCCACTATGAGA

SEQ ID NO:274CSMD1的外显子18

GTGTGACGCTTGAGTCGGATTCCTGCCTGGACCCGGGCATCCCTGTGAACGGCCATCGCCACGGTGGAGACTTTGGCATCAGGTCCACAGTGACTTTCAGCTGTGACCCGGGGTACACACTAAGTGACGACGAGCCCCTCGTCTGTGAGAGGAACCACCAGTGGAACCACGCCTTGCCCAGCTGCGACG

SEQ ID NO:275CSMD1的外显子19

CTCTATGTGGAGGCTACATCCAAGGGAAGAGTGGAACAGTCCTTTCTCCTGGGTTTCCAGATTTTTATCCAAACTCTCTAAACTGCACGTGGACCATTGAAGTGTCTCATGGGAAAG

SEQ ID NO:276CSMD1的外显子20

GAGTTCAAATGATCTTTCACACCTTTCATCTTGAGAGTTCCCACGACTATTTACTGATCACAGAGGATGGAAGTTTTTCCGAGCCCGTTGCCAGGCTCACCGGGTCGGTGTTGCCTCATACGATCAAGGCAGGCCTGTTTGGAAACTTCACTGCCCAGCTTCGGTTTATATCAGACTTCTCAATTTCGTACGAGGGCTTCAATATCACATTTTCAG

SEQ ID NO:277CSMD1的外显子21

AATATGACCTGGAGCCATGTGATGATCCTGGAGTCCCTGCCTTCAGCCGAAGAATTGGTTTTCACTTTGGTGTGGGAGACTCTCTGACGTTTTCCTGCTTCCTGGGATATCGTTTAGAAGGTGCCACCAAGCTTACCTGCCTGGGTGGGGGCCGCCGTGTGTGGAGTGCACCTCTGCCAAGGTGTGTGG

SEQ ID NO:278CSMD1的外显子22

CCGAATGTGGAGCAAGTGTCAAAGGAAATGAAGGAACATTACTGTCTCCAAATTTTCCATCCAATTATGATAATAACCATGAGTGTATCTATAAAATAGAAACAGAAGCCGGCAAGGGCATCCACCTTAGAACACGAAGCTTCCAGCTGTTTGAAGGAGATACTCTAAAG

SEQ ID NO:279CSMD1的外显子23

GTATATGATGGAAAAGACAGTTCCTCACGTCCACTGGGCACGTTCACTAAAAATGAACTTCTGGGGCTGATCCTAAACAGCACATCCAATCACCTGTGGCTAGAGTTCAACACCAATGGATCTGACACCGACCAAGGTTTTCAACTCACCTATACCA

SEQ ID NO:280CSMD1的外显子24

GTTTTGATCTGGTAAAATGTGAGGATCCGGGCATCCCTAACTACGGCTATAGGATCCGTGATGAAGGCCACTTTACCGACACTGTAGTTCTGTACAGTTGCAACCCGGGGTACGCCATGCATGGCAGCAACACCCTGACCTGTTTGAGTGGAGACAGGAGAGTGTGGGACAAACCACTACCTTCGTGCATAG

SEQ ID NO:281CSMD1的全部47个外显子24-70按顺序排列的多核苷酸序列

SEQ ID NO:282CSMD1的全部70个外显子1-70按顺序排列的多核苷酸序列

CTCCACGGCAGCGGCTCCTTGTGCCACTAGCAGCCCTTCTTCTGCGCTCTCCGCCTTTTCTCTCTAGACTGGATCTCTCCTCCCCCCCGCGCCCCCCTCCCCGCATCTCCCACTCGCTGGCTCTCTCTCCAGCTGCCTCCTCTCCAGGTCTCTCCTGGCTGCGCGCGCTCCTCTCCCCGCTTCTCCCCCTCCCGCAGCCTCGCCGCCTTGGTGCCTTCCTGCCCGGCTCGGCCGGCGCTCGTCCCCGGCCCCGGCCCCGCCAGCCCGGGTCTCCGCGCTCGGAGCAGCTCAGCCCTGCAGTGGCTCGGGACCCGATGCTATGAGAGGGAAGCGAGCCGGGCGCCCAGACCTTCAGGAGGCGTCGGATGCGCGGCGGGTCTTGGGACCGGGCTCTCTCTCCGGCTCGCCTTGCCCTCGGGTGATTATTTGGCTCCGCTCATAGCCCTGCCTTCCTCGGAGGAGCCATCGGTGTCGCGTGCGTGTGGAGTATCTGCAGACATGACTGCGTGGAGGAGATTCCAGTCGCTGCTCCTGCTTCTCGGGCTGCTGGTGCTGTGCGCGAGGCTCCTCACTGCAGCGAAGGGTCAGAACTGTGGAGGCTTAGTCCAGGGTCCCAATGGCACTATTGAGAGCCCAGGGTTTCCTCACGGGTATCCGAACTATGCCAACTGCACCTGGATCATCATCACGGGCGAGCGCAATAGGATACAGTTGTCCTTCCATACCTTTGCTCTTGAAGAAGATTTTGATATTTTATCAGTTTACGATGGACAGCCTCAACAAGGGAATTTAAAAGTGAGATTATCGGGATTTCAGCTGCCCTCCTCTATAGTGAGTACAGGATCTATCCTCACTCTGTGGTTCACGACAGACTTCGCTGTGAGTGCCCAAGGTTTCAAAGCATTATATGAAGTTTTACCTAGCCACACTTGTGGAAATCCTGGAGAAATCCTGAAAGGAGTTCTGCATGGAACGAGATTCAACATAGGAGACAAAATCCGGTACAGCTGCCTCCCTGGCTACATCTTGGAAGGCCACGCCATCCTGACCTGCATCGTCAGCCCAGGAAATGGTGCATCGTGGGACTTCCCAGCTCCCTTTTGCAGAGCTGAGGGAGCCTGCGGAGGAACCTTACGCGGGACCAGCAGCTCCATCTCCAGCCCGCACTTCCCTTCAGAGTACGAGAACAACGCGGACTGCACCTGGACCATTCTGGCTGAGCCCGGGGACACCATTGCGCTGGTCTTCACTGACTTTCAGCTAGAAGAAGGATATGATTTCTTAGAGATCAGTGGCACGGAAGCTCCATCCATATGGCTAACTGGCATGAACCTCCCCTCTCCAGTTATCAGTAGCAAGAATTGGCTACGACTCCATTTCACCTCTGACAGCAACCACCGACGCAAAGGATTTAACGCTCAGTTCCAAGTGAAAAAGGCGATTGAGTTGAAGTCAAGAGGAGTCAAGATGCTGCCCAGCAAGGATGGAAGCCATAAAAACTCTGTCTTGAGCCAAGGAGGTGTTGCATTGGTCTCTGACATGTGTCCAGATCCTGGGATTCCAGAAAATGGTAGAAGAGCAGGTTCCGACTTCAGGGTTGGTGCAAATGTACAGTTTTCATGTGAGGACAATTACGTGCTCCAGGGATCTAAAAGCATCACCTGTCAGAGAGTTACAGAGACGCTCGCTGCTTGGAGTGACCACAGGCCCATCTGCCGAGCGAGAACATGTGGATCCAATCTGCGTGGGCCCAGCGGCGTCATTACCTCCCCTAATTATCCGGTTCAGTATGAAGATAATGCACACTGTGTGTGGGTCATCACCACCACCGACCCGGACAAGGTCATCAAGCTTGCCTTTGAAGAGTTTGAGCTGGAGCGAGGCTATGACACCCTGACGGTTGGTGATGCTGGGAAGGTGGGAGACACCAGATCGGTCTTGTACGTGCTCACGGGATCCAGTGTTCCTGACCTCATTGTGAGCATGAGCAACCAGATGTGGCTACATCTGCAGTCGGATGATAGCATTGGCTCACCTGGGTTTAAAGCTGTTTACCAAGAAATTGAAAAGGGAGGGTGTGGGGATCCTGGAATCCCCGCCTATGGGAAGCGGACGGGCAGCAGTTTCCTCCATGGAGATACACTCACCTTTGAATGCCCGGCGGCCTTTGAGCTGGTGGGGGAGAGAGTTATCACCTGTCAGCAGAACAATCAGTGGTCTGGCAAC

AAGCCCAGCTGTGTATTTTCATGTTTCTTCAACTTTACGGCATCATCTGGGATTATTCTGT

CACCAAATTATCCAGAGGAATATGGGAACAACATGAACTGTGTCTGGTTGATTATCTCG

GAGCCAGGAAGTCGAATTCACCTAATCTTTAATGATTTTGATGTTGAGCCTCAGTTTGAC

TTTCTCGCGGTCAAGGATGATGGCATTTCTGACATAACTGTCCTGGGTACTTTTTCTGGC

AATGAAGTGCCTTCCCAGCTGGCCAGCAGTGGGCATATAGTTCGCTTGGAATTTCAGTC

TGACCATTCCACTACTGGCAGAGGGTTCAACATCACTTACACCACATTTGGTCAGAATG

AGTGCCATGATCCTGGCATTCCTATAAACGGACGACGTTTTGGTGACAGGTTTCTACTC

GGGAGCTCGGTTTCTTTCCACTGTGATGATGGCTTTGTCAAGACCCAGGGATCCGAGTC

CATTACCTGCATACTGCAAGACGGGAACGTGGTCTGGAGCTCCACCGTGCCCCGCTGT

GAAGCTCCATGTGGTGGACATCTGACAGCGTCCAGCGGAGTCATTTTGCCTCCTGGATG

GCCAGGATATTATAAGGATTCTTTACATTGTGAATGGATAATTGAAGCAAAACCAGGCCA

CTCTATCAAAATAACTTTTGACAGATTTCAGACAGAGGTCAATTATGACACCTTGGAGG

TCAGAGATGGGCCAGCCAGTTCGTCCCCACTGATCGGCGAGTACCACGGCACCCAGGC

ACCCCAGTTCCTCATCAGCACCGGGAACTTCATGTACCTGCTGTTCACCACTGACAACA

GCCGCTCCAGCATCGGCTTCCTCATCCACTATGAGAGTGTGACGCTTGAGTCGGATTCC

TGCCTGGACCCGGGCATCCCTGTGAACGGCCATCGCCACGGTGGAGACTTTGGCATCA

GGTCCACAGTGACTTTCAGCTGTGACCCGGGGTACACACTAAGTGACGACGAGCCCCT

CGTCTGTGAGAGGAACCACCAGTGGAACCACGCCTTGCCCAGCTGCGACGCTCTATGT

GGAGGCTACATCCAAGGGAAGAGTGGAACAGTCCTTTCTCCTGGGTTTCCAGATTTTTA

TCCAAACTCTCTAAACTGCACGTGGACCATTGAAGTGTCTCATGGGAAAGGAGTTCAA

ATGATCTTTCACACCTTTCATCTTGAGAGTTCCCACGACTATTTACTGATCACAGAGGAT

GGAAGTTTTTCCGAGCCCGTTGCCAGGCTCACCGGGTCGGTGTTGCCTCATACGATCAA

GGCAGGCCTGTTTGGAAACTTCACTGCCCAGCTTCGGTTTATATCAGACTTCTCAATTTC

GTACGAGGGCTTCAATATCACATTTTCAGAATATGACCTGGAGCCATGTGATGATCCTGG

AGTCCCTGCCTTCAGCCGAAGAATTGGTTTTCACTTTGGTGTGGGAGACTCTCTGACGT

TTTCCTGCTTCCTGGGATATCGTTTAGAAGGTGCCACCAAGCTTACCTGCCTGGGTGGG

GGCCGCCGTGTGTGGAGTGCACCTCTGCCAAGGTGTGTGGCCGAATGTGGAGCAAGTG

TCAAAGGAAATGAAGGAACATTACTGTCTCCAAATTTTCCATCCAATTATGATAATAACC

ATGAGTGTATCTATAAAATAGAAACAGAAGCCGGCAAGGGCATCCACCTTAGAACACG

AAGCTTCCAGCTGTTTGAAGGAGATACTCTAAAGGTATATGATGGAAAAGACAGTTCCT

CACGTCCACTGGGCACGTTCACTAAAAATGAACTTCTGGGGCTGATCCTAAACAGCAC

ATCCAATCACCTGTGGCTAGAGTTCAACACCAATGGATCTGACACCGACCAAGGTTTTC

AACTCACCTATACCAGTTTTGATCTGGTAAAATGTGAGGATCCGGGCATCCCTAACTACG

GCTATAGGATCCGTGATGAAGGCCACTTTACCGACACTGTAGTTCTGTACAGTTGCAAC

CCGGGGTACGCCATGCATGGCAGCAACACCCTGACCTGTTTGAGTGGAGACAGGAGAG

TGTGGGACAAACCACTACCTTCGTGCATAGCGGAATGTGGTGGTCAGATCCATGCAGCC

ACATCAGGACGAATATTGTCCCCTGGCTATCCAGCTCCGTATGACAACAACCTCCACTG

CACCTGGATTATAGAGGCAGACCCAGGAAAGACCATTAGCCTCCATTTCATTGTTTTCG

ACACGGAGATGGCTCACGACATCCTCAAGGTCTGGGACGGGCCGGTGGACAGTGACAT

CCTGCTGAAGGAGTGGAGTGGCTCCGCCCTTCCGGAGGACATCCACAGCACCTTCAAC

TCACTCACCCTGCAGTTCGACAGCGACTTCTTCATCAGCAAGTCTGGCTTCTCCATCCA

GTTCTCCACCTCAATTGCAGCCACCTGTAACGATCCAGGTATGCCCCAAAATGGCACCC

GCTATGGAGACAGCAGAGAGGCTGGAGACACCGTCACATTCCAGTGTGACCCTGGCTA

TCAGCTCCAAGGACAAGCCAAAATCACCTGTGTGCAGCTGAATAACCGGTTCTTTTGG

CAACCAGACCCTCCTACATGCATAGCTGCTTGTGGAGGGAATCTGACGGGCCCAGCAG

GTGTTATTTTGTCACCCAACTACCCACAGCCGTATCCTCCTGGGAAGGAATGTGACTGG

AGAGTAAAAGTGAACCCGGACTTTGTCATCGCCTTGATATTCAAAAGTTTCAACATGGA

GCCCAGCTATGACTTCCTACACATCTATGAAGGGGAAGATTCCAACAGCCCCCTCATTG

GGAGTTACCAGGGCTCTCAGGCCCCAGAAAGAATAGAGAGTAGCGGAAACAGCCTGT

TTCTGGCATTTCGGAGTGATGCCTCCGTGGGCCTTTCAGGGTTCGCCATTGAATTTAAA

GAGAAACCACGGGAAGCTTGTTTTGACCCAGGAAATATAATGAATGGGACAAGAGTTG

GAACAGACTTCAAGCTTGGCTCCACCATCACCTACCAGTGTGACTCTGGCTATAAGATT

CTTGACCCCTCATCCATCACCTGTGTGATTGGGGCTGATGGGAAACCCTCCTGGGACCA

AGTGCTGCCCTCCTGCAATGCTCCCTGTGGAGGCCAGTACACGGGATCAGAAGGGGTA

GTTTTATCACCAAACTACCCCCATAATTACACAGCTGGTCAAATATGCCTCTATTCCATCA

CGGTACCAAAGGAATTCGTGGTCTTTGGACAGTTTGCCTATTTCCAGACAGCCCTGAAT

GATTTGGCAGAATTATTTGATGGAACCCATGCACAGGCCAGACTTCTCAGCTCACTCTC

GGGGTCTCACTCAGGGGAAACATTGCCCTTGGCTACGTCAAATCAAATTCTGCTCCGAT

TCAGTGCAAAGAGCGGTGCCTCTGCCCGCGGCTTCCACTTCGTGTATCAAGCTGTTCCT

CGTACCAGTGACACCCAATGCAGCTCTGTCCCCGAGCCCAGATACGGAAGGAGAATTG

GTTCTGAGTTTTCTGCCGGCTCCATCGTCCGATTCGAGTGCAACCCGGGATACCTGCTT

CAGGGTTCCACGGCGCTCCACTGCCAGTCCGTGCCCAACGCCTTGGCACAGTGGAACG

ACACGATCCCCAGCTGTGTGGTACCCTGCAGTGGCAATTTCACTCAACGAAGAGGTAC

AATCCTGTCCCCCGGCTACCCTGAGCCATACGGAAACAACTTGAACTGTATATGGAAGA

TCATAGTTACGGAGGGCTCGGGAATTCAGATCCAAGTGATCAGTTTTGCCACGGAGCA

GAACTGGGACTCCCTTGAGATCCACGATGGTGGGGATGTGACCGCACCCAGACTGGGA

AGCTTCTCAGGCACCACAGTACCGGCACTGCTGAACAGTACTTCCAACCAACTCTACC

TGCATTTCCAGTCTGACATTAGTGTGGCAGCTGCTGGTTTCCACCTGGAATACAAAACT

GTAGGTCTTGCTGCATGCCAAGAACCAGCCCTCCCCAGCAACAGCATCAAAATCGGAG

ATCGGTACATGGTGAACGACGTGCTCTCCTTCCAGTGCGAGCCCGGGTACACCCTGCA

GGGCCGTTCCCACATTTCCTGTATGCCAGGGACCGTTCGCCGTTGGAACTATCCGTCTC

CCCTGTGCATTGCAACCTGTGGAGGGACGCTGAGCACCTTGGGTGGTGTGATCCTGAG

CCCCGGCTTCCCAGGTTCTTACCCCAACAACTTAGACTGCACCTGGAGGATCTCATTAC

CCATCGGCTATGGTGCACATATTCAGTTTCTGAATTTTTCTACCGAAGCTAATCATGACTT

CCTTGAAATTCAAAATGGACCTTACCACACCAGCCCCATGATTGGACAATTTAGCGGCA

CGGATCTCCCCGCGGCCCTGCTGAGCACAACGCATGAAACCCTCATCCACTTTTATAGT

GACCATTCGCAAAACCGGCAAGGATTTAAACTTGCTTACCAAGCCTATGAATTACAGAA

CTGTCCAGATCCACCCCCATTTCAGAATGGGTACATGATCAACTCGGATTACAGCGTGG

GGCAATCAGTATCTTTCGAGTGTTATCCTGGGTACATTCTAATAGGCCATCCTGTCCTCA

CTTGTCAGCATGGGATCAACAGAAACTGGAACTACCCTTTTCCAAGATGTGATGCCCCT

TGTGGGTACAACGTAACTTCTCAGAACGGCACCATCTACTCCCCTGGCTTTCCTGATGA

GTATCCGATCCTGAAGGACTGCATTTGGCTCATCACGGTGCCTCCAGGGCACGGAGTTT

ACATCAACTTCACCCTGTTACAGACGGAAGCTGTCAACGATTACATTGCTGTTTGGGAC

GGTCCCGATCAGAACTCACCCCAGCTGGGAGTTTTCAGTGGCAACACAGCCCTCGAAA

CGGCGTATAGCTCCACCAACCAAGTCCTGCTCAAGTTCCACAGCGACTTTTCAAATGGA

GGCTTCTTTGTCCTCAATTTCCACGCATTTCAGCTCAAGAAATGTCAACCTCCCCCAGC

GGTTCCACAGGCAGAAATGCTTACTGAGGATGATGATTTCGAAATAGGAGATTTTGTGA

AGTACCAGTGCCACCCCGGGTACACCTTGGTGGGGACCGACATTCTGACTTGCAAGCT

CAGTTCCCAGTTGCAGTTTGAGGGTTCTCTCCCAACATGTGAAGCACAATGCCCAGCA

AATGAAGTCCGGACTGGATCATCGGGAGTCATTCTCAGTCCAGGGTATCCGGGTAATTA

TTTTAACTCCCAGACTTGCTCTTGGAGTATTAAAGTGGAACCAAACTACAACATTACCA

TCTTTGTGGACACATTTCAAAGTGAAAAGCAGTTTGATGCACTGGAAGTGTTTGATGGT

TCTTCTGGGCAAAGTCCTCTGCTAGTAGTCTTAAGTGGGAATCATACTGAACAATCAAA

TTTTACAAGCAGGAGTAATCAGTTATATCTCCGCTGGTCCACTGACCATGCCACCAGTA

AGAAAGGATTCAAGATTCGCTATGCAGCACCTTACTGCAGTTTGACCCACCCCCTGAAG

AATGGGGGTATTCTAAACAGGACTGCAGGAGCGGTTGGAAGCAAAGTGCATTATTTTTG

CAAGCCTGGATACCGAATGGTCGGCCACAGCAATGCAACCTGTAGACGAAACCCACTT

GGCATGTACCAGTGGGACTCCCTCACGCCACTCTGCCAGGCTGTGTCCTGTGGAATCCC

AGAATCCCCAGGAAACGGTTCATTTACCGGGAACGAGTTCACTTTGGACAGTAAAGTG

GTCTATGAATGTCATGAGGGCTTCAAGCTTGAATCCAGCCAGCAAGCAACAGCCGTGT

GTCAAGAAGATGGGTTGTGGAGTAACAAGGGGAAGCCGCCCACGTGTAAGCCGGTCG

CTTGCCCCAGCATTGAAGCTCAGCTCTCAGAACATGTCATCTGGAGGCTGGTTTCAGGA

TCCTTGAATGAGTACGGTGCTCAAGTATTGCTGAGCTGCAGTCCTGGTTACTACTTAGA

AGGCTGGAGGCTCCTGCGGTGCCAGGCCAATGGGACGTGGAACATAGGAGATGAGAG

GCCAAGCTGTCGAGTTATCTCGTGTGGAAGCCTTTCCTTTCCCCCAAATGGCAACAAGA

TTGGAACGTTGACAGTTTATGGGGCCACAGCTATATTTACGTGCAACACCGGCTACACG

CTTGTGGGGTCTCATGTCAGAGAGTGCTTGGCAAATGGGCTCTGGAGCGGCAGCGAAA

CTCGATGTCTGGCTGGCCACTGCGGTTCCCCAGACCCGATTGTGAACGGTCACATTAGT

GGAGATGGCTTCAGTTACAGAGACACGGTGGTTTACCAGTGCAATCCTGGTTTCCGGCT

TGTGGGAACTTCCGTGAGGATATGCCTGCAAGACCACAAGTGGTCTGGACAAACGCCT

GTCTGTGTCCCCATCACATGTGGTCACCCTGGAAACCCTGCCCACGGATTCACTAATGG

CAGTGAGTTCAACCTGAATGATGTCGTGAATTTCACCTGCAACACGGGCTATTTGCTGC

AGGGCGTGTCTCGAGCCCAGTGTCGGAGCAACGGCCAGTGGAGTAGCCCTCTGCCCAC

GTGTCGAGTGGTGAACTGTTCTGATCCAGGCTTTGTGGAAAATGCCATTCGTCACGGGC

AACAGAACTTCCCTGAGAGTTTTGAGTATGGAATGAGTATCCTGTACCATTGCAAGAAG

GGATTTTACTTGCTGGGATCTTCAGCCTTGACCTGTATGGCAAATGGCTTATGGGACCGA

TCCCTGCCCAAGTGTTTGGCTATATCGTGTGGACACCCAGGGGTCCCTGCCAACGCCGT

CCTCACTGGAGAGCTGTTTACCTATGGCGCCGTCGTGCACTACTCCTGCAGAGGGAGC

GAGAGCCTCATAGGCAACGACACGAGAGTGTGCCAGGAAGACAGTCACTGGAGCGGG

GCACTGCCCCACTGCACAGGAAATAATCCTGGATTCTGTGGTGATCCGGGGACCCCAG

CACATGGGTCTCGGCTTGGTGATGACTTTAAGACAAAGAGTCTTCTCCGCTTCTCCTGT

GAAATGGGGCACCAGCTGAGGGGCTCCCCTGAACGCACGTGTTTGCTCAATGGGTCAT

GGTCAGGACTGCAGCCGGTGTGTGAGGCCGTGTCCTGTGGCAACCCTGGCACACCCAC

CAACGGAATGATTGTCAGTAGTGATGGCATTCTGTTCTCCAGCTCGGTCATCTATGCCTG

CTGGGAAGGCTACAAGACCTCAGGGCTCATGACACGGCATTGCACAGCCAATGGGACC

TGGACAGGCACTGCTCCCGACTGCACAATTATAAGTTGTGGGGATCCAGGCACACTAG

CAAATGGCATCCAGTTTGGGACCGACTTCACCTTCAACAAGACTGTGAGCTATCAGTGT

AACCCAGGCTATGTCATGGAAGCAGTCACATCCGCCACTATTCGCTGTACCAAAGACGG

CAGGTGGAATCCGAGCAAACCTGTCTGCAAAGCCGTGCTGTGTCCTCAGCCGCCGCCG

GTGCAGAATGGAACAGTGGAGGGAAGTGATTTCCGCTGGGGCTCCAGCATAAGTTACA

GCTGCATGGACGGTTACCAGCTCTCTCACTCCGCCATCCTCTCCTGTGAAGGTCGCGGG

GTGTGGAAAGGAGAGATCCCCCAGTGTCTCCCTGTGTTCTGCGGAGACCCTGGCATCC

CCGCAGAAGGGCGACTTAGTGGGAAAAGTTTCACCTATAAGTCCGAAGTCTTCTTCCA

GTGCAAATCTCCATTTATACTCGTGGGATCCTCCAGAAGAGTCTGCCAAGCTGACGGCA

CGTGGAGCGGCATACAACCCACCTGCATTGATCCTGCTCATAACACCTGCCCAGACCCT

GGTACGCCACACTTTGGAATACAGAATAGCTCCAGAGGCTATGAGGTTGGAAGCACGG

TTTTTTTCAGGTGCAGAAAAGGCTACCATATTCAAGGTTCCACGACTCGCACCTGCCTT

GCCAATTTAACATGGAGTGGGATACAGACCGAATGTATACCTCATGCCTGCAGACAGCC

AGAAACCCCGGCACACGCGGATGTGAGAGCCATCGATCTTCCTACTTTCGGCTACACCT

TAGTGTACACCTGCCATCCAGGCTTTTTCCTCGCAGGGGGATCTGAGCACAGAACATGT

AAAGCAGACATGAAATGGACAGGAAAGTCGCCTGTGTGTAAAAGTAAAGGAGTGAGA

GAAGTTAATGAAACAGTTACTAAAACTCCAGTTCCTTCAGATGTCTTTTTCGTCAATTCA

CTGTGGAAGGGGTATTATGAATATTTAGGGAAAAGACAACCCGCCACTCTAACTGTTGA

CTGGTTCAATGCAACAAGCAGTAAGGTGAATGCCACCTTCAGCGAAGCCTCGCCAGTG

GAGCTGAAGTTGACAGGCATTTACAAGAAGGAGGAGGCCCACTTACTCCTGAAAGCTT

TTCAAATTAAAGGCCAGGCAGATATTTTTGTAAGCAAGTTCGAAAATGACAACTGGGG

ACTAGATGGTTATGTGTCATCTGGACTTGAAAGAGGAGGATTTACTTTTCAAGGTGACA

TTCATGGAAAAGACTTTGGAAAATTTAAGCTAGAAAGGCAAGATCCTTTAAACCCAGAT

CAAGACTCTTCCAGTCATTACCACGGCACCAGCAGTGGCTCTGTGGCGGCTGCCATTCT

GGTTCCTTTCTTTGCTCTAATTTTATCAGGGTTTGCATTTTACCTCTACAAACACAGAAC

GAGACCAAAAGTTCAATACAATGGCTATGCTGGGCATGAAAACAGCAATGGACAAGCA

TCGTTTGAAAACCCCATGTATGATACAAACTTAAAACCCACAGAAGCCAAGGCTGTGA

GGTTTGACACAACTCTGAACACAGTCTGTACAGTGGTATAGCCCTCAGTGCCCCAACA

GGACTGATTCATAGCCATACCTCTGATGGACAAGCAGTGATTCCTTTGGTGCCATATACC

ACTCTCCCTTCCACTCTGGCTTTACTGCAGCGATCTTCAACCTTGTCTACTGGCATAAGT

GCAGCGGGGATCTCTACTCAAATGTGTCAGGGTCTTCTACGGATCAAACTACACATGCG

TTTTCATTCCAAAAGTGGGTTCTAAATGCCTGGCTGCATCTGTATGAAATCAAGGCACA

CTCCAGGAAGACTGCCACGTCGCGCCAACACGTCATACTCAATGCCTCAGACTTTCATA

TTTCTGTGTTGCTGAGATGCCTTTCAATGCAATCGTCTGGGCTCGTGGATATGTCCCTCA

GGTGCGGTGACAGAATGGTGGCACCACGATATGTGTTCTCTTGTGTTGTTTTTCCTTTTT

AAACCCCCATGAACACGAATACTCTGAAAAAAATAAAAAGCTTTCTGGAAGAAGACAC

CTTTCTGATAGAGGCTCACACCTACAAATGCTTCACTCTGTCCTTCCGAGACCTGACAA

GCTTTGAGGACCTCACAGCTCCCCTGTGTGTTCATCTCTAGGGATGTTTGCAATTTCCCA

GTCAGCTGTTCTGTCGCAGAATGTTTAATGCACAATTTTTTGCACTAGTGTGTTATGAAT

GACTAAGATTCTGATAAAAAAAATAAATTATTTACACAGGGTTTATACACACTATCCATT

GTATATAAGCATTATTTCATATTATCAAGCTAAACATTCCCCCATCAGCTTAGTTGGAGTG

TTAGGGAAAAGTATTCCTAGATATGGCACAGATTTTAAAAGGAAATACAGTATTGAAGA

GATTTATTTTATTATTGCTTCAATTAGCTCCATTTACGTGTTGAATTCATTGAAGAGGTCC

AATGAGAAAAAAACAGAAGCCTCCTTATTTCACACGTTTTCCTCCTTTAGTACCATCCT

CATCCAATTACTGTCTCTCTGATACTACTTAATAGCAGGGGGTTTGCAGAAATTTCTGTT

TGCCATGTAAAACTGTGAATAGTAATTTATTTTAGATAGTCGATGAACTTGTGGGTTTTA

GCTCACAATGCAGCCTTCCCTTTTGCAGTGTTTTTTTTTTGTTTTTTTTTTTTTTTGTCTT

TTACTGTGCCATCGATCTTTGATATTGCATTGAAAGACAATATACCACAGTAGCACCTTG

AACTCAGTGAAAATTGTTCAGGATCAAAATACCAAGTGTTCTTTTAGAGGGAAGGAAA

AAGTACACACACTCTCCTCTCACAATGATATATTTTATACATTCATTTGTTATTTGTTTCAT

GCTTTATGATTCCAGATGGAAAGGTAATTTCAGTGACTTTTCAAGTTTAAATTCCATTATA

GGTAAATGATAAGTTATGATGCAAATAAAATCTATAAGATCCCCAGGGCAAATAAAAATC

AAAACATGAAGTAGAAGATGTGGCCGTGAGGTAGTTTATGTAACAAATTCAAAGTGAA

AATCATGTTTACTTTTACTTATACTTATTTGATAAAAATATTTTTGAAACGATAGTACTTAT

TTTATTATTTGATATTTCAGTTCCTATTCAATTGTGGCAGATTTTCTCTGTTTCACATTTTA

GATTGGCGTTGGTAATAGAAATGTCAGAATGTTCAAATTGGCCTTCACGTTGTCGGAGT

GAACACATTGACACCTAGCTTTAAGACTGATTTATCTGTTGGTGTACTGAAGGTTTCCAT

GTAGGACTTCAAATGTGGAAAAGGAAAAGCAGTCAGGAAAATGGGGCATTCTTTGGA

GAGTCACGCGTTTTGATTCGGACATTTCCGTAGAGCTCGGCTCCCAGTGTTGTGTTCCT

CGGTCGAAAGGGTCTCTGCTGTTTGGGGACTCACTGGCCTCTCCTAGGGACTCCTTTGT

CTTGTGAACCCCACGCTGTTGGATTCTGTATCATTATGCTGAATTCTCTGCACAGTTTTC

CCTGGCCAACCTGCCCACATCCTTGGAGATTTGCTTTGCCAGTGGGAATCCTTACATTG

CTGTTTCACAGTAGACGGGACGAGGTCAGCGGGAGTCGTGCTCCTAACACACACATTG

AACGAAACAGAAGATGATTGAAAGTGTGAGGAGGCTCGTGTGCAAGGGAGAACAGGG

TTACTATACATATTAGTGTATATATATACATACATATATATATATATATATTGTACATATCTAAG

TTTGAGTCATTCAAACTAGGTGCAAAATGCTGACTTCAGAGTCTGAATTAACATCTCTG

TTCCCATATCCCTGACCTGCTCCCTGGTCAACGATGCTATGAAATCCTGAAATGACAGG

ACATACATACATACAAGAAACCACATATCAAATTAGATATGATTTTCCTTTGTGTGCAAA

GTCAAACTGTCCTAGGGTTGCCAGTTTGAAGCATGTTATTTAAATGAAAAAAAAAATCA

GTGAAATTCTCGTGTGAGAATTCTGCCTAGTTTCTTCCTAAGGTTGTGTGCAGTGTTGA

ACGGCGTCTCCGCAAGGTGTTGGAGGATCTCATTTTAGGGCAGTCAGGAGCTGTGCTT

GCTGAGTTAGGTCTAGAAGACTCTTCCCTGAAGGCAACGGGAACACGCGTGAGGGAC

GCGACCACACACTAACAGAGGACACGTGCTTCAGAGCTGTTTAAAACTGCTGCTTGTT

TTACACACACATCTTGCCTTTTTTCAGGCTAGCTGCAATAATTTTTTTCTTCTGTAAAATA

TTTTGTAAACAACAACAAAAAGCTATTATAAAAAGGGGGTAAAAAAAAGAACGCTGGC

ATTATGATCAGGAAAACCCATTGTCATCGCCGACCCTCCCTCCCGTCCCACCACACGCT

GCTGTCACGACGTAGGTGCGAAAGACCTTTTTGTACAGAGATATATTTTTTATGAAGAAT

TTGTAAAATTATTAAATATGCTGTAATTTTTTGATTAATGTAGGTACATTGTTAAAAAATA

AATGTTTTTACAATACAGAACTGTAATTTTCCCAATAATGTAAAATGTACCATCTCTAGCT

GATTTTCAGTTCCAATCCTATTACACATGTATTAATATTAAAGTGGCCTGTTAAAATGAAC

AGTATCTTTTTTTTGTCAAAAAAATTATAAAGAGGGTGTAATATAGCCTGTGCAATGCCA

CCAATCTTTAAAGCAAATCAGAGTTCTAATTAAATATTTAATTTTA

SEQ ID NO:283CSMD1的外显子1的翻译多肽序列MTAWRRFQSLLLLLGLLVLCARLLTAAK

SEQ ID NO:284CSMD1的外显子2的翻译多肽序列

QNCGGLVQGPNGTIESPGFPHGYPNYANCTWIIITGERNRIQLSFHTFALEEDFDILSVYDGQPQQGNLKV

SEQ ID NO:285CSMD1的外显子3的翻译多肽序列

LSGFQLPSSIVSTGSILTLWFTTDFAVSAQGFKALYE

SEQ ID NO:286CSMD1的外显子4的翻译多肽序列

LPSHTCGNPGEILKGVLHGTRFNIGDKIRYSCLPGYILEGHAILTCIVSPGNGASWDFPAPFCR

SEQ ID NO:287CSMD1的外显子5的翻译多肽序列

EGACGGTLRGTSSSISSPHFPSEYENNADCTWTILAEPGDTIALVFTDFQLEEGYDFLEISGTEAPSI

SEQ ID NO:288CSMD1的外显子6的翻译多肽序列

LTGMNLPSPVISSKNWLRLHFTSDSNHRRKGFNAQFQ

SEQ ID NO:289CSMD1的外显子7的翻译多肽序列

KKAIELKSRGVKMLPSKDGSHKNSV

SEQ ID NO:290CSMD1的外显子8的翻译多肽序列

SQGGVALVSDMCPDPGIPENGRRAGSDF

SEQ ID NO:291CSMD1的外显子9的翻译多肽序列

VGANVQFSCEDNYVLQGSKSITCQRVTETLAAWSDHRPICR

SEQ ID NO:292CSMD1的外显子10的翻译多肽序列

RTCGSNLRGPSGVITSPNYPVQYEDNAHCVWVITTTDPDK

SEQ ID NO:293CSMD1的外显子11的翻译多肽序列

VIKLAFEEFELERGYDTLTVGDAGKVGDTRSVLY

SEQ ID NO:294CSMD1的外显子12的翻译多肽序列

LTGSSVPDLIVSMSNQMWLHLQSDDSIGSPGFKAVYQ

SEQ ID NO:295CSMD1的外显子13的翻译多肽序列

IEKGGCGDPGIPAYGKRTGSSFLHGDTLTFECPAAFELVGERVITCQQNNQWSGNKPSCV

SEQ ID NO:296CSMD1的外显子14的翻译多肽序列

SCFFNFTASSGIILSPNYPEEYGNNMNCVWLIISEPGSRIHLIFNDFDVEPQFDFLAVKDDGISDITVLGTFSGNEVPSQLASSGHIVRLEFQSDHSTTGRGFNITYT

SEQ ID NO:297CSMD1的外显子15的翻译多肽序列

FGQNECHDPGIPINGRRFGDRFLLGSSVSFHCDDGFVKTQGSESITCILQDGNVVWSSTVPRCE

SEQ ID NO:298CSMD1的外显子16的翻译多肽序列

PCGGHLTASSGVILPPGWPGYYKDSLHCEWIIEAKPGHSIKITFD

SEQ ID NO:299CSMD1的外显子17的翻译多肽序列

FQTEVNYDTLEVRDGPASSSPLIGEYHGTQAPQFLISTGNFMYLLFTTDNSRSSIGFLIHYE

SEQ ID NO:300CSMD1的外显子18的翻译多肽序列

VTLESDSCLDPGIPVNGHRHGGDFGIRSTVTFSCDPGYTLSDDEPLVCERNHQWNHALPSCD

SEQ ID NO:301CSMD1的外显子19的翻译多肽序列

LCGGYIQGKSGTVLSPGFPDFYPNSLNCTWTIEVSHGK

SEQ ID NO:302CSMD1的外显子20的翻译多肽序列

VQMIFHTFHLESSHDYLLITEDGSFSEPVARLTGSVLPHTIKAGLFGNFTAQLRFISDFSISYEGFNITFS

SEQ ID NO:303CSMD1的外显子21的翻译多肽序列

YDLEPCDDPGVPAFSRRIGFHFGVGDSLTFSCFLGYRLEGATKLTCLGGGRRVWSAPLPRCV

SEQ ID NO:304CSMD1的外显子22的翻译多肽序列ECGASVKGNEGTLLSPNFPSNYDNNHECIYKIETEAGKGIHLRTRSFQLFEGDTLK

SEQ ID NO:305CSMD1的外显子23的翻译多肽序列

VYDGKDSSSRPLGTFTKNELLGLILNSTSNHLWLEFNTNGSDTDQGFQLTYT

SEQ ID NO:306CSMD1的外显子24的翻译多肽序列

FDLVKCEDPGIPNYGYRIRDEGHFTDTVVLYSCNPGYAMHGSNTLTCLSGDRRVWDKPLPSCI

SEQ ID NO:307来自外显子24-70的全部47个外显子按顺序排列的翻译多肽序列

SEQ ID NO:308全蛋白质序列

MTAWRRFQSLLLLLGLLVLCARLLTAAKGQNCGGLVQGPNGTIESPGFPHGYPNYANCTWIIITGERNRIQLSFHTFALEEDFDILSVYDGQPQQGNLKVRLSGFQLPSSIVSTGSILTLWFTTDFAVSAQGFKALYEVLPSHTCGNPGEILKGVLHGTRFNIGDKIRYSCLPGYILEGHAILTCIVSPGNGASWDFPAPFCRAEGACGGTLRGTSSSISSPHFPSEYENNADCTWTILAEPGDTIALVFTDFQLEEGYDFLEISGTEAPSIWLTGMNLPSPVISSKNWLRLHFTSDSNHRRKGFNAQFQVKKAIELKSRGVKMLPSKDGSHKNSVLSQGGVALVSDMCPDPGIPENGRRAGSDFRVGANVQFSCEDNYVLQGSKSITCQRVTETLAAWSDHRPICRARTCGSNLRGPSGVITSPNYPVQYEDNAHCVWVITTTDPDKVIKLAFEEFELERGYDTLTVGDAGKVGDTRSVLYVLTGSSVPDLIVSMSNQMWLHLQSDDSIGSPGFKAVYQEIEKGGCGDPGIPAYGKRTGSSFLHGDTLTFECPAAFELVGERVITCQQNNQWSGNKPSCVFSCFFNFTASSGIILSPNYPEEYGNNMNCVWLIISEPGSRIHLIFNDFDVEPQFDFLAVKDDGISDITVLGTFSGNEVPSQLASSGHIVRLEFQSDHSTTGRGFNITYTTFGQNECHDPGIPINGRRFGDRFLLGSSVSFHCDDGFVKTQGSESITCILQDGNVVWSSTVPRCEAPCGGHLTASSGVILPPGWPGYYKDSLHCEWIIEAKPGHSIKITFDRFQTEVNYDTLEVRDGPASSSPLIGEYHGTQAPQFLISTGNFMYLLFTTDNSRSSIGFLIHYESVTLESDSCLDPGIPVNGHRHGGDFGIRSTVTFSCDPGYTLSDDEPLVCERNHQWNHALPSCDALCGGYIQGKSGTVLSPGFPDFYPNSLNCTWTIEVSHGKGVQMIFHTFHLESSHDYLLITEDGSFSEPVARLTGSVLPHTIKAGLFGNFTAQLRFISDFSISYEGFNITFSEYDLEPCDDPGVPAFSRRIGFHFGVGDSLTFSCFLGYRLEGATKLTCLGGGRRVWSAPLPRCVAECGASVKGNEGTLLSPNFPSNYDNNHECIYKIETEAGKGIHLRTRSFQLFEGDTLKVYDGKDSSSRPLGTFTKNELLGLILNSTSNHLWLEFNTNGSDTDQGFQLTYTSFDLVKCEDPGIPNYGYRIRDEGHFTDTVVLYSCNPGYAMHGSNTLTCLSGDRRVWDKPLPSCIAECGGQIHAATSGRILSPGYPAPYDNNLHCTWIIEADPGKTISLHFIVFDTEMAHDILKVWDGPVDSDILLKEWSGSALPEDIHSTFNSLTLQFDSDFFISKSGFSIQFSTSIAATCNDPGMPQNGTRYGDSREAGDTVTFQCDPGYQLQGQAKITCVQLNNRFFWQPDPPTCIAACGGNLTGPAGVILSPNYPQPYPPGKECDWRVKVNPDFVIALIFKSFNMEPSYDFLHIYEGEDSNSPLIGSYQGSQAPERIESSGNSLFLAFRSDASVGLSGFAIEFKEKPREACFDPGNIMNGTRVGTDFKLGSTITYQCDSGYKILDPSSITCVIGADGKPSWDQVLPSCNAPCGGQYTGSEGVVLSPNYPHNYTAGQICLYSITVPKEFVVFGQFAYFQTALNDLAELFDGTHAQARLLSSLSGSHSGETLPLATSNQILLRFSAKSGASARGFHFVYQAVPRTSDTQCSSVPEPRYGRRIGSEFSAGSIVRFECNPGYLLQGSTALHCQSVPNALAQWNDTIPSCVVPCSGNFTQRRGTILSPGYPEPYGNNLNCIWKIIVTEGSGIQIQVISFATEQNWDSLEIHDGGDVTAPRLGSFSGTTVPALLNSTSNQLYLHFQSDISVAAAGFHLEYKTVGLAACQEPALPSNSIKIGDRYMVNDVLSFQCEPGYTLQGRSHISCMPGTVRRWNYPSPLCIATCGGTLSTLGGVILSPGFPGSYPNNLDCTWRISLPIGYGAHIQFLNFSTEANHDFLEIQNGPYHTSPMIGQFSGTDLPAALLSTTHETLIHFYSDHSQNRQGFKLAYQAYELQNCPDPPPFQNGYMINSDYSVGQSVSFECYPGYILIGHPVLTCQHGINRNWNYPFPRCDAPCGYNVTSQNGTIYSPGFPDEYPILKDCIWLITVPPGHGVYINFTLLQTEAVNDYIAVWDGPDQNSPQLGVFSGNTALETAYSSTNQVLLKFHSDFSNGGFFVLNFHAFQLKKCQPPPAVPQAEMLTEDDDFEIGDFVKYQCHPGYTLVGTDILTCKLSSQLQFEGSLPTCEAQCPANEVRTGSSGVILSPGYPGNYFNSQTCSWSIKVEPNYNITIFVDTFQSEKQFDALEVFDGSSGQSPLLVVLSGNHTEQSNFTSRSNQLYLRWSTDHATSKKGFKIRYAAPYCSLTHPLKNGGILNRTAGAVGSKVHYFCKPGYRMVGHSNATCRRNPLGMYQWDSLTPLCQAVSCGIPESPGNGSFTGNEFTLDSKVVYECHEGFKLESSQQATAVCQEDGLWSNKGKPPTCKPVACPSIEAQLSEHVIWRLVSGSLNEYGAQVLLSCSPGYYLEGWRLLRCQANGTWNIGDERPSCRVISCGSLSFPPNGNKIGTLTVYGATAIFTCNTGYTLVGSHVRECLANGLWSGSETRCLAGHCGSPDPIVNGHISGDGFSYRDTVVYQCNPGFRLVGTSVRICLQDHKWSGQTPVCVPITCGHPGNPAHGFTNGSEFNLNDVVNFTCNTGYLLQGVSRAQCRSNGQWSSPLPTCRVVNCSDPGFVENAIRHGQQNFPESFEYGMSILYHCKKGFYLLGSSALTCMANGLWDRSLPKCLAISCGHPGVPANAVLTGELFTYGAVVHYSCRGSESLIGNDTRVCQEDSHWSGALPHCTGNNPGFCGDPGTPAHGSRLGDDFKTKSLLRFSCEMGHQLRGSPERTCLLNGSWSGLQPVCEAVSCGNPGTPTNGMIVSSDGILFSSSVIYACWEGYKTSGLMTRHCTANGTWTGTAPDCTIISCGDPGTLANGIQFGTDFTFNKTVSYQCNPGYVMEAVTSATIRCTKDGRWNPSKPVCKAVLCPQPPPVQNGTVEGSDFRWGSSISYSCMDGYQLSHSAILSCEGRGVWKGEIPQCLPVFCGDPGIPAEGRLSGKSFTYKSEVFFQCKSPFILVGSSRRVCQADGTWSGIQPTCIDPAHNTCPDPGTPHFGIQNSSRGYEVGSTVFFRCRKGYHIQGSTTRTCLANLTWSGIQTECIPHACRQPETPAHADVRAIDLPTFGYTLVYTCHPGFFLAGGSEHRTCKADMKWTGKSPVCKSKGVREVNETVTKTPVPSDVFFVNSLWKGYYEYLGKRQPATLTVDWFNATSSKVNATFSEASPVELKLTGIYKKEEAHLLLKAFQIKGQADIFVSKFENDNWGLDGYVSSGLERGGFTFQGDIHGKDFGKFKLERQDPLNPDQDSSSHYHGTSSGSVAAAILVPFFALILSGFAFYLYKHRTRPKVQYNGYAGHENSNGQASFENPMYDTNLKPTEAKAVRFDTTLNTVCTVV-

SEQ ID NO:309CSMD1的全部23个外显子1-23按顺序排列的多核苷酸序列

SEQ ID NO:310来自CSMD1的全部23个外显子1-23按顺序排列的翻译多肽序列

PTN序列信息

SEQ ID NO:311PTN-NRG1融合物5’处的PTN外显子4序列

CCAGAACTGGAAGTCTGAAGCGAGCCCTGCACAATGCCGAATGCCAGAAGACTGTCACCATCTCCAAGCCCTGTGGCAAACTGACCAAGCCCAAACCTCAAG

SEQ ID NO:312PTN-NRG1融合物3’处的NRG1外显子2序列

CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAACCAGTTCTGAATACTCCTCTCTCAGATT

SEQ ID NO:313PTN-NRG1多核苷酸序列

CCAGAACTGGAAGTCTGAAGCGAGCCCTGCACAATGCCGAATGCCAGAAGACTGTCACCATCTCCAAGCCCTGTGGCAAACTGACCAAGCCCAAACCTCAAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAACCAGTTCTGAATACTCCTCTCTCAGATT

SEQ ID NO:314PTN-NRG1多肽序列

RTGSLKRALHNAECQKTVTISKPCGKLTKPKPQALPPRLKEMKSQESAAGSKLVLRCETSSEYSSLR

SEQ ID NO:315PTN的外显子1

AAGGGGAAATAAGGGACAAGAGAGACCCTCTCATATTGTTTTATATTATTTCATACTCAGAAAAGGAAAGAGAAGCCAAACAAAAGGCAGGTAACCCAGCGCCTAGGAACCAGACCCGAAACCAAGGAACCAGATCTGAAACCAGGCCTGGGCCTGCCTGACCTAAGCCTGGTAGTAAAAATTCCACCCCTGACCTGACCTGGCAACTGTTGTTATCTACAGATTCCAGACATTGTATGGAAGGACACTGTGAAACCTCCCGTTCTGTTCTGTTTCACTCTGACCATCGGTGCTCACAGCCCCTATCACGTACCCCCTGGCTTGCTCAGTCGATCACGACCCTCTCACGTGGACCCCCTTAGAGTTGTTAGCCCTTAAAAGGGACAGAAGTTGAGCACCTGAGGAGCTCAGATTTTAAGACGCTAGGCTGCTGATGCTCCCAGCTGATTAAAGCCACTCCCTTCACTATCTCGGTGTCTCCTGTCCGCGGCTCGTCCTGCTACATTTCTTGGTTCCCTGACCGGCAAGCGAG

SEQ ID NO:316PTN的外显子2

AATGCAGGCTCAACAGTACCAGCAGCAGCGTCGAAAATTTGCAGCTGCCTTCTTGGCATTCATTTTCATACTGGCAGCTGTGGATACTGCTGAAGCAGGGAAGAAAGAGAAACCAG

SEQ ID NO:317PTN的外显子3

AAAAAAAAGTGAAGAAGTCTGACTGTGGAGAATGGCAGTGGAGTGTGTGTGTGCCCACCAGTGGAGACTGTGGGCTGGGCACACGGGAGGGCACTCGGACTGGAGCTGAGTGCAAGCAAACCATGAAGACCCAGAGATGTAAGATCCCCTGCAACTGGAAGAAGCAATTTGGCG

SEQ ID NO:318PTN的外显子4CGGAGTGCAAATACCAGTTCCAGGCCTGGGGAGAATGTGACCTGAACACAGCCCTGAAGACCAGAACTGGAAGTCTGAAGCGAGCCCTGCACAATGCCGAATGCCAGAAGACTGTCACCATCTCCAAGCCCTGTGGCAAACTGACCAAGCCCAAACCTCAAG

SEQ ID NO:319PTN的外显子5

CAGAATCTAAGAAGAAGAAAAAGGAAGGCAAGAAACAGGAGAAGATGCTGGATTAAAAGATGTCACCTGTGGAACATAAAAAGGACATCAGCAAACAGGATCAGTTAACTATTGCATTTATATGTACCGTAGGCTTTGTATTCAAAAATTATCTATAGCTAAGTACACAATAAGCAAAAACAAAAAGAAAAGAAAATTTTTGTAGTAGCGTTTTTTAAATGTATACTATAGTACCAGTAGGGGCTTATAATAAAGGACTGTAATCTTATTTAGGAAGTTGACTTATAGTACATGATAAATGATAGACAATTGAGGTAAGTTTTTTGAAATTATGTGACATTTTACATTAAATTTTTTTTACATTTTTTGGGCAGCAATTTAAATGTTATGACTATGTAAACTACTTCTCTTGTTAGGTAATTTTTTTCACCTAGATTTTTTTCCCAATTGAGAAAAATATATACTAAACAAAATAGCAATAAAACATAATCACTCTATTTGAAGAAAATATCTTGTTTTCTGCCAATAGATTTTTTAAAATGTAGTCAGCAAAATGGGGGTGGGGAAGCAGAGCATGTCCTAGTTCAATGTTGACTTTTTTTTTTTTTAAAGAAAAGCATTAAGACATAAAATTCTTTCACTTTGGCAGAAGCATTTGTTTTCTTGATGAAATTATTTTTCCATCTGAGGAAAAAAATACTAGGAAAATAAATCAAGGTGATGCTGAAAAAAAAA

SEQ ID NO:320PTN的全部5个外显子1-5按顺序排列的多核苷酸序列

SEQ ID NO:321PTN的外显子2的翻译多肽序列

MQAQQYQQQRRKFAAAFLAFIFILAAVDTAEAGKKEKP

SEQ ID NO:322PTN的外显子3的翻译多肽序列

KKVKKSDCGEWQWSVCVPTSGDCGLGTREGTRTGAECKQTMKTQRCKIPCNWKKQFG

SEQ ID NO:323PTN的外显子4的翻译多肽序列

ECKYQFQAWGECDLNTALKTRTGSLKRALHNAECQKTVTISKPCGKLTKPKPQ

SEQ ID NO:324PTN的外显子5

ESKKKKKEGKKQEKMLD

SEQ ID NO:325全蛋白质序列

MQAQQYQQQRRKFAAAFLAFIFILAAVDTAEAGKKEKPEKKVKKSDCGEWQWSVCVPTSGDCGLGTREGTRTGAECKQTMKTQRCKIPCNWKKQFGAECKYQFQAWGECDLNTALKTRTGSLKRALHNAECQKTVTISKPCGKLTKPKPQAESKKKKKEGKKQEKMLD

SEQ ID NO:326PTN的全部4个外显子1-4按顺序排列的多核苷酸序列

SEQ ID NO:327PTN的全部3个外显子2-4按顺序排列的翻译多肽序列

ST14序列信息

SEQ ID NO:328ST14-NRG1融合物5’处的ST14外显子11序列

CAACAGCAACAAGATCACAGTTCGCTTCCACTCAGATCAGTCCTACACCGACACCGGCTTCTTAGCTGAATACCTCTCCTACGACTCCAGTGACC

SEQ ID NO:329ST14-NRG1融合物3’处的NRG1外显子6序列

CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCT

SEQ ID NO:330ST14-NRG1多核苷酸序列

CAACAGCAACAAGATCACAGTTCGCTTCCACTCAGATCAGTCCTACACCGACACCGGCTTCTTAGCTGAATACCTCTCCTACGACTCCAGTGACCCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCT

SEQ ID NO:331ST14-NRG1多肽序列

NSNKITVRFHSDQSYTDTGFLAEYLSYDSSDPTSTSTTGTSHLVKCAEKEKTFCVNGGEC

SEQ ID NO:332ST14的外显子1

GTGAGAGCGGAGCTGCAGCCGGAGAAAGAGGAAGAGGGAGAGAGAGCGCGCCAGGGCGAGGGCACCGCCGCCGGTCGGGCGCGCTGGGCCTGCCCGGAATCCCGCCGCCTGCGCCCCGCGCCCCGCGCCCTGCGGGCCATGGGAGCCGGCCGCCGGCAGGGACGACGCCTGTGAGACCCGCGAGCGGCCTCGGGGACCATGGGGAGCGATCGGGCCCGCAAGGGCGGAGGGGGCCCGAAGGACTTCGGCGCGGGACTCAAGTACAACTCCCGGCACGAG

SEQ ID NO:333ST14的外显子2

AAAGTGAATGGCTTGGAGGAAGGCGTGGAGTTCCTGCCAGTCAACAACGTCAAGAAGGTGGAAAAGCATGGCCCGGGGCGCTGGGTGGTGCTGGCAGCCGTGCTGATCGGCCTCCTCTTGGTCTTGCTGGGGATCGGCTTCCTGGTGTGGCATTTGCAGT

SEQ ID NO:334ST14的外显子3

ACCGGGACGTGCGTGTCCAGAAGGTCTTCAATGGCTACATGAGGATCACAAATGAGAATTTTGTGGATGCCTACGAGAACTCCAACTCCACTGAGTTTGTAAGCCTGGCCAGCAAGGTGAAGGACGCG

SEQ ID NO:335ST14的外显子4

CTGAAGCTGCTGTACAGCGGAGTCCCATTCCTGGGCCCCTACCACAAGGAGTCGGCTGTGACGGCCTTCAG

SEQ ID NO:336ST14的外显子5

CGAGGGCAGCGTCATCGCCTACTACTGGTCTGAGTTCAGCATCCCGCAGCACCTGGTGGAGGAGGCCGAGCGCGTCATGGCCGAGGAGCGCGTAGTCATGCTGCCCCCGCGGGCGCGCTCCCTGAAGTCCTTTGTGGTCACCTCAGTGGTGGCTTTCC

SEQ ID NO:337ST14的外显子6

CCACGGACTCCAAAACAGTACAGAGGACCCAGGACA

SEQ ID NO:338ST14的外显子7

ACAGCTGCAGCTTTGGCCTGCACGCCCGCGGTGTGGAGCTGATGCGCTTCACCACGCCCGGCTTCCCTGACAGCCCCTACCCCGCTCATGCCCGCTGCCAGTGGGCCCTGCGGGGGGACGCCGACTCAGTGCTGAGCCTCACCTTCCGCAGCTTTGACCTTGCGTCCTGCGACGAGCGCGGCAGCGACCTGGTGACGGTGTACAACACCCTGAGCCCCATGGAGCCCCACGCCCTGGTGCA

SEQ ID NO:339ST14的外显子8

GTTGTGTGGCACCTACCCTCCCTCCTACAACCTGACCTTCCACTCCTCCCAGAACGTCCTGCTCATCACACTGATAACCAACACTGAGCGGCGGCATCCCGGCTTTGAGGCCACCTTCTTCCAGCTGCCTAGGATGAGCA

SEQ ID NO:340ST14的外显子9

GCTGTGGAGGCCGCTTACGTAAAGCCCAGGGGACATTCAACAGCCCCTACTACCCAGGCCACTACCCACCCAACATTGACTGCACATGGAACATTGAG

SEQ ID NO:341ST14的外显子10

GTGCCCAACAACCAGCATGTGAAGGTGCGCTTCAAATTCTTCTACCTGCTGGAGCCCGGCGTGCCTGCGGGCACCTGCCCCAAGGACTACGTGGAGATCAACGGGGAGAA

SEQ ID NO:342ST14的外显子11

ATACTGCGGAGAGAGGTCCCAGTTCGTCGTCACCAGCAACAGCAACAAGATCACAGTTCGCTTCCACTCAGATCAGTCCTACACCGACACCGGCTTCTTAGCTGAATACCTCTCCTACGACTCCAGTGACC

SEQ ID NO:343ST14的外显子12

CATGCCCGGGGCAGTTCACGTGCCGCACGGGGCGGTGTATCCGGAAGGAGCTGCGCTGTGATGGCTGGGCCGACTGCACCGACCACAGCGATGAGCTCAACTGCA

SEQ ID NO:344ST14的外显子13

GTTGCGACGCCGGCCACCAGTTCACGTGCAAGAACAAGTTCTGCAAGCCCCTCTTCTGGGTCTGCGACAGTGTGAACGACTGCGGAGACAACAGCGACGAGCAGGGGTGCA

SEQ ID NO:345ST14的外显子14

GTTGTCCGGCCCAGACCTTCAGGTGTTCCAATGGGAAGTGCCTCTCGAAAAGCCAGCAGTGCAATGGGAAGGACGACTGTGGGGACGGGTCCGACGAGGCCTCCTGCCCCAAGGSEQ ID NO:346ST14的外显子15

TGAACGTCGTCACTTGTACCAAACACACCTACCGCTGCCTCAATGGGCTCTGCTTGAGC

AAGGGCAACCCTGAGTGTGACGGGAAGGAGGACTGTAGCGACGGCTCAGATGAGAAGGACTGCG

SEQ ID NO:347ST14的外显子16

ACTGTGGGCTGCGGTCATTCACGAGACAGGCTCGTGTTGTTGGGGGCACGGATGCGGATGAGGGCGAGTGGCCCTGGCAGGTAAGCCTGCATGCTCTGGGCCAGGGCCACATCTGCGGTGCTTCCCTCATCTCTCCCAACTGGCTGGTCTCTGCCGCACACTGCTACATCGATGACAGAGGATTCAG

SEQ ID NO:348ST14的外显子17

GTACTCAGACCCCACGCAGTGGACGGCCTTCCTGGGCTTGCACGACCAGAGCCAGCGCAGCGCCCCTGGGGTGCAGGAGCGCAGGCTCAAGCGCATCATCTCCCACCCCTTCTTCAATGACTTCACCTTCGACTATGACATCGCGCTGCTGGAGCTGGAGAAACCGGCAGAGTACAGCTCCATGGTGCGGCCCATCTGCCTGCCGGACGCCTCCCATGTCTTCCCTGCCGGCAAGGCCATCTGGGTCACGGGCTGGGGACACACCCAGTATGGAG

SEQ ID NO:349ST14的外显子18

GCACTGGCGCGCTGATCCTGCAAAAGGGTGAGATCCGCGTCATCAACCAGACCACCTGCGAGAACCTCCTGCCGCAGCAGATCACGCCGCGCATGATGTGCGTGGGCTTCCTCAGCGGCGGCGTGGACTCCTGCCAG

SEQ ID NO:350ST14的外显子19

GGTGATTCCGGGGGACCCCTGTCCAGCGTGGAGGCGGATGGGCGGATCTTCCAGGCCGGTGTGGTGAGCTGGGGAGACGGCTGCGCTCAGAGGAACAAGCCAGGCGTGTACACAAGGCTCCCTCTGTTTCGGGACTGGATCAAAGAGAACACTGGGGTATAGGGGCCGGGGCCACCCAAATGTGTACACCTGCGGGGCCACCCATCGTCCACCCCAGTGTGCACGCCTGCAGGCTGGAGACTGGACCGCTGACTGCACCAGCGCCCCCAGAACATACACTGTGAACTCAATCTCCAGGGCTCCAAATCTGCCTAGAAAACCTCTCGCTTCCTCAGCCTCCAAAGTGGAGCTGGGAGGTAGAAGGGGAGGACACTGGTGGTTCTACTGACCCAACTGGGGGCAAAGGTTTGAAGACACAGCCTCCCCCGCCAGCCCCAAGCTGGGCCGAGGCGCGTTTGTGCATATCTGCCTCCCCTGTCTCTAAGGAGCAGCGGGAACGGAGCTTCGGGGCCTCCTCAGTGAAGGTGGTGGGGCTGCCGGATCTGGGCTGTGGGGCCCTTGGGCCACGCTCTTGAGGAAGCCCAGGCTCGGAGGACCCTGGAAAACAGACGGGTCTGAGACTGAAATTGTTTTACCAGCTCCCAGGGTGGACTTCAGTGTGTGTATTTGTGTAAATGAGTAAAACATTTTATTTCTTTTTA

SEQ ID NO:351全mRNA多核苷酸序列

SEQ ID NO:352ST14的外显子1的翻译多肽序列

MGSDRARKGGGGPKDFGAGLKYNSRHE

SEQ ID NO:353ST14的外显子2的翻译多肽序列

KVNGLEEGVEFLPVNNVKKVEKHGPGRWVVLAAVLIGLLLVLLGIGFLVWHLQ

SEQ ID NO:354ST14的外显子3的翻译多肽序列

RDVRVQKVFNGYMRITNENFVDAYENSNSTEFVSLASKVKDA

SEQ ID NO:355ST14的外显子4的翻译多肽序列

LKLLYSGVPFLGPYHKESAVTAF

SEQ ID NO:356ST14的外显子5的翻译多肽序列

EGSVIAYYWSEFSIPQHLVEEAERVMAEERVVMLPPRARSLKSFVVTSVVAF

SEQ ID NO:357ST14的外显子6的翻译多肽序列

TDSKTVQRTQD

SEQ ID NO:358ST14的外显子7的翻译多肽序列

SCSFGLHARGVELMRFTTPGFPDSPYPAHARCQWALRGDADSVLSLTFRSFDLASCDERGSDLVTVYNTLSPMEPHALV

SEQ ID NO:359ST14的外显子8的翻译多肽序列

LCGTYPPSYNLTFHSSQNVLLITLITNTERRHPGFEATFFQLPRMS

SEQ ID NO:360ST14的外显子9的翻译多肽序列

CGGRLRKAQGTFNSPYYPGHYPPNIDCTWNIE

SEQ ID NO:361ST14的外显子10的翻译多肽序列

VPNNQHVKVRFKFFYLLEPGVPAGTCPKDYVEINGE

SEQ ID NO:362ST14的外显子11的翻译多肽序列

YCGERSQFVVTSNSNKITVRFHSDQSYTDTGFLAEYLSYDSSD

SEQ ID NO:363ST14的外显子12的翻译多肽序列NM_021978.4

CPGQFTCRTGRCIRKELRCDGWADCTDHSDELNC

SEQ ID NO:364ST14的外显子13的翻译多肽序列

CDAGHQFTCKNKFCKPLFWVCDSVNDCGDNSDEQGC

SEQ ID NO:365ST14的外显子14的翻译多肽序列

CPAQTFRCSNGKCLSKSQQCNGKDDCGDGSDEASCPK

SEQ ID NO:366ST14的外显子15的翻译多肽序列

NVVTCTKHTYRCLNGLCLSKGNPECDGKEDCSDGSDEKDC

SEQ ID NO:367ST14的外显子16的翻译多肽序列

CGLRSFTRQARVVGGTDADEGEWPWQVSLHALGQGHICGASLISPNWLVSAAHCYIDDRGF

SEQ ID NO:368ST14的外显子17的翻译多肽序列

YSDPTQWTAFLGLHDQSQRSAPGVQERRLKRIISHPFFNDFTFDYDIALLELEKPAEYSSMVRPICLPDASHVFPAGKAIWVTGWGHTQYG

SEQ ID NO:369ST14的外显子18的翻译多肽序列

TGALILQKGEIRVINQTTCENLLPQQITPRMMCVGFLSGGVDSCQ

SEQ ID NO:370ST14的外显子19的翻译多肽序列

GDSGGPLSSVEADGRIFQAGVVSWGDGCAQRNKPGVYTRLPLFRDWIKENTGV

SEQ ID NO:371全蛋白质序列

MGSDRARKGGGGPKDFGAGLKYNSRHEKVNGLEEGVEFLPVNNVKKVEKHGPGRWVVLAAVLIGLLLVLLGIGFLVWHLQYRDVRVQKVFNGYMRITNENFVDAYENSNSTEFVSLASKVKDALKLLYSGVPFLGPYHKESAVTAFSEGSVIAYYWSEFSIPQHLVEEAERVMAEERVVMLPPRARSLKSFVVTSVVAFPTDSKTVQRTQDNSCSFGLHARGVELMRFTTPGFPDSPYPAHARCQWALRGDADSVLSLTFRSFDLASCDERGSDLVTVYNTLSPMEPHALVQLCGTYPPSYNLTFHSSQNVLLITLITNTERRHPGFEATFFQLPRMSSCGGRLRKAQGTFNSPYYPGHYPPNIDCTWNIEVPNNQHVKVRFKFFYLLEPGVPAGTCPKDYVEINGEKYCGERSQFVVTSNSNKITVRFHSDQSYTDTGFLAEYLSYDSSDPCPGQFTCRTGRCIRKELRCDGWADCTDHSDELNCSCDAGHQFTCKNKFCKPLFWVCDSVNDCGDNSDEQGCSCPAQTFRCSNGKCLSKSQQCNGKDDCGDGSDEASCPKVNVVTCTKHTYRCLNGLCLSKGNPECDGKEDCSDGSDEKDCDCGLRSFTRQARVVGGTDADEGEWPWQVSLHALGQGHICGASLISPNWLVSAAHCYIDDRGFRYSDPTQWTAFLGLHDQSQRSAPGVQERRLKRIISHPFFNDFTFDYDIALLELEKPAEYSSMVRPICLPDASHVFPAGKAIWVTGWGHTQYGGTGALILQKGEIRVINQTTCENLLPQQITPRMMCVGFLSGGVDSCQGDSGGPLSSVEADGRIFQAGVVSWGDGCAQRNKPGVYTRLPLFRDWIKENTGV

SEQ ID NO:372ST14的全部11个外显子1-11按顺序排列的多核苷酸序列

SEQ ID NO:373ST14的全部11个外显子1-11按顺序排列的翻译多肽序列

THBS1序列信息

SEQ ID NO:374THBS1-NRG1融合物5’处的THBS1外显子9序列

ACCCTGTGAAGGCGAAGCGCGGGAGACCAAAGCCTGCAAGAAAGACGCCTGCCCCA

SEQ ID NO:375THBS1-NRG1融合物3’处的NRG1外显子6序列

CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCTTC

SEQ ID NO:376THBS1-NRG1多核苷酸序列

ACCCTGTGAAGGCGAAGCGCGGGAGACCAAAGCCTGCAAGAAAGACGCCTGCCCCACTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAA

ACTTTCTGTGTGAATGGAGGGGAGTGCTTC

SEQ ID NO:377THBS1-NRG1多肽序列

PCEGEARETKACKKDACPTTSTSTTGTSHLVKCAEKEKTFCVNGGECF

SEQ ID NO:378THBS1的外显子1

AGCCGCTGCGCCCGAGCTGGCCTGCGAGTTCAGGGCTCCTGTCGCTCTCCAGGAGCAACCTCTACTCCGGACGCACAGGCATTCCCCGCGCCCCTCCAGCCCTCGCCGCCCTCGCCACCGCTCCCGGCCGCCGCGCTCCGGTACACACAG

SEQ ID NO:379THBS1的外显子2

GATCCCTGCTGGGCACCAACAGCTCCACCATGGGGCTGGCCTGGGGACTAGGCGTCCTGTTCCTGATGCATGTGTGTGGCACCAACCGCATTCCAG

SEQ ID NO:380THBS1的外显子3

AGTCTGGCGGAGACAACAGCGTGTTTGACATCTTTGAACTCACCGGGGCCGCCCGCAAGGGGTCTGGGCGCCGACTGGTGAAGGGCCCCGACCCTTCCAGCCCAGCTTTCCGCATCGAGGATGCCAACCTGATCCCCCCTGTGCCTGATGACAAGTTCCAAGACCTGGTGGATGCTGTGCGGGCAGAAAAGGGTTTCCTCCTTCTGGCATCCCTGAGGCAGATGAAGAAGACCCGGGGCACGCTGCTGGCCCTGGAGCGGAAAGACCACTCTGGCCAGGTCTTCAGCGTGGTGTCCAATGGCAAGGCGGGCACCCTGGACCTCAGCCTGACCGTCCAAGGAAAGCAGCACGTGGTGTCTGTGGAAGAAGCTCTCCTGGCAACCGGCCAGTGGAAGAGCATCACCCTGTTTGTGCAGGAAGACAGGGCCCAGCTGTACATCGACTGTGAAAAGATGGAGAATGCTGAGTTGGACGTCCCCATCCAAAGCGTCTTCACCAGAGACCTGGCCAGCATCGCCAGACTCCGCATCGCAAAGGGGGGCGTCAATGACAATTTCCAG

SEQ ID NO:381THBS1的外显子4

GGGGTGCTGCAGAATGTGAGGTTTGTCTTTGGAACCACACCAGAAGACATCCTCAGGAACAAAGGCTGCTCCAGCT

SEQ ID NO:382THBS1的外显子5

CTACCAGTGTCCTCCTCACCCTTGACAACAACGTGGTGAATGGTTCCAGCCCTGCCATCCGCACTAACTACATTGGCCACAAGACAAAGGACTTGCAAGCCATCTGCGGCATCTCCTGTGATGAGCTGTCCAGCATGGTCCTGGAACTCAGGGGCCTGCGCACCATTGTGACCACGCTGCAGGACAGCATCCGCAAAGTG

SEQ ID NO:383THBS1的外显子6

ACTGAAGAGAACAAAGAGTTGGCCAATGAGCTGAGGCGGCCTCCCCTATGCTATCACAACGGAGTTCAGTACAGAAATAACGAGGAATGGACTGTTGATAGCTGCACTGAGTGTCACTGTCAG

SEQ ID NO:384THBS1的外显子7

AACTCAGTTACCATCTGCAAAAAGGTGTCCTGCCCCATCATGCCCTGCTCCAATGCCACAGTTCCTGATGGAGAATGCTGTCCTCGCTGTTGGC

SEQ ID NO:385THBS1的外显子8

CCAGCGACTCTGCGGACGATGGCTGGTCTCCATGGTCCGAGTGGACCTCCTGTTCTACGAGCTGTGGCAATGGAATTCAGCAGCGCGGCCGCTCCTGCGATAGCCTCAACAACCGATGTGAGGGCTCCTCGGTCCAGACACGGACCTGCCACATTCAGGAGTGTGACAAGAGATSEQ ID NO:386THBS1的外显子9

TTAAACAGGATGGTGGCTGGAGCCACTGGTCCCCGTGGTCATCTTGTTCTGTGACATGTGGTGATGGTGTGATCACAAGGATCCGGCTCTGCAACTCTCCCAGCCCCCAGATGAACGGGAAACCCTGTGAAGGCGAAGCGCGGGAGACCAAAGCCTGCAAGAAAGACGCCTGCCCCA

SEQ ID NO:387THBS1的全部13个外显子10-22按顺序排列的多核苷酸序列

TTAAACAGGATGGTGGCTGGAGCCACTGGTCCCCGTGGTCATCTTGTTCTGTGACATGTGGTGATGGTGTGATCACAAGGATCCGGCTCTGCAACTCTCCCAGCCCCCAGATGAACGGGAAACCCTGTGAAGGCGAAGCGCGGGAGACCAAAGCCTGCAAGAAAGACGCCTGCCCCATCAATGGAGGCTGGGGTCCTTGGTCACCATGGGACATCTGTTCTGTCACCTGTGGAGGAGGGGTACAGAAACGTAGTCGTCTCTGCAACAACCCCACACCCCAGTTTGGAGG

CAAGGACTGCGTTGGTGATGTAACAGAAAACCAGATCTGCAACAAGCAGGACTGTCCA

ATTGATGGATGCCTGTCCAATCCCTGCTTTGCCGGCGTGAAGTGTACTAGCTACCCTGAT

GGCAGCTGGAAATGTGGTGCTTGTCCCCCTGGTTACAGTGGAAATGGCATCCAGTGCA

CAGATGTTGATGAGTGCAAAGAAGTGCCTGATGCCTGCTTCAACCACAATGGAGAGCA

CCGGTGTGAGAACACGGACCCCGGCTACAACTGCCTGCCCTGCCCCCCACGCTTCACC

GGCTCACAGCCCTTCGGCCAGGGTGTCGAACATGCCACGGCCAACAAACAGGTGTGC

AAGCCCCGTAACCCCTGCACGGATGGGACCCACGACTGCAACAAGAACGCCAAGTGC

AACTACCTGGGCCACTATAGCGACCCCATGTACCGCTGCGAGTGCAAGCCTGGCTACGC

TGGCAATGGCATCATCTGCGGGGAGGACACAGACCTGGATGGCTGGCCCAATGAGAAC

CTGGTGTGCGTGGCCAATGCGACTTACCACTGCAAAAAGGATAATTGCCCCAACCTTCC

CAACTCAGGGCAGGAAGACTATGACAAGGATGGAATTGGTGATGCCTGTGATGATGAC

GATGACAATGATAAAATTCCAGATGACAGGGACAACTGTCCATTCCATTACAACCCAGC

TCAGTATGACTATGACAGAGATGATGTGGGAGACCGCTGTGACAACTGTCCCTACAACC

ACAACCCAGATCAGGCAGACACAGACAACAATGGGGAAGGAGACGCCTGTGCTGCAG

ACATTGATGGAGACGGTATCCTCAATGAACGGGACAACTGCCAGTACGTCTACAATGTG

GACCAGAGAGACACTGATATGGATGGGGTTGGAGATCAGTGTGACAATTGCCCCTTGG

AACACAATCCGGATCAGCTGGACTCTGACTCAGACCGCATTGGAGATACCTGTGACAA

CAATCAGGATATTGATGAAGATGGCCACCAGAACAATCTGGACAACTGTCCCTATGTGC

CCAATGCCAACCAGGCTGACCATGACAAAGATGGCAAGGGAGATGCCTGTGACCACGA

TGATGACAACGATGGCATTCCTGATGACAAGGACAACTGCAGACTCGTGCCCAATCCC

GACCAGAAGGACTCTGACGGCGATGGTCGAGGTGATGCCTGCAAAGATGATTTTGACC

ATGACAGTGTGCCAGACATCGATGACATCTGTCCTGAGAATGTTGACATCAGTGAGACC

GATTTCCGCCGATTCCAGATGATTCCTCTGGACCCCAAAGGGACATCCCAAAATGACCC

TAACTGGGTTGTACGCCATCAGGGTAAAGAACTCGTCCAGACTGTCAACTGTGATCCTG

GACTCGCTGTAGGTTATGATGAGTTTAATGCTGTGGACTTCAGTGGCACCTTCTTCATCA

ACACCGAAAGGGACGATGACTATGCTGGATTTGTCTTTGGCTACCAGTCCAGCAGCCG

CTTTTATGTTGTGATGTGGAAGCAAGTCACCCAGTCCTACTGGGACACCAACCCCACGA

GGGCTCAGGGATACTCGGGCCTTTCTGTGAAAGTTGTAAACTCCACCACAGGGCCTGG

CGAGCACCTGCGGAACGCCCTGTGGCACACAGGAAACACCCCTGGCCAGGTGCGCAC

CCTGTGGCATGACCCTCGTCACATAGGCTGGAAAGATTTCACCGCCTACAGATGGCGTC

TCAGCCACAGGCCAAAGACGGGTTTCATTAGAGTGGTGATGTATGAAGGGAAGAAAAT

CATGGCTGACTCAGGACCCATCTATGATAAAACCTATGCTGGTGGTAGACTAGGGTTGT

TTGTCTTCTCTCAAGAAATGGTGTTCTTCTCTGACCTGAAATACGAATGTAGAGATCCCT

AATCATCAAATTGTTGATTGAAAGACTGATCATAAACCAATGCTGGTATTGCACCTTCTG

GAACTATGGGCTTGAGAAAACCCCCAGGATCACTTCTCCTTGGCTTCCTTCTTTTCTGT

GCTTGCATCAGTGTGGACTCCTAGAACGTGCGACCTGCCTCAAGAAAATGCAGTTTTC

AAAAACAGACTCAGCATTCAGCCTCCAATGAATAAGACATCTTCCAAGCATATAAACAA

TTGCTTTGGTTTCCTTTTGAAAAAGCATCTACTTGCTTCAGTTGGGAAGGTGCCCATTCC

ACTCTGCCTTTGTCACAGAGCAGGGTGCTATTGTGAGGCCATCTCTGAGCAGTGGACTC

AAAAGCATTTTCAGGCATGTCAGAGAAGGGAGGACTCACTAGAATTAGCAAACAAAAC

CACCCTGACATCCTCCTTCAGGAACACGGGGAGCAGAGGCCAAAGCACTAAGGGGAG

GGCGCATACCCGAGACGATTGTATGAAGAAAATATGGAGGAACTGTTACATGTTCGGTA

CTAAGTCATTTTCAGGGGATTGAAAGACTATTGCTGGATTTCATGATGCTGACTGGCGTT

AGCTGATTAACCCATGTAAATAGGCACTTAAATAGAAGCAGGAAAGGGAGACAAAGAC

TGGCTTCTGGACTTCCTCCCTGATCCCCACCCTTACTCATCACCTGCAGTGGCCAGAATT

AGGGAATCAGAATCAAACCAGTGTAAGGCAGTGCTGGCTGCCATTGCCTGGTCACATT

GAAATTGGTGGCTTCATTCTAGATGTAGCTTGTGCAGATGTAGCAGGAAAATAGGAAAA

CCTACCATCTCAGTGAGCACCAGCTGCCTCCCAAAGGAGGGGCAGCCGTGCTTATATTT

TTATGGTTACAATGGCACAAAATTATTATCAACCTAACTAAAACATTCCTTTTCTCTTTTT

TCCTGAATTATCATGGAGTTTTCTAATTCTCTCTTTTGGAATGTAGATTTTTTTTAAATGC

TTTACGATGTAAAATATTTATTTTTTACTTATTCTGGAAGATCTGGCTGAAGGATTATTCAT

GGAACAGGAAGAAGCGTAAAGACTATCCATGTCATCTTTGTTGAGAGTCTTCGTGACTGTAAGATTGTAAATACAGATTATTTATTAACTCTGTTCTGCCTGGAAATTTAGGCTTCATACGGAAAGTGTTTGAGAGCAAGTAGTTGACATTTATCAGCAAATCTCTTGCAAGAACAGCACAAGGAAAATCAGTCTAATAAGCTGCTCTGCCCCTTGTGCTCAGAGTGGATGTTATGGGATTCTTTTTTTCTCTGTTTTATCTTTTCAAGTGGAATTAGTTGGTTATCCATTTGCAAATGTTTTAAATTGCAAAGAAAGCCATGAGGTCTTCAATACTGTTTTACCCCATCCCTTGTGCATATTTCCAGGGAGAAGGAAAGCATATACACTTTTTTCTTTCATTTTTCCAAAAGAGAAAAAAATGACAAAAGGTGAAACTTACATACAAATATTACCTCATTTGTTGTGTGACTGAGTAAAGAATTTTTGGATCAAGCGGAAAGAGTTTAAGTGTCTAACAAACTTAAAGCTACTGTAGTACCTAAAAAGTCAGTGTTGTACATAGCATAAAAACTCTGCAGAGAAGTATTCCCAATAAGGAAATAGCATTGAAATGTTAAATACAATTTCTGAAAGTTATGTTTTTTTTCTATCATCTGGTATACCATTGCTTTATTTTTATAAATTATTTTCTCATTGCCATTGGAATAGATATCTCAGATTGTGTAGATATGCTATTTAAATAATTTATCAGGAAATACTGCCTGTAGAGTTAGTATTTCTATTTTTATATAATGTTTGCACACTGAATTGAAGAATTGTTGGTTTTTTCTTTTTTTTGTTTTGTTTTTTTTTTTTTTTTTTTTTGCTTTTGACCTCCCATTTTTACTATTTGCCAATACCTTTTTCTAGGAATGTGCTTTTTTTTGTACACATTTTTATCCATTTTACATTCTAAAGCAGTGTAAGTTGTATATTACTGTTTCTTATGTACAAGGAACAACAATAAATCATATGGAAATTTATATTTATACTTACTGTATCCATGCTTATTTGTTCTCTACTGGCTTTATGTCATGAAGTATATGCGTAAATACCATTCATAAATCAATATAGCATATACAAAAATAAATTACAGTAAGTCATAGCAACATTCACAGTTTGTATGTGATTGAGAAAGACTGAGTTGCTCAGGCCTAGGCTTAGAATTTGCTGCGTTTGTGGAATAAAAGAACAAAATGATACATTAGCCTGCCATATCAA

SEQ ID NO:388全mRNA多核苷酸序列

SEQ ID NO:389THBS1的外显子2的翻译多肽序列

MGLAWGLGVLFLMHVCGTNRIP

SEQ ID NO:390THBS1的外显子3的翻译多肽序列

SGGDNSVFDIFELTGAARKGSGRRLVKGPDPSSPAFRIEDANLIPPVPDDKFQDLVDAVRAEKGFLLLASLRQMKKTRGTLLALERKDHSGQVFSVVSNGKAGTLDLSLTVQGKQHVVSVEEALLATGQWKSITLFVQEDRAQLYIDCEKMENAELDVPIQSVFTRDLASIARLRIAKGGVNDNFQ

SEQ ID NO:391THBS1的外显子4的翻译多肽序列

GVLQNVRFVFGTTPEDILRNKGCSS

SEQ ID NO:392THBS1的外显子5的翻译多肽序列

TSVLLTLDNNVVNGSSPAIRTNYIGHKTKDLQAICGISCDELSSMVLELRGLRTIVTTLQDSIRKV

SEQ ID NO:393THBS1的外显子6的翻译多肽序列

TEENKELANELRRPPLCYHNGVQYRNNEEWTVDSCTECHCQ

SEQ ID NO:394THBS1的外显子7的翻译多肽序列

NSVTICKKVSCPIMPCSNATVPDGECCPRCW

SEQ ID NO:395THBS1的外显子8的翻译多肽序列

SDSADDGWSPWSEWTSCSTSCGNGIQQRGRSCDSLNNRCEGSSVQTRTCHIQECDKR

SEQ ID NO:396THBS1的外显子9的翻译多肽序列

KQDGGWSHWSPWSSCSVTCGDGVITRIRLCNSPSPQMNGKPCEGEARETKACKKDACP

SEQ ID NO:397THBS1的全部13个外显子10-22按顺序排列的翻译多肽序列

KQDGGWSHWSPWSSCSVTCGDGVITRIRLCNSPSPQMNGKPCEGEARETKACKKDACPINGGWGPWSPWDICSVTCGGGVQKRSRLCNNPTPQFGGKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTSYPDGSWKCGACPPGYSGNGIQCTDVDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEHATANKQVCKPRNPCTDGTHDCNKNAKCNYLGHYSDPMYRCECKPGYAGNGIICGEDTDLDGWPNENLVCVANATYHCKKDNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPAQYDYDRDDVGDRCDNCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQRDTDMDGVGDQCDNCPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKGDACDHDDDNDGIPDDKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVDISETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLAVGYDEFNAVDFSGTFFINTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQGYSGLSVKVVNSTTGPGEHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPKTGFIRVVMYEGKKIMADSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP

SEQ ID NO:398全蛋白质序列

MGLAWGLGVLFLMHVCGTNRIPESGGDNSVFDIFELTGAARKGSGRRLVKGPDPSSPAFRIEDANLIPPVPDDKFQDLVDAVRAEKGFLLLASLRQMKKTRGTLLALERKDHSGQVFSVVSNGKAGTLDLSLTVQGKQHVVSVEEALLATGQWKSITLFVQEDRAQLYIDCEKMENAELDVPIQSVFTRDLASIARLRIAKGGVNDNFQGVLQNVRFVFGTTPEDILRNKGCSSSTSVLLTLDNNVVNGSSPAIRTNYIGHKTKDLQAICGISCDELSSMVLELRGLRTIVTTLQDSIRKVTEENKELANELRRPPLCYHNGVQYRNNEEWTVDSCTECHCQNSVTICKKVSCPIMPCSNATVPDGECCPRCWPSDSADDGWSPWSEWTSCSTSCGNGIQQRGRSCDSLNNRCEGSSVQTRTCHIQECDKRFKQDGGWSHWSPWSSCSVTCGDGVITRIRLCNSPSPQMNGKPCEGEARETKACKKDACPINGGWGPWSPWDICSVTCGGGVQKRSRLCNNPTPQFGGKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTSYPDGSWKCGACPPGYSGNGIQCTDVDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEHATANKQVCKPRNPCTDGTHDCNKNAKCNYLGHYSDPMYRCECKPGYAGNGIICGEDTDLDGWPNENLVCVANATYHCKKDNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPAQYDYDRDDVGDRCDNCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQRDTDMDGVGDQCDNCPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKGDACDHDDDNDGIPDDKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVDISETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLAVGYDEFNAVDFSGTFFINTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQGYSGLSVKVVNSTTGPGEHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPKTGFIRVVMYEGKKIMADSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP

SEQ ID NO:399THBS1的全部9个外显子1-9按顺序排列的多核苷酸序列

SEQ ID NO:400THBS1的全部8个外显子2-9按顺序排列的翻译多肽序列

AGRN序列信息

SEQ ID NO:401AGRN-NRG1融合物5’处的AGRN外显子12序列

GTGTGCGGCTCAGATGGGGTCACCTACAGCACCGAGTGTGAGCTGAAGAAGGCCAGGTGTGAGTCACAGCGAGGGCTCTACGTAGCGGCCCAGGGAGCCTGCCGAG

SEQ ID NO:402AGRN-NRG1融合物3’处的NRG1外显子6序列

CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCTTCATGGTGAAAGAC

SEQ ID NO:403AGRN-NRG1多核苷酸序列

GTGTGCGGCTCAGATGGGGTCACCTACAGCACCGAGTGTGAGCTGAAGAAGGCCAGGTGTGAGTCACAGCGAGGGCTCTACGTAGCGGCCCAGGGAGCCTGCCGAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCTTCATGGTGAAAGAC

SEQ ID NO:404AGRN-NRG1多肽序列

VCGSDGVTYSTECELKKARCESQRGLYVAAQGACRATSTSTTGTSHLVKCAEKEKTFCVNGGECFMVKD

SEQ ID NO:405AGRN的外显子1

AGTCCCGTCCCCGGCGCGGCCCGCGCGCTCCTCCGCCGCCTCTCGCCTGCGCCATGGCCGGCCGGTCCCACCCGGGCCCGCTGCGGCCGCTGCTGCCGCTCCTTGTGGTGGCCGCGTGCGTCCTGCCCGGAGCCGGCGGGACATGCCCGGAGCGCGCGCTGGAGCGGCGCGAGGAGGAGGCGAACGTGGTGCTCACCGGGACGGTGGAGGAGATCCTCAACGTGGACCCGGTGCAGCACACGTACTCCTGCAAG

SEQ ID NO:406AGRN的外显子2

GTTCGGGTCTGGCGGTACTTGAAGGGCAAAGACCTGGTGGCCCGGGAGAGCCTGCTGGACGGCGGCAACAAGGTGGTGATCAGCGGCTTTGGAGACCCCCTCATCTGTGACAACCAGGTGTCCACTGGGGACACCAGGATCTTCTTTGTGAACCCTGCACCCCCATACCTGTGGCCAGCCCACAAGAACGAGCTGATGCTCAACTCCAGCCTCATGCGGATCACCCTGCGGAACCTGGAGGAGGTGGAGTTCTGTGTGGAAG

SEQ ID NO:407AGRN的外显子3

ATAAACCCGGGACCCACTTCACTCCAGTGCCTCCGACGCCTCCTGATG

SEQ ID NO:408AGRN的外显子4

CGTGCCGGGGAATGCTGTGCGGCTTCGGCGCCGTGTGCGAGCCCAACGCGGAGGGGCCGGGCCGGGCGTCCTGCGTCTGCAAGAAGAGCCCGTGCCCCAGCGTGGTGGCGCCTGTGTGTGGGTCGGACGCCTCCACCTACAGCAACGAATGCGAGCTGCAGCGGGCGCAGTGCAGCCAGCAGCGCCGCATCCGCCTGCTCAGCCGCGGGCCGTGCG

SEQ ID NO:409AGRN的外显子5

GCTCGCGGGACCCCTGCTCCAACGTGACCTGCAGCTTCGGCAGCACCTGTGCGCGCTCGGCCGACGGGCTGACGGCCTCGTGCCTGTGCCCCGCGACCTGCCGTGGCGCCCCCGAGGGGACCGTCTGCGGCAGCGACGGCGCCGACTACCCCGGCGAGTGCCAGCTCCTGCGCCGCGCCTGCGCCCGCCAGGAGAATGTCTTCAAGAAGTTCGACGGCCCTTGTG

SEQ ID NO:410AGRN的外显子6

ACCCCTGTCAGGGCGCCCTCCCTGACCCGAGCCGCAGCTGCCGTGTGAACCCGCGCACGCGGCGCCCTGAGATGCTCCTACGGCCCGAGAGCTGCCCTGCCCGGCAGGCGCCAGTGTGTGGGGACGACGGAGTCACCTACGAAAACGACTGTGTCATGGGCCGATCGGGGGCCGCCCGGGGTCTCCTCCTGCAGAAAGTGCGCTCCGGCCAGTGCCAGGGTCGAG

SEQ ID NO:411AGRN的外显子7

ACCAGTGCCCGGAGCCCTGCCGGTTCAATGCCGTGTGCCTGTCCCGCCGTGGCCGTCCCCGCTGCTCCTGCGACCGCGTCACCTGTGACGGGGCCTACAGGCCCGTGTGTGCCCAGGACGGGCGCACGTATGACAGTGATTGCTGGCGGCAGCAGGCTGAGTGCCGGCAGCAGCGTGCCATCCCCAGCAAGCACCAGGGCCCGTGTG

SEQ ID NO:412AGRN的外显子8

ACCAGGCCCCGTCCCCATGCCTCGGGGTGCAGTGTGCATTTGGGGCGACGTGTGCTGTGAAGAACGGGCAGGCAGCGTGTGAATGCCTGCAGGCGTGCTCGAGCCTCTACGATCCTGTGTGCGGCAGCGACGGCGTCACATACGGCAGCGCGTGCGAGCTGGAGGCCACGGCCTGTACCCTCGGGCGGGAGATCCAGGTGGCGCGCAAAGGACCCTGTG

SEQ ID NO:413AGRN的外显子9

ACCGCTGCGGGCAGTGCCGCTTTGGAGCCCTGTGCGAGGCCGAGACCGGGCGCTGCGTGTGCCCCTCTGAATGCGTGGCTTTGGCCCAGCCCGTGTGTGGCTCCGACGGGCACACGTACCCCAGCGAGTGCATGCTGCACGTGCACGCCTGCACACACCAGATCAGCCTGCACGTGGCCTCAGCTGGACCCTGTG

SEQ ID NO:414AGRN的外显子10

AGACCTGTGGAGATGCCGTGTGTGCTTTTGGGGCTGTGTGCTCCGCAGGGCAGTGTGTGTGTCCCCGGTGTGAGCACCCCCCGCCCGGCCCCGTGTGTGGCAGCGACGGTGTCACCTACGGCAGTGCCTGCGAGCTACGGGAAGCCGCCTGCCTCCAGCAGACACAGATCGAGGAGGCCCGGGCAGGGCCGTGCGAGCAGG

SEQ ID NO:415AGRN的外显子11

CCGAGTGCGGTTCCGGAGGCTCTGGCTCTGGGGAGGACGGTGACTGTGAGCAGGAGCTGTGCCGGCAGCGCGGTGGCATCTGGGACGAGGACTCGGAGGACGGGCCGTGTGTCTGTGACTTCAGCTGCCAGAGTGTCCCAGGCAGCCCG

SEQ ID NO:416AGRN的外显子12

SEQ ID NO:417AGRN的全部27个外显子13-39按顺序排列的多核苷酸序列

GCCCCACCTTCGCCCCGCTGCCGCCTGTGGCCCCCTTACACTGTGCCCAGACGCCCTACGGCTGCTGCCAGGACAATATCACCGCAGCCCGGGGCGTGGGCCTGGCTGGCTGCCCCAGTGCCTGCCAGTGCAACCCCCATGGCTCTTACGGCGGCACCTGTGACCCAGCCAC

AGGCCAGTGCTCCTGCCGCCCAGGTGTGGGGGGCCTCAGGTGTGACCGCTGTGAGCCT

GGCTTCTGGAACTTTCGAGGCATCGTCACCGATGGCCGGAGTGGCTGTACACCCTGCA

GCTGTGATCCCCAAGGCGCCGTGCGGGATGACTGTGAGCAGATGACGGGGCTGTGCTC

GTGTAAGCCCGGGGTGGCTGGACCCAAGTGTGGGCAGTGTCCAGACGGCCGTGCCCT

GGGCCCCGCGGGCTGTGAAGCTGACGCTTCTGCGCCTGCGACCTGTGCGGAGATGCGC

TGTGAGTTCGGTGCGCGGTGCGTGGAGGAGTCTGGCTCAGCCCACTGTGTCTGCCCGA

TGCTCACCTGTCCAGAGGCCAACGCTACCAAGGTCTGTGGGTCAGATGGAGTCACATA

CGGCAACGAGTGTCAGCTGAAGACCATCGCCTGCCGCCAGGGCCTGCAAATCTCTATC

CAGAGCCTGGGCCCGTGCCAGGAGGCTGTTGCTCCCAGCACTCACCCGACATCTGCCT

CCGTGACTGTGACCACCCCAGGGCTCCTCCTGAGCCAGGCACTGCCGGCCCCCCCCGG

CGCCCTCCCCCTGGCTCCCAGCAGTACCGCACACAGCCAGACCACCCCTCCGCCCTCA

TCACGACCTCGGACCACTGCCAGCGTCCCCAGGACCACCGTGTGGCCCGTGCTGACGG

TGCCCCCCACGGCACCCTCCCCTGCACCCAGCCTGGTGGCGTCCGCCTTTGGTGAATCT

GGCAGCACTGATGGAAGCAGCGATGAGGAACTGAGCGGGGACCAGGAGGCCAGTGGG

GGTGGCTCTGGGGGGCTCGAGCCCTTGGAGGGCAGCAGCGTGGCCACCCCTGGGCCA

CCTGTCGAGAGGGCTTCCTGCTACAACTCCGCGTTGGGCTGCTGCTCTGATGGGAAGA

CGCCCTCGCTGGACGCAGAGGGCTCCAACTGCCCCGCCACCAAGGTGTTCCAGGGCGT

CCTGGAGCTGGAGGGCGTCGAGGGCCAGGAGCTGTTCTACACGCCCGAGATGGCTGA

CCCCAAGTCAGAACTGTTCGGGGAGACAGCCAGGAGCATTGAGAGCACCCTGGACGA

CCTCTTCCGGAATTCAGACGTCAAGAAGGATTTTCGGAGTGTCCGCTTGCGGGACCTG

GGGCCCGGCAAATCCGTCCGCGCCATTGTGGATGTGCACTTTGACCCCACCACAGCCTT

CAGGGCACCCGACGTGGCCCGGGCCCTGCTCCGGCAGATCCAGGTGTCCAGGCGCCG

GTCCTTGGGGGTGAGGCGGCCGCTGCAGGAGCACGTGCGATTTATGGACTTTGACTGG

TTTCCTGCGTTTATCACGGGGGCCACGTCAGGAGCCATTGCTGCGGGAGCCACGGCCA

GAGCCACCACTGCATCGCGCCTGCCGTCCTCTGCTGTGACCCCTCGGGCCCCGCACCC

CAGTCACACAAGCCAGCCCGTTGCCAAGACCACGGCAGCCCCCACCACACGTCGGCC

CCCCACCACTGCCCCCAGCCGTGTGCCCGGACGTCGGCCCCCGGCCCCCCAGCAGCCT

CCAAAGCCCTGTGACTCACAGCCCTGCTTCCACGGGGGGACCTGCCAGGACTGGGCAT

TGGGCGGGGGCTTCACCTGCAGCTGCCCGGCAGGCAGGGGAGGCGCCGTCTGTGAGA

AGGTGCTTGGCGCCCCTGTGCCGGCCTTCGAGGGCCGCTCCTTCCTGGCCTTCCCCACT

CTCCGCGCCTACCACACGCTGCGCCTGGCACTGGAATTCCGGGCGCTGGAGCCTCAGG

GGCTGCTGCTGTACAATGGCAACGCCCGGGGCAAGGACTTCCTGGCATTGGCGCTGCT

AGATGGCCGCGTGCAGCTCAGGTTTGACACAGGTTCGGGGCCGGCGGTGCTGACCAGT

GCCGTGCCGGTAGAGCCGGGCCAGTGGCACCGCCTGGAGCTGTCCCGGCACTGGCGC

CGGGGCACCCTCTCGGTGGATGGTGAGACCCCTGTTCTGGGCGAGAGTCCCAGTGGCA

CCGACGGCCTCAACCTGGACACAGACCTCTTTGTGGGCGGCGTACCCGAGGACCAGGC

TGCCGTGGCGCTGGAGCGGACCTTCGTGGGCGCCGGCCTGAGGGGGTGCATCCGTTTG

CTGGACGTCAACAACCAGCGCCTGGAGCTTGGCATTGGGCCGGGGGCTGCCACCCGA

GGCTCTGGCGTGGGCGAGTGCGGGGACCACCCCTGCCTGCCCAACCCCTGCCATGGCG

GGGCCCCATGCCAGAACCTGGAGGCTGGAAGGTTCCATTGCCAGTGCCCGCCCGGCCG

CGTCGGACCAACCTGTGCCGATGAGAAGAGCCCCTGCCAGCCCAACCCCTGCCATGGG

GCGGCGCCCTGCCGTGTGCTGCCCGAGGGTGGTGCTCAGTGCGAGTGCCCCCTGGGGC

GTGAGGGCACCTTCTGCCAGACAGCCTCGGGGCAGGACGGCTCTGGGCCCTTCCTGGC

TGACTTCAACGGCTTCTCCCACCTGGAGCTGAGAGGCCTGCACACCTTTGCACGGGAC

CTGGGGGAGAAGATGGCGCTGGAGGTCGTGTTCCTGGCACGAGGCCCCAGCGGCCTC

CTGCTCTACAACGGGCAGAAGACGGACGGCAAGGGGGACTTCGTGTCGCTGGCACTG

CGGGACCGCCGCCTGGAGTTCCGCTACGACCTGGGCAAGGGGGCAGCGGTCATCAGG

AGCAGGGAGCCAGTCACCCTGGGAGCCTGGACCAGGGTCTCACTGGAGCGAAACGGC

CGCAAGGGTGCCCTGCGTGTGGGCGACGGCCCCCGTGTGTTGGGGGAGTCCCCGAAAT

CCCGCAAGGTTCCGCACACCGTCCTCAACCTGAAGGAGCCGCTCTACGTAGGGGGCGC

TCCCGACTTCAGCAAGCTGGCCCGTGCTGCTGCCGTGTCCTCTGGCTTCGACGGTGCC

ATCCAGCTGGTCTCCCTCGGAGGCCGCCAGCTGCTGACCCCGGAGCACGTGCTGCGGCAGGTGGACGTCACGTCCTTTGCAGGTCACCCCTGCACCCGGGCCTCAGGCCACCCCTGCCTCAATGGGGCCTCCTGCGTCCCGAGGGAGGCTGCCTATGTGTGCCTGTGTCCCGGGGGATTCTCAGGACCGCACTGCGAGAAGGGGCTGGTGGAGAAGTCAGCGGGGGACGTGGATACCTTGGCCTTTGACGGGCGGACCTTTGTCGAGTACCTCAACGCTGTGACCGAGAGCGAACTGGCCAATGAGATCCCCGTCCCCGAAACTCTGGATTCCGGGGCCCTTCACAGCGAGAAGGCACTGCAGAGCAACCACTTTGAACTGAGCCTGCGCACTGAGGCCACGCAGGGGCTGGTGCTCTGGAGTGGCAAGGCCACGGAGCGGGCAGACTATGTGGCACTGGCCATTGTGGACGGGCACCTGCAACTGAGCTACAACCTGGGCTCCCAGCCCGTGGTGCTGCGTTCCACCGTGCCCGTCAACACCAACCGCTGGTTGCGGGTCGTGGCACATAGGGAGCAGAGGGAAGGTTCCCTGCAGGTGGGCAATGAGGCCCCTGTGACCGGCTCCTCCCCGCTGGGCGCCACGCAGCTGGACACTGATGGAGCCCTGTGGCTTGGGGGCCTGCCGGAGCTGCCCGTGGGCCCAGCACTGCCCAAGGCCTACGGCACAGGCTTTGTGGGCTGCTTGCGGGACGTGGTGGTGGGCCGGCACCCGCTGCACCTGCTGGAGGACGCCGTCACCAAGCCAGAGCTGCGGCCCTGCCCCACCCCATGAGCTGGCACCAGAGCCCCGCGCCCGCTGTAATTATTTTCTATTTTTGTAAACTTGTTGCTTTTTGATATGATTTTCTTGCCTGAGTGTTGGCCGGAGGGACTGCTGGCCCGGCCTCCCTTCCGTCCAGGCAGCCGTGCTGCAGACAGACCTAGTGCCGAGGGATGGACAGGCGAGGTGGCAGCGTGGAGGGCTCGGCGTGGATGGCAGCCTCAGGACACACACCCCTGCCTCAAGGTGCTGAGCCCCCGCCTTGCACTGCGCCTGCCCCACGGTGTCCCCGCCGGGAAGCAGCCCCGGCTCCTGAATCACCCTCGCTCCGTCAGGCGGGACTCGTGTCCCAGAGAGGAAGGGGCTGCTGAGGTCTGATGGGGCCCTTCCTCCGGGTGACCCCACAGGGCCTTTCCAAGCCCCCATTTGAGCTGCTCCTTCCTGTGTGTGCTCTGGGCCCTGCCTCGGCCTCCTGCGCCAATACTGTGACTTCCAAACAATGTTACTGCTGGGCACAGCTCTGCGTTGCTCCCGTGCTGCCTGCGCCAGCCCCAGGCTGCTGAGGAGCAGAGGCCAGACCAGGGCCGATCTGGGTGTCCTGACCCTCAGCTGGCCCTGCCCAGCCACCCTGGACGTGACCGTATCCCTCTGCCACACCCCAGGCCCTGCGAGGGGCTATCGAGAGGAGCTCACTGTGGGATGGGGTTGACCTCTGCCGCCTGCCTGGGTATCTGGGCCTGGCCATGGCTGTGTTCTTCATGTGTTGATTTTATTTGACCCCTGGAGTGGTGGGTCTCATCTTTCCCATCTCGCCTGAGAGCGGCTGAGGGCTGCCTCACTGCAAATCCTCCCCACAGCGTCAGTGAAAGTCGTCCTTGTCTCAGAATGACCAGGGGCCAGCCAGTGTCTGACCAAGGTCAAGGGGCAGGTGCAGAGGTGGCAGGGATGGCTCCGAAGCCAGAAATGCCTTAAACTGCAACGTCCCGTCCCTTCCCCACCCCCATCCCATCCCCACCCCCAGCCCCAGCCCAGTCCTCCTAGGAGCAGGACCCGATGAAGCGGGCGGCGGTGGGGCTGGGTGCCGTGTTACTAACTCTAGTATGTTTCTGTGTCAATCGCTGTGAAATAAAGTCTGAAAACTTTAAAA

SEQ ID NO:418全mRNA多核苷酸序列

SEQ ID NO:419AGRN的外显子1的翻译多肽序列

MAGRSHPGPLRPLLPLLVVAACVLPGAGGTCPERALERREEEANVVLTGTVEEILNVDPVQHTYSCK

SEQ ID NO:420AGRN的外显子2的翻译多肽序列

VRVWRYLKGKDLVARESLLDGGNKVVISGFGDPLICDNQVSTGDTRIFFVNPAPPYLWPAHKNELMLNSSLMRITLRNLEEVEFCVE

SEQ ID NO:421AGRN的外显子3的翻译多肽序列

KPGTHFTPVPPTPPD

SEQ ID NO:422AGRN的外显子4的翻译多肽序列

CRGMLCGFGAVCEPNAEGPGRASCVCKKSPCPSVVAPVCGSDASTYSNECELQRAQCSQQRRIRLLSRGPC

SEQ ID NO:423AGRN的外显子5的翻译多肽序列

SRDPCSNVTCSFGSTCARSADGLTASCLCPATCRGAPEGTVCGSDGADYPGECQLLRRACARQENVFKKFDGPC

SEQ ID NO:424AGRN的外显子6的翻译多肽序列

PCQGALPDPSRSCRVNPRTRRPEMLLRPESCPARQAPVCGDDGVTYENDCVMGRSGAARGLLLQKVRSGQCQGR

SEQ ID NO:425AGRN的外显子7的翻译多肽序列

QCPEPCRFNAVCLSRRGRPRCSCDRVTCDGAYRPVCAQDGRTYDSDCWRQQAECRQQRAIPSKHQGPC

SEQ ID NO:426AGRN的外显子8的翻译多肽序列

QAPSPCLGVQCAFGATCAVKNGQAACECLQACSSLYDPVCGSDGVTYGSACELEATACTLGREIQVARKGPC

SEQ ID NO:427AGRN的外显子9的翻译多肽序列

RCGQCRFGALCEAETGRCVCPSECVALAQPVCGSDGHTYPSECMLHVHACTHQISLHVASAGPC

SEQ ID NO:428AGRN的外显子10的翻译多肽序列

TCGDAVCAFGAVCSAGQCVCPRCEHPPPGPVCGSDGVTYGSACELREAACLQQTQIEEARAGPCEQ

SEQ ID NO:429AGRN的外显子11的翻译多肽序列

ECGSGGSGSGEDGDCEQELCRQRGGIWDEDSEDGPCVCDFSCQSVPGSP

SEQ ID NO:430AGRN的外显子12的翻译多肽序列

VCGSDGVTYSTECELKKARCESQRGLYVAAQGACR

SEQ ID NO:431AGRN的全部27个外显子12-39按顺序排列的翻译多肽序列

VCGSDGVTYSTECELKKARCESQRGLYVAAQGACRGPTFAPLPPVAPLHCAQTPYGCCQDNITAARGVGLAGCPSACQCNPHGSYGGTCDPATGQCSCRPGVGGLRCDRCEPGFWNFRGIVTDGRSGCTPCSCDPQGAVRDDCEQMTGLCSCKPGVAGPKCGQCPDGRALGPAGCEADASAPATCAEMRCEFGARCVEESGSAHCVCPMLTCPEANATKVCGSDGVTYGNECQLKTIACRQGLQISIQSLGPCQEAVAPSTHPTSASVTVTTPGLLLSQALPAPPGALPLAPSSTAHSQTTPPPSSRPRTTASVPRTTVWPVLTVPPTAPSPAPSLVASAFGESGSTDGSSDEELSGDQEASGGGSGGLEPLEGSSVATPGPPVERASCYNSALGCCSDGKTPSLDAEGSNCPATKVFQGVLELEGVEGQELFYTPEMADPKSELFGETARSIESTLDDLFRNSDVKKDFRSVRLRDLGPGKSVRAIVDVHFDPTTAFRAPDVARALLRQIQVSRRRSLGVRRPLQEHVRFMDFDWFPAFITGATSGAIAAGATARATTASRLPSSAVTPRAPHPSHTSQPVAKTTAAPTTRRPPTTAPSRVPGRRPPAPQQPPKPCDSQPCFHGGTCQDWALGGGFTCSCPAGRGGAVCEKVLGAPVPAFEGRSFLAFPTLRAYHTLRLALEFRALEPQGLLLYNGNARGKDFLALALLDGRVQLRFDTGSGPAVLTSAVPVEPGQWHRLELSRHWRRGTLSVDGETPVLGESPSGTDGLNLDTDLFVGGVPEDQAAVALERTFVGAGLRGCIRLLDVNNQRLELGIGPGAATRGSGVGECGDHPCLPNPCHGGAPCQNLEAGRFHCQCPPGRVGPTCADEKSPCQPNPCHGAAPCRVLPEGGAQCECPLGREGTFCQTASGQDGSGPFLADFNGFSHLELRGLHTFARDLGEKMALEVVFLARGPSGLLLYNGQKTDGKGDFVSLALRDRRLEFRYDLGKGAAVIRSREPVTLGAWTRVSLERNGRKGALRVGDGPRVLGESPKSRKVPHTVLNLKEPLYVGGAPDFSKLARAAAVSSGFDGAIQLVSLGGRQLLTPEHVLRQVDVTSFAGHPCTRASGHPCLNGASCVPREAAYVCLCPGGFSGPHCEKGLVEKSAGDVDTLAFDGRTFVEYLNAVTESELANEIPVPETLDSGALHSEKALQSNHFELSLRTEATQGLVLWSGKATERADYVALAIVDGHLQLSYNLGSQPVVLRSTVPVNTNRWLRVVAHREQREGSLQVGNEAPVTGSSPLGATQLDTDGALWLGGLPELPVGPALPKAYGTGFVGCLRDVVVGRHPLHLLEDAVTKPELRPCPTP

SEQ ID NO:432全蛋白质序列

MAGRSHPGPLRPLLPLLVVAACVLPGAGGTCPERALERREEEANVVLTGTVEEILNVDPVQHTYSCKVRVWRYLKGKDLVARESLLDGGNKVVISGFGDPLICDNQVSTGDTRIFFVNPAPPYLWPAHKNELMLNSSLMRITLRNLEEVEFCVEDKPGTHFTPVPPTPPDACRGMLCGFGAVCEPNAEGPGRASCVCKKSPCPSVVAPVCGSDASTYSNECELQRAQCSQQRRIRLLSRGPCGSRDPCSNVTCSFGSTCARSADGLTASCLCPATCRGAPEGTVCGSDGADYPGECQLLRRACARQENVFKKFDGPCDPCQGALPDPSRSCRVNPRTRRPEMLLRPESCPARQAPVCGDDGVTYENDCVMGRSGAARGLLLQKVRSGQCQGRDQCPEPCRFNAVCLSRRGRPRCSCDRVTCDGAYRPVCAQDGRTYDSDCWRQQAECRQQRAIPSKHQGPCDQAPSPCLGVQCAFGATCAVKNGQAACECLQACSSLYDPVCGSDGVTYGSACELEATACTLGREIQVARKGPCDRCGQCRFGALCEAETGRCVCPSECVALAQPVCGSDGHTYPSECMLHVHACTHQISLHVASAGPCETCGDAVCAFGAVCSAGQCVCPRCEHPPPGPVCGSDGVTYGSACELREAACLQQTQIEEARAGPCEQAECGSGGSGSGEDGDCEQELCRQRGGIWDEDSEDGPCVCDFSCQSVPGSPVCGSDGVTYSTECELKKARCESQRGLYVAAQGACRGPTFAPLPPVAPLHCAQTPYGCCQDNITAARGVGLAGCPSACQCNPHGSYGGTCDPATGQCSCRPGVGGLRCDRCEPGFWNFRGIVTDGRSGCTPCSCDPQGAVRDDCEQMTGLCSCKPGVAGPKCGQCPDGRALGPAGCEADASAPATCAEMRCEFGARCVEESGSAHCVCPMLTCPEANATKVCGSDGVTYGNECQLKTIACRQGLQISIQSLGPCQEAVAPSTHPTSASVTVTTPGLLLSQALPAPPGALPLAPSSTAHSQTTPPPSSRPRTTASVPRTTVWPVLTVPPTAPSPAPSLVASAFGESGSTDGSSDEELSGDQEASGGGSGGLEPLEGSSVATPGPPVERASCYNSALGCCSDGKTPSLDAEGSNCPATKVFQGVLELEGVEGQELFYTPEMADPKSELFGETARSIESTLDDLFRNSDVKKDFRSVRLRDLGPGKSVRAIVDVHFDPTTAFRAPDVARALLRQIQVSRRRSLGVRRPLQEHVRFMDFDWFPAFITGATSGAIAAGATARATTASRLPSSAVTPRAPHPSHTSQPVAKTTAAPTTRRPPTTAPSRVPGRRPPAPQQPPKPCDSQPCFHGGTCQDWALGGGFTCSCPAGRGGAVCEKVLGAPVPAFEGRSFLAFPTLRAYHTLRLALEFRALEPQGLLLYNGNARGKDFLALALLDGRVQLRFDTGSGPAVLTSAVPVEPGQWHRLELSRHWRRGTLSVDGETPVLGESPSGTDGLNLDTDLFVGGVPEDQAAVALERTFVGAGLRGCIRLLDVNNQRLELGIGPGAATRGSGVGECGDHPCLPNPCHGGAPCQNLEAGRFHCQCPPGRVGPTCADEKSPCQPNPCHGAAPCRVLPEGGAQCECPLGREGTFCQTASGQDGSGPFLADFNGFSHLELRGLHTFARDLGEKMALEVVFLARGPSGLLLYNGQKTDGKGDFVSLALRDRRLEFRYDLGKGAAVIRSREPVTLGAWTRVSLERNGRKGALRVGDGPRVLGESPKSRKVPHTVLNLKEPLYVGGAPDFSKLARAAAVSSGFDGAIQLVSLGGRQLLTPEHVLRQVDVTSFAGHPCTRASGHPCLNGASCVPREAAYVCLCPGGFSGPHCEKGLVEKSAGDVDTLAFDGRTFVEYLNAVTESELANEIPVPETLDSGALHSEKALQSNHFELSLRTEATQGLVLWSGKATERADYVALAIVDGHLQLSYNLGSQPVVLRSTVPVNTNRWLRVVAHREQREGSLQVGNEAPVTGSSPLGATQLDTDGALWLGGLPELPVGPALPKAYGTGFVGCLRDVVVGRHPLHLLEDAVTKPELRPCPTP

SEQ ID NO:433AGRN的全部12个外显子1-12按顺序排列的多核苷酸序列

SEQ ID NO:434AGRN的全部12个外显子1-12按顺序排列的翻译多肽序列

PVALB序列信息

SEQ ID NO:435PVALB-NRG1融合物5’处的PVAPB外显子4序列

TAAAAGGCTTCTCCCCAGATGCCAGAGACCTGTCTGCTAAAGAAACCAAGATGCTGATGGCTGCTGGAGACAAAGATGGGGACGGCAAAATTGGGGTTGACG

SEQ ID NO:436PVALB-NRG1融合物3’处的NRG1外显子6序列

CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCTTCATGGTGAAAGACCTTTCAAACCCCTCGAGATACTTG

SEQ ID NO:437PVALB-NRG1多核苷酸序列

TAAAAGGCTTCTCCCCAGATGCCAGAGACCTGTCTGCTAAAGAAACCAAGATGCTGATGGCTGCTGGAGACAAAGATGGGGACGGCAAAATTGGGGTTGACGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCTTCATGGTGAAAGACCTTTCAAACCCCTCGAGATACTTG

SEQ ID NO:438PVALB-NRG1多肽序列

KGFSPDARDLSAKETKMLMAAGDKDGDGKIGVDATSTSTTGTSHLVKCAEKEKTFCVNGGECFMVKDLSNPSRYL

SEQ ID NO:439PVALB的外显子1

ACTTCCCGACAGGACTTCCCACCAGCCCAGCCTTTCAGTGCAGGCTCCAGCCCTCCACCCCCACCCGAG

SEQ ID NO:440PVALB的外显子2

TTGCAGGATGTCGATGACAGACTTGCTGAACGCTGAGGACATCAAGAAGGCGGTGGGAGCCTTTAGCG

SEQ ID NO:441PVALB的外显子3

CTACCGACTCCTTCGACCACAAAAAGTTCTTCCAAATGGTCGGCCTGAAGAAAAAGAGTGCGGATGATGTGAAGAAGGTGTTTCACATGCTGGACAAGGACAAAAGTGGCTTCATCGAGGAGGATGAGCTGGG

SEQ ID NO:442PVALB的外显子4

ATTCATCCTAAAAGGCTTCTCCCCAGATGCCAGAGACCTGTCTGCTAAAGAAACCAAGATGCTGATGGCTGCTGGAGACAAAGATGGGGACGGCAAAATTGGGGTTGACG

SEQ ID NO:443PVALB的外显子5

AATTCTCCACTCTGGTGGCTGAAAGCTAAGAAGCACTGACTGCCCCTGGTCTTCCACCTCTCTGCCCTGAACACCCAATCTCGGCCCCTCTCGCCACCCTCCTGCATTTCTGTTCAGTTCGTTTATGTTATTTTTTACTCCCCCATCCCCTGTGGCCCTCTAATGACACCATTCTTCTGGAAAATGCTGGAGAAGCAATAAAGGTTGTACCAGTCA

SEQ ID NO:444全mRNA多核苷酸序列

ACTTCCCGACAGGACTTCCCACCAGCCCAGCCTTTCAGTGCAGGCTCCAGCCCTCCACCCCCACCCGAGTTGCAGGATGTCGATGACAGACTTGCTGAACGCTGAGGACATCAAGAAGGCGGTGGGAGCCTTTAGCGCTACCGACTCCTTCGACCACAAAAAGTTCTTCCAAATGGTCGGCCTGAAGAAAAAGAGTGCGGATGATGTGAAGAAGGTGTTTCACATGCTGGACAAGGACAAAAGTGGCTTCATCGAGGAGGATGAGCTGGGATTCATCCTAAAAGGCTTCTCCCCAGATGCCAGAGACCTGTCTGCTAAAGAAACCAAGATGCTGATGGCTGCTGGAGACAAAGATGGGGACGGCAAAATTGGGGTTGACGAATTCTCCACTCTGGTGGCTGAAAGCTAAGAAGCACTGACTGCCCCTGGTCTTCCACCTCTCTGCCCTGAACACCCAATCTCGGCCCCTCTCGCCACCCTCCTGCATTTCTGTTCAGTTCGTTTATGTTATTTTTTACTCCCCCATCCCCTGTGGCCCTCTAATGACACCATTCTTCTGGAAAATGCTGGAGAAGCAATAAAGGTTGTACCAGTCA

SEQ ID NO:445PVALB的外显子2的翻译多肽序列

MSMTDLLNAEDIKKAVGAFS

SEQ ID NO:446PVALB的外显子3的翻译多肽序列

TDSFDHKKFFQMVGLKKKSADDVKKVFHMLDKDKSGFIEEDEL

SEQ ID NO:447PVALB的外显子4的翻译多肽序列

FILKGFSPDARDLSAKETKMLMAAGDKDGDGKIGVD

SEQ ID NO:448PVALB的外显子5的翻译多肽序列

FSTLVAES

SEQ ID NO:449全蛋白质序列

MSMTDLLNAEDIKKAVGAFSATDSFDHKKFFQMVGLKKKSADDVKKVFHMLDKDKSGFIEEDELGFILKGFSPDARDLSAKETKMLMAAGDKDGDGKIGVDEFSTLVAES

SEQ ID NO:450PVALB的全部4个外显子1-4按顺序排列的多核苷酸序列

SEQ ID NO:451PVALB的全部3个外显子2-4按顺序排列的翻译多肽序列

SLC3A2转录本3序列信息

SEQ ID NO:452SLC3A2-NRG1融合物5’处的SLC3A2外显子2序列

AGTTGGGGTCTCACTGTGTTGCCCAGACTGGTCTCGAACTCTTGGCCTCAGGTGATCCTCTTCCCTCAGCTTCCCAGAATGCCGAGATGATAG

SEQ ID NO:453SLC3A2-NRG1融合物3’处的NRG1外显子6序列

CTACATCTACATCCACCACTGGGACAAG

SEQ ID NO:454SLC3A2-NRG1多核苷酸序列

AGTTGGGGTCTCACTGTGTTGCCCAGACTGGTCTCGAACTCTTGGCCTCAGGTGATCCTCTTCCCTCAGCTTCCCAGAATGCCGAGATGATAGCTACATCTACATCCACCACTGGGACAAG

SEQ ID NO:455SLC3A2-NRG1多肽序列

LGSHCVAQTGLELLASGDPLPSASQNAEMIATSTSTTGT

SEQ ID NO:456SLC3A2的外显子1

GCATTGCGGCTTGGTTTTCTCACCCAGTGCATGTGGCAGGAGCGGTGAGATCACTGCCTCACGGCGATCCTGGACTGACGGTCACGACTGCCTACCCTCTAACCCTGTTCTGAGCTGCCCCTTGCCCACACACCCCAAACCTGTGTGCAGGATCCGCCTCCATGGAGCTACAGCCTCCTGAAGCCTCGATCGCCGTCGTGTCGATTCCGCGCCAGTTGCCTGGCTCACATTCGGAGGCTGGTGTCCAGGGTCTCAGCGCGGGGGACGACTCAG

SEQ ID NO:457SLC3A2的外显子2

SEQ ID NO:458SLC3A2的外显子3

AGACGGGGTCTGACTGTGTTACCCAGGCTGGTCTTCAACTCTTGGCCTCAAGTGATCCTCCTGCCTTAGCTTCCAAGAATGCTGAGGTTACAG

SEQ ID NO:459SLC3A2的外显子4

GCACCATGAGCCAGGACACCGAGGTGGATATGAAGGAGGTGGAGCTGAATGAGTTAGAGCCCGAGAAGCAGCCGATGAACGCGGCGTCTGGGGCGGCCATGTCCCTGGCGGGAGCCGAGAAGAATGGTCTGGTGAAGATCAAGGTGGCGGAAGACGAGGCGGAGGCGGCAGCCGCGGCTAAGTTCACGGGCCTGTCCAAGGAGGAGCTGCTGAAGGTGGCAGGCAGCCCCGGCTGGGTACGCACCCGCTGGGCACTGCTGCTGCTCTTCTGGCTCGGCTGGCTCGGCATGCTTGCTGGTGCCGTGGTCATAATCGTGCGAGCGCCGCGTTGTCGCGAGCTACCGGCGCAGAAGTGGTGGCACACGGGCGCCCTCTACCGCATCGGCGACCTTCAGGCCTTCCAGGGCCACGGCGCGGGCAACCTGGCGG

SEQ ID NO:460SLC3A2的外显子5

GTCTGAAGGGGCGTCTCGATTACCTGAGCTCTCTGAAGGTGAAGGGCCTTGTGCTGGGTCCAATTCACAAGAACCAGAAGGATGATGTCGCTCAGACTGACTTGCTGCAGATCGACCCCAATTTTGGCTCCAAGGAAGATTTTGACAGTCTCTTGCAATCGGCTAAAAAAAAGASEQ ID NO:461SLC3A2的外显子6

GCATCCGTGTCATTCTGGACCTTACTCCCAACTACCGGGGTGAGAACTCGTGGTTCTCCACTCAGGTTGACACTGTGGCCACCAAGGTGAAG

SEQ ID NO:462SLC3A2的外显子7

GATGCTCTGGAGTTTTGGCTGCAAGCTGGCGTGGATGGGTTCCAGGTTCGGGACATAGAGAATCTGAAG

SEQ ID NO:463SLC3A2的外显子8

GATGCATCCTCATTCTTGGCTGAGTGGCAAAATATCACCAAGGGCTTCAGTGAAGACAG

SEQ ID NO:464SLC3A2的外显子9

SEQ ID NO:465SLC3A2的外显子10

SEQ ID NO:466SLC3A2的外显子11

SEQ ID NO:467SLC3A2的外显子12

SEQ ID NO:468SLC3A2的全mRNA多核苷酸序列

SEQ ID NO:469SLC3A2的外显子1的翻译多肽序列

MELQPPEASIAVVSIPRQLPGSHSEAGVQGLSAGDDS

SEQ ID NO:470SLC3A2的外显子2的翻译多肽序列

LGSHCVAQTGLELLASGDPLPSASQNAEMI

SEQ ID NO:471SLC3A2的外显子3的翻译多肽序列

TGSDCVTQAGLQLLASSDPPALASKNAEVT

SEQ ID NO:472SLC3A2的外显子4的翻译多肽序列

TMSQDTEVDMKEVELNELEPEKQPMNAASGAAMSLAGAEKNGLVKIKVAEDEAEAAAAAKFTGLSKEELLKVAGSPGWVRTRWALLLLFWLGWLGMLAGAVVIIVRAPRCRELPAQKWWHTGALYRIGDLQAFQGHGAGNLA

SEQ ID NO:473SLC3A2的外显子5的翻译多肽序列

LKGRLDYLSSLKVKGLVLGPIHKNQKDDVAQTDLLQIDPNFGSKEDFDSLLQSAKKK

SEQ ID NO:474SLC3A2的外显子6的翻译多肽序列

IRVILDLTPNYRGENSWFSTQVDTVATKVK

SEQ ID NO:475SLC3A2的外显子7的翻译多肽序列

DALEFWLQAGVDGFQVRDIENLK

SEQ ID NO:476SLC3A2的外显子8的翻译多肽序列

DASSFLAEWQNITKGFSED

SEQ ID NO:477SLC3A2的外显子9的翻译多肽序列

LLIAGTNSSDLQQILSLLESNKDLLLTSSYLSDSGSTGEHTKSLVTQYLNATGNRWCSWS

SEQ ID NO:478SLC3A2的外显子10的翻译多肽序列

LSQARLLTSFLPAQLLRLYQLMLFTLPGTPVFSYGDEIGLDAAALPGQ

SEQ ID NO:479SLC3A2的外显子11的翻译多肽序列

PMEAPVMLWDESSFPDIPGAVSANMTVK

SEQ ID NO:480SLC3A2的外显子12的翻译多肽序列

SEQ ID NO:481SLC3A2的全蛋白质序列

MELQPPEASIAVVSIPRQLPGSHSEAGVQGLSAGDDSELGSHCVAQTGLELLASGDPLPSASQNAEMIETGSDCVTQAGLQLLASSDPPALASKNAEVTGTMSQDTEVDMKEVELNELEPEKQPMNAASGAAMSLAGAEKNGLVKIKVAEDEAEAAAAAKFTGLSKEELLKVAGSPGWVRTRWALLLLFWLGWLGMLAGAVVIIVRAPRCRELPAQKWWHTGALYRIGDLQAFQGHGAGNLAGLKGRLDYLSSLKVKGLVLGPIHKNQKDDVAQTDLLQIDPNFGSKEDFDSLLQSAKKKSIRVILDLTPNYRGENSWFSTQVDTVATKVKDALEFWLQAGVDGFQVRDIENLKDASSFLAEWQNITKGFSEDRLLIAGTNSSDLQQILSLLESNKDLLLTSSYLSDSGSTGEHTKSLVTQYLNATGNRWCSWSLSQARLLTSFLPAQLLRLYQLMLFTLPGTPVFSYGDEIGLDAAALPGQPMEAPVMLWDESSFPDIPGAVSANMTVKGQSEDPGSLLSLFRRLSDQRSKERSLLHGDFHAFSAGPGLFSYIRHWDQNERFLVVLNFGDVGLSAGLQASDLPASASLPAKADLLLSTQPGREEGSPLELERLKLEPHEGLLLRFPYAA

SEQ ID NO:482SLC3A2的外显子1和2按顺序排列的多核苷酸序列

SEQ ID NO:483SLC3A2的外显子1-2按顺序排列的翻译多肽序列

APP序列信息

SEQ ID NO:484来自APP-NRG1融合物5’处的APP外显子14的序列

TTGAGCCTGTTGATGCCCGCCCTGCTGCCGACCGAGGACTGACCACTCGACCAG

SEQ ID NO:485APP-NRG1融合物3’处的NRG1外显子6序列

SEQ ID NO:486APP-NRG1多核苷酸序列

TTGAGCCTGTTGATGCCCGCCCTGCTGCCGACCGAGGACTGACCACTCGACCAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCT

SEQ ID NO:487APP-NRG1多肽序列

EPVDARPAADRGLTTRPATSTSTTGTSHLVKCAEKEKTFCVNGGEC

SEQ ID NO:488APP的外显子1

GTCAGTTTCCTCGGCAGCGGTAGGCGAGAGCACGCGGAGGAGCGTGCGCGGGGGCCCCGGGAGACGGCGGCGGTGGCGGCGCGGGCAGAGCAAGGACGCGGCGGATCCCACTCGCACAGCAGCGCACTCGGTGCCCCGCGCAGGGTCGCGATGCTGCCCGGTTTGGCACTGCTCCTGCTGGCCGCCTGGACGGCTCGGGCGCTGGAG

SEQ ID NO:489APP的外显子2

GTCTACCCTGAACTGCAGATCACCAATGTGGTAGAAGCCAACCAACCAGTGACCATCCAGAACTGGTGCAAGCGGGGCCGCAAGCAGTGCAAGACCCATCCCCACTTTGTGATTCCCTACCGCTGCTTAG

SEQ ID NO:490APP的外显子3

TTGGTGAGTTTGTAAGTGATGCCCTTCTCGTTCCTGACAAGTGCAAATTCTTACACCAGGAGAGGATGGATGTTTGCGAAACTCATCTTCACTGGCACACCGTCGCCAAAGAG

SEQ ID NO:491APP的外显子4

ACATGCAGTGAGAAGAGTACCAACTTGCATGACTACGGCATGTTGCTGCCCTGCGGAATTGACAAGTTCCGAGGGGTAGAGTTTGTGTGTTGCCCACTGGCTGAAGAAAGTGACAATGTGGATTCTGCTGATGCGGAGGAGGATGACTCGGATGTCTGGTGGGGCGGAGCAGACACAGACTATGCAGATGGGAG

SEQ ID NO:492APP的外显子5

TGAAGACAAAGTAGTAGAAGTAGCAGAGGAGGAAGAAGTGGCTGAGGTGGAAGAAGAAGAAGCCGATGATGACGAGGACGATGAGGATGGTGATGAGGTAGAGGAAGAGGCTGAGGAACCCTACGAAGAAGCCACAGAGAGAACCACCAGCATTGCCACCACCACCACCACCACCACAGAGTCTGTGGAAGAGGTGGTTCGAG

SEQ ID NO:493APP的外显子6

AGGTGTGCTCTGAACAAGCCGAGACGGGGCCGTGCCGAGCAATGATCTCCCGCTGGTACTTTGATGTGACTGAAGGGAAGTGTGCCCCATTCTTTTACGGCGGATGTGGCGGCAACCGGAACAACTTTGACACAGAAGAGTACTGCATGGCCGTGTGTGGCAGCGCCA

SEQ ID NO:494APP的外显子7

TGTCCCAAAGTTTACTCAAGACTACCCAGGAACCTCTTGCCCGAGATCCTGTTAAAC

SEQ ID NO:495APP的外显子8

TTCCTACAACAGCAGCCAGTACCCCTGATGCCGTTGACAAGTATCTCGAGACACCTGGGGATGAGAATGAACATGCCCATTTCCAGAAAGCCAAAGAGAGGCTTGAGGCCAAGCACCGAGAGAGAATGTCCCAG

SEQ ID NO:496APP的外显子9

GTCATGAGAGAATGGGAAGAGGCAGAACGTCAAGCAAAGAACTTGCCTAAAGCTGATAAGAAGGCAGTTATCCAG

SEQ ID NO:497APP的外显子10

CATTTCCAGGAGAAAGTGGAATCTTTGGAACAGGAAGCAGCCAACGAGAGACAGCAGCTGGTGGAGACACACATGGCCAGAGTGGAAGCCATGCTCAATGACCGCCGCCGCCTGGCCCTGGAGAACTACATCACCGCTCTGCAGGCTGTTCCTCCTCGG

SEQ ID NO:498APP的外显子11

CCTCGTCACGTGTTCAATATGCTAAAGAAGTATGTCCGCGCAGAACAGAAGGACAGACAGCACACCCTAAAGCATTTCGAGCATGTGCGCATGGTGGATCCCAAGAAAGCCGCTCAGATCCGGTCCCAG

SEQ ID NO:499APP的外显子12GTTATGACACACCTCCGTGTGATTTATGAGCGCATGAATCAGTCTCTCTCCCTGCTCTACAACGTGCCTGCAGTGGCCGAGGAGATTCAGGATGAAGTTG

SEQ ID NO:500APP的外显子13

ATGAGCTGCTTCAGAAAGAGCAAAACTATTCAGATGACGTCTTGGCCAACATGATTAGTGAACCAAGGATCAGTTACGGAAACGATGCTCTCATGCCATCTTTGACCGAAACGAAAACCACCGTGGAGCTCCTTCCCGTGAATGGAGAGTTCAGCCTGGACGATCTCCAGCCGTGGCATTCTTTTGGGGCTGACTCTGTGCCAGCCAACACAGAAAACGAAG

SEQ ID NO:501APP的外显子14

TTGAGCCTGTTGATGCCCGCCCTGCTGCCGACCGAGGACTGACCACTCGACCAG

SEQ ID NO:502APP的外显子15

GTTCTGGGTTGACAAATATCAAGACGGAGGAGATCTCTGAAGTGAAGATGGATGCAGAATTCCGACATGACTCAGGATATGAAGTTCATCATCAAAAATTG

SEQ ID NO:503APP的外显子16

GTGTTCTTTGCAGAAGATGTGGGTTCAAACAAAGGTGCAATCATTGGACTCATGGTGGGCGGTGTTGTCATAGCGACAGTGATCGTCATCACCTTGGTGATGCTGAAGAAGAAACAGTACACATCCATTCATCATGGTGTGGTGGAG

SEQ ID NO:504APP的外显子17

GTTGACGCCGCTGTCACCCCAGAGGAGCGCCACCTGTCCAAGATGCAGCAGAACGGCTACGAAAATCCAACCTACAAGTTCTTTGAGCAGATGCAGAACTAGACCCCCGCCACAGCAGCCTCTGAAGTTGGACAGCAAAACCATTGCTTCACTACCCATCGGTGTCCATTTATAGAATAATGTGGGAAGAAACAAACCCGTTTTATGATTTACTCATTATCGCCTTTTGACAGCTGTGCTGTAACACAAGTAGATGCCTGAACTTGAATTAATCCACACATCAGTAATGTATTCTATCTCTCTTTACATTTTGGTCTCTATACTACATTATTAATGGGTTTTGTGTACTGTAAAGAATTTAGCTGTATCAAACTAGTGCATGAATAGATTCTCTCCTGATTATTTATCACATAGCCCCTTAGCCAGTTGTATATTATTCTTGTGGTTTGTGACCCAATTAAGTCCTACTTTACATATGCTTTAAGAATCGATGGGGGATGCTTCATGTGAACGTGGGAGTTCAGCTGCTTCTCTTGCCTAAGTATTCCTTTCCTGATCACTATGCATTTTAAAGTTAAACATTTTTAAGTATTTCAGATGCTTTAGAGAGATTTTTTTTCCATGACTGCATTTTACTGTACAGATTGCTGCTTCTGCTATATTTGTGATATAGGAATTAAGAGGATACACACGTTTGTTTCTTCGTGCCTGTTTTATGTGCACACATTAGGCATTGAGACTTCAAGCTTTTCTTTTTTTGTCCACGTATCTTTGGGTCTTTGATAAAGAAAAGAATCCCTGTTCATTGTAAGCACTTTTACGGGGCGGGTGGGGAGGGGTGCTCTGCTGGTCTTCAATTACCAAGAATTCTCCAAAACAATTTTCTGCAGGATGATTGTACAGAATCATTGCTTATGACATGATCGCTTTCTACACTGTATTACATAAATAAATTAAATAAAATAACCCCGGGCAAGACTTTTCTTTGAAGGATGACTACAGACATTAAATAATCGAAGTAATTTTGGGTGGGGAGAAGAGGCAGATTCAATTTTCTTTAACCAGTCTGAAGTTTCATTTATGATACAAAAGAAGATGAAAATGGAAGTGGCAATATAAGGGGATGAGGAAGGCATGCCTGGACAAACCCTTCTTTTAAGATGTGTCTTCAATTTGTATAAAATGGTGTTTTCATGTAAATAAATACATTCTTGGAGGAGCA

SEQ ID NO:505APP的全mRNA多核苷酸序列

GTCAGTTTCCTCGGCAGCGGTAGGCGAGAGCACGCGGAGGAGCGTGCGCGGGGGCCCCGGGAGACGGCGGCGGTGGCGGCGCGGGCAGAGCAAGGACGCGGCGGATCCCACTCGCACAGCAGCGCACTCGGTGCCCCGCGCAGGGTCGCGATGCTGCCCGGTTTGGCACTGCTCCTGCTGGCCGCCTGGACGGCTCGGGCGCTGGAGGTCTACCCTGAACTGCAGATCACCAATGTGGTAGAAGCCAACCAACCAGTGACCATCCAGAACTGGTGCAAGCGGGGCCGCAAGCAGTGCAAGACCCATCCCCACTTTGTGATTCCCTACCGCTGCTTAGTTGGTGAGTTTGTAAGTGATGCCCTTCTCGTTCCTGACAAGTGCAAATTCTTACACCAGGAGAGGATGGATGTTTGCGAAACTCATCTTCACTGGCACACCGTCGCCAAAGAGACATGCAGTGAGAAGAGTACCAACTTGCATGACTACGGCATGTTGCTGCCCTGCGGAATTGACAAGTTCCGAGGGGTAGAGTTTGTGTGTTGCCCACTGGCTGAAGAAAGTGACAATGTGGATTCTGCTGATGCGGAGGAGGATGACTCGGATGTCTGGTGGGGCGGAGCAGACACAGACTATGCAGATGGGAGTGAAGACAAAGTAGTAGAAGTAGCAGAGGAGGAAGAAGTGGCTGAGGTGGAAGAAGAAGAAGCCGATGATGACGAGGACGATGAGGATGGTGATGAGGTAGAGGAAGAGGCTGAGGAACCCTACGAAGAAGCCACAGAGAGAACCACCAGCATTGCCACCACCACCACCACCACCACAGAGTCTGTGGAAGAGGTGGTTCGAGAGGTGTGCTCTGAACAAGCCGAGACGGGGCCGTGCCGAGCAATGATCTCCCGCTGGTACTTTGATGTGACTGAAGGGAAGTGTGCCCCATTCTTTTACGGCGGATGTGGCGGCAACCGGAACAACTTTGACACAGAAGAGTACTGCATGGCCGTGTGTGGCAGCGCCATGTCCCAAAGTTTACTCAAGACTACCCAGGAACCTCTTGCCCGAGATCCTGTTAAACTTCCTACAACAGCAGCCAGTACCCCTGATGCCGTTGACAAGTATCTCGAGACACCTGGGGATGAGAATGAACATGCCCATTTCCAGAAAGCCAAAGAGAGGCTTGAGGCCAAGCACCGAGAGAGAATGTCCCAGGTCATGAGAGAATGGGAAGAGGCAGAACGTCAAGCAAAGAACTTGCCTAAAGCTGATAAGAAGGCAGTTATCCAGCATTTCCAGGAGAAAGTGGAATCTTTGGAACAGGAAGCAGCCAACGAGAGACAGCAGCTGGTGGAGACACACATGGCCAGAGTGGAAGCCATGCTCAATGACCGCCGCCGCCTGGCCCTGGAGAACTACATCACCGCTCTGCAGGCTGTTCCTCCTCGGCCTCGTCACGTGTTCAATATGCTAAAGAAGTATGTCCGCGCAGAACAGAAGGACAGACAGCACACCCTAAAGCATTTCGAGCATGTGCGCATGGTGGATCCCAAGAAAGCCGCTCAGATCCGGTCCCAGGTTATGACACACCTCCGTGTGATTTATGAGCGCATGAATCAGTCTCTCTCCCTGCTCTACAACGTGCCTGCAGTGGCCGAGGAGATTCAGGATGAAGTTGATGAGCTGCTTCAGAAAGAGCAAAACTATTCAGATGACGTCTTGGCCAACATGATTAGTGAACCAAGGATCAGTTACGGAAACGATGCTCTCATGCCATCTTTGACCGAAACGAAAACCACCGTGGAGCTCCTTCCCGTGAATGGAGAGTTCAGCCTGGACGATCTCCAGCCGTGGCATTCTTTTGGGGCTGACTCTGTGCCAGCCAACACAGAAAACGAAGTTGAGCCTGTTGATGCCCGCCCTGCTGCCGACCGAGGACTGACCACTCGACCAGGTTCTGGGTTGACAAATATCAAGACGGAGGAGATCTCTGAAGTGAAGATGGATGCAGAATTCCGACATGACTCAGGATATGAAGTTCATCATCAAAAATTGGTGTTCTTTGCAGAAGATGTGGGTTCAAACAAAGGTGCAATCATTGGACTCATGGTGGGCGGTGTTGTCATAGCGACAGTGATCGTCATCACCTTGGTGATGCTGAAGAAGAAACAGTACACATCCATTCATCATGGTGTGGTGGAGGTTGACGCCGCTGTCACCCCAGAGGAGCGCCACCTGTCCAAGATGCAGCAGAACGGCTACGAAAATCCAACCTACAAGTTCTTTGAGCAGATGCAGAACTAGACCCCCGCCACAGCAGCCTCTGAAGTTGGACAGCAAAACCATTGCTTCACTACCCATCGGTGTCCATTTATAGAATAATGTGGGAAGAAACAAACCCGTTTTATGATTTACTCATTATCGCCTTTTGACAGCTGTGCTGTAACACAAGTAGATGCCTGAACTTGAATTAATCCACACATCAGTAATGTATTCTATCTCTCTTTACATTTTGGTCTCTATACTACATTATTAATGGGTTTTGTGTACTGTAAAGAATTTAGCTGTATCAAACTAGTGCATGAATAGATTCTCTCCTGATTATTTATCACATAGCCCCTTAGCCAGTTGTATATTATTCTTGTGGTTTGTGACCCAATTAAGTCCTACTTTACATATGCTTTAAGAATCGATGGGGGATGCTTCATGTGAACGTGGGAGTTCAGCTGCTTCTCTTGCCTAAGTATTCCTTTCCTGATCACTATGCATTTTAAAGTTAAACATTTTTAAGTATTTCAGATGCTTTAGAGAGATTTTTTTTCCATGACTGCATTTTACTGTACAGATTGCTGCTTCTGCTATATTTGTGATATAGGAATTAAGAGGATACACACGTTTGTTTCTTCGTGCCTGTTTTATGTGCACACATTAGGCATTGAGACTTCAAGCTTTTCTTTTTTTGTCCACGTATCTTTGGGTCTTTGATAAAGAAAAGAATCCCTGTTCATTGTAAGCACTTTTACGGGGCGGGTGGGGAGGGGTGCTCTGCTGGTCTTCAATTACCAAGAATTCTCCAAAACAATTTTCTGCAGGATGATTGTACAGAATCATTGCTTATGACATGATCGCTTTCTACACTGTATTACATAAATAAATTAAATAAAATAACCCCGGGCAAGACTTTTCTTTGAAGGATGACTACAGACATTAAATAATCGAAGTAATTTTGGGTGGGGAGAAGAGGCAGATTCAATTTTCTTTAACCAGTCTGAAGTTTCATTTATGATACAAAAGAAGATGAAAATGGAAGTGGCAATATAAGGGGATGAGGAAGGCATGCCTGGACAAACCCTTCTTTTAAGATGTGTCTTCAATTTGTATAAAATGGTGTTTTCATGTAAATAAATACATTCTTGGAGGAGCA

SEQ ID NO:506APP的外显子1的翻译多肽序列

MLPGLALLLLAAWTARALE

SEQ ID NO:507APP的外显子2的翻译多肽序列

VYPELQITNVVEANQPVTIQNWCKRGRKQCKTHPHFVIPYRCL

SEQ ID NO:508APP的外显子3的翻译多肽序列

GEFVSDALLVPDKCKFLHQERMDVCETHLHWHTVAKE

SEQ ID NO:509APP的外显子4的翻译多肽序列

TCSEKSTNLHDYGMLLPCGIDKFRGVEFVCCPLAEESDNVDSADAEEDDSDVWWGGADTDYADG

SEQ ID NO:510APP的外显子5的翻译多肽序列

EDKVVEVAEEEEVAEVEEEEADDDEDDEDGDEVEEEAEEPYEEATERTTSIATTTTTTTESVEEVVR

SEQ ID NO:511APP的外显子6的翻译多肽序列

VCSEQAETGPCRAMISRWYFDVTEGKCAPFFYGGCGGNRNNFDTEEYCMAVCGSA

SEQ ID NO:512APP的外显子7的翻译多肽序列

SQSLLKTTQEPLARDPVK

SEQ ID NO:513APP的外显子8的翻译多肽序列

PTTAASTPDAVDKYLETPGDENEHAHFQKAKERLEAKHRERMSQ

SEQ ID NO:514APP的外显子9的翻译多肽序列

VMREWEEAERQAKNLPKADKKAVIQ

SEQ ID NO:515APP的外显子10的翻译多肽序列

HFQEKVESLEQEAANERQQLVETHMARVEAMLNDRRRLALENYITALQAVPPR

SEQ ID NO:516APP的外显子11的翻译多肽序列

PRHVFNMLKKYVRAEQKDRQHTLKHFEHVRMVDPKKAAQIRSQ

SEQ ID NO:517APP的外显子12的翻译多肽序列

VMTHLRVIYERMNQSLSLLYNVPAVAEEIQDEV

SEQ ID NO:518APP的外显子13的翻译多肽序列

ELLQKEQNYSDDVLANMISEPRISYGNDALMPSLTETKTTVELLPVNGEFSLDDLQPWHSFGADSVPANTENE

SEQ ID NO:519APP的外显子14的翻译多肽序列

EPVDARPAADRGLTTRP

SEQ ID NO:520APP的外显子15的翻译多肽序列

SGLTNIKTEEISEVKMDAEFRHDSGYEVHHQKL

SEQ ID NO:521APP的外显子16的翻译多肽序列

VFFAEDVGSNKGAIIGLMVGGVVIATVIVITLVMLKKKQYTSIHHGVVE

SEQ ID NO:522APP的外显子17的翻译多肽序列

VDAAVTPEERHLSKMQQNGYENPTYKFFEQMQN

SEQ ID NO:523APP的全蛋白质序列

MLPGLALLLLAAWTARALEVYPELQITNVVEANQPVTIQNWCKRGRKQCKTHPHFVIPYRCLVGEFVSDALLVPDKCKFLHQERMDVCETHLHWHTVAKETCSEKSTNLHDYGMLLPCGIDKFRGVEFVCCPLAEESDNVDSADAEEDDSDVWWGGADTDYADGSEDKVVEVAEEEEVAEVEEEEADDDEDDEDGDEVEEEAEEPYEEATERTTSIATTTTTTTESVEEVVREVCSEQAETGPCRAMISRWYFDVTEGKCAPFFYGGCGGNRNNFDTEEYCMAVCGSAMSQSLLKTTQEPLARDPVKLPTTAASTPDAVDKYLETPGDENEHAHFQKAKERLEAKHRERMSQVMREWEEAERQAKNLPKADKKAVIQHFQEKVESLEQEAANERQQLVETHMARVEAMLNDRRRLALENYITALQAVPPRPRHVFNMLKKYVRAEQKDRQHTLKHFEHVRMVDPKKAAQIRSQVMTHLRVIYERMNQSLSLLYNVPAVAEEIQDEVDELLQKEQNYSDDVLANMISEPRISYGNDALMPSLTETKTTVELLPVNGEFSLDDLQPWHSFGADSVPANTENEVEPVDARPAADRGLTTRPGSGLTNIKTEEISEVKMDAEFRHDSGYEVHHQKLVFFAEDVGSNKGAIIGLMVGGVVIATVIVITLVMLKKKQYTSIHHGVVEVDAAVTPEERHLSKMQQNGYENPTYKFFEQMQN

SEQ ID NO:524APP的全部外显子1-14按顺序排列的多核苷酸序列

SEQ ID NO:525APP的全部外显子1-14按顺序排列的翻译多肽序列

WRN序列信息

SEQ ID NO:526来自WRN-NRG1融合物5’处的WRN外显子33的序列

AAGCTGGCTGCCCCCTTGATTTGGAGCGAGCAGGCCTGACTCCAGAGGTTCAGAAGATTATTGCTGATGTTATCCGAAACCCTCCCGTCAACTCAG

SEQ ID NO:527WRN-NRG1融合物3’处的NRG1外显子6序列

SEQ ID NO:528WRN-NRG1多核苷酸序列

AAGCTGGCTGCCCCCTTGATTTGGAGCGAGCAGGCCTGACTCCAGAGGTTCAGAAGATTATTGCTGATGTTATCCGAAACCCTCCCGTCAACTCAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGC

SEQ ID NO:529WRN-NRG1多肽序列

AGCPLDLERAGLTPEVQKIIADVIRNPPVNSATSTSTTGTSHLVKCAEKEKTFCVNGGEC

SEQ ID NO:530WRN的外显子1

GTGTACTGTGTGCGCCGGGGAGGCGCCGGCTTGTACTCGGCAGCGCGGGAATAAAGTTTGCTGATTTGGTGTCTAGCCTGGATGCCTGGGTTGCAGGCCCTGCTTGTGGTGGCGCTCCACAGTCATCCGGCTGAAGAAGACCTGTTGGACTGGATCTTCTCGGG

SEQ ID NO:531WRN的外显子2

TTTTCTTTCAGATATTGTTTTGTATTTACCCATGAAGACATTGTTTTTTGGACTCTGCAAATAGGACATTTCAAAGATGAGTGAAAAAAAATTGGAAACAACTGCACAGCAGCGGAAATGTCCTGAATGGATGAATGTGCAGAATAAAAGATGTGCTGTAGAAGAAAGAAAG

SEQ ID NO:532WRN的外显子3

GCATGTGTTCGGAAGAGTGTTTTTGAAGATGACCTCCCCTTCTTAGAATTCACTGGATCCATTGTGTATAGTTACGATGCTAGTGATTGCTCTTTCCTGTCAGAAGATATTAG

SEQ ID NO:533WRN的外显子4

CATGAGTCTATCAGATGGGGATGTGGTGGGATTTGACATGGAGTGGCCACCATTATACAATAGAGGGAAACTTGGCAAAGTTGCACTAATTCAGTTGTGTGTTTCTGAGAGCAAATGTTACTTGTTCCACGTTTCTTCCATGTCAG

SEQ ID NO:534WRN的外显子5

TTTTTCCCCAGGGATTAAAAATGTTGCTTGAAAATAAAGCAGTTAAAAAGGCAGGTGTAGGAATTGAAGGAGATCAGTGGAAACTTCTACGTGACTTTGATATCAAATTGAAGAATTTTGTGGAGTTGACAGATGTTGCCAATAAAAAG

SEQ ID NO:535WRN的外显子6

CTGAAATGCACAGAGACCTGGAGCCTTAACAGTCTGGTTAAACACCTCTTAGGTAAACAGCTCCTGAAAGACAAGTCTATCCGCTGTAGCAATTGGAGTAAATTTCCTCTCACTGAGGACCAGAAACTGTATGCAGCCACTGATGCTTAT

SEQ ID NO:536WRN的外显子7

GCTGGTTTTATTATTTACCGAAATTTAGAGATTTTGGATGATACTGTGCAAAGGTTTGCTATAAATAAAG

SEQ ID NO:537WRN的外显子8

AGGAAGAAATCCTACTTAGCGACATGAACAAACAGTTGACTTCAATCTCTGAGGAAGTGATGGATCTGGCTAAGCATCTTCCTCATGCTTTCAGTAAATTGGAAAACCCACGGAG

SEQ ID NO:538WRN的外显子9

GGTTTCTATCTTACTAAAGGATATTTCAGAAAATCTATATTCACTGAGGAGGATGATAATTGGGTCTACTAACATTGAGACTGAACTGAGGCCCAGCAATAATTTAAACTTATTATCCTTTGAAGATTCAACTACTGGGGGAGTACAACAGAAACAAATTAGAGAACATGAAGTTTTAATTCACGTTGAAGATGAAACATGGGACCCAACACTTGATCATTTAGCTAAACATGATGGAGAAGATGTACTTGGAAATAAAGTGGAACGAAAAGAAGATGGATTTGAAGATGGAGTAGAAGACAACAAATTGAAAGAGAATATGGAAAGAGCTTGTTTGATGTCGTTAGATATTACAGAACATGAACTCCAAATTTTGGAACAGCAGTCTCAGGAAGAATATCTTAGTGATATTGCTTATAAATCTACTGAG

SEQ ID NO:539WRN的外显子10

CATTTATCTCCCAATGATAATGAAAACGATACGTCCTATGTAATTGAGAGTGATGAAGATTTAGAAATGGAGATGCTTAAG

SEQ ID NO:540WRN的外显子11

SEQ ID NO:541WRN的外显子12

TCTTTAGAAAACCTCAATAGTGGCACGGTAGAACCAACTCATTCTAAATGCTTAAAAATGGAAAGAAATCTGGGTCTTCCTACTAAAGAAGAAGAAGAAGATGATGAAAATGAAGCTAATGAAGGGGAAGAAGATGATGATAAGG

SEQ ID NO:542WRN的外显子13

ACTTTTTGTGGCCAGCACCCAATGAAGAGCAAGTTACTTGCCTCAAGATGTACTTTGGCCATTCCAGTTTTAAACC

SEQ ID NO:543WRN的外显子14

AGTTCAGTGGAAAGTGATTCATTCAGTATTAGAAGAAAGAAGAGATAATGTTGCTGTCATGGCAACTG

SEQ ID NO:544WRN的外显子15

GATATGGAAAGAGTTTGTGCTTCCAGTATCCACCTGTTTATGTAGGCAAGATTGGCCTTGTTATCTCTCCCCTTATTTCTCTGATGGAAGACCAAGTGCTACAGCTTAA

SEQ ID NO:545WRN的外显子16

AATGTCCAACATCCCAGCTTGCTTCCTTGGATCAGCACAGTCAGAAAATGTTCTAACAGATATTAAATT

SEQ ID NO:546WRN的外显子17

AGGTAAATACCGGATTGTATACGTAACTCCAGAATACTGTTCAGGTAACATGGGCCTGCTCCAGCAACTTGAGGCTGATATTG

SEQ ID NO:547WRN的外显子18

GTATCACGCTCATTGCTGTGGATGAGGCTCACTGTATTTCTGAGTGGGGGCATGATTTTAGGGATTCATTCAGGAAGTTGGGCTCCCTAAAGACAGCACTGCCAATG

SEQ ID NO:548WRN的外显子19

GTTCCAATCGTTGCACTTACTGCTACTGCAAGTTCTTCAATCCGGGAAGACATTGTACGTTGCTTAAATCTGAGAAATCCTCAGATCACCTGTACTGGTTTTGATCGACCAAACCTGTATTTAGAAGTTAGGCGAAAAACAGGGAATATCCTTCAGGATCTGCAGCCATTTCTTGTCAAAACAAG

SEQ ID NO:549WRN的外显子20

TTCCCACTGGGAATTTGAAGGTCCAACAATCATCTACTGTCCTTCTAGAAAAATGACACAACAAGTTACAGGTGAACTTAGGAAACTGAATCTATCCTGTGGAACATACCATGCGGGCATGAGTTTTAGCACAAGGAAAGACATTCATCATAGGTTTGTAAGAGATGAAATTCAG

SEQ ID NO:550WRN的外显子21

TGTGTCATAGCTACCATAGCTTTTGGAATGGGCATTAATAAAGCTGACATTCGCCAAGTCATTCATTACGGTGCTCCTAAGGACATGGAATCATATTATCAGGAGATTGGTAGAGCTGGTCGTGATGGACTTCAAAGTTCTTGTCACGTCCTCTGGGCTCCTGCAGACATTAACTTAAATAG

SEQ ID NO:551WRN的外显子22

GCACCTTCTTACTGAGATACGTAATGAGAAGTTTCGATTATACAAATTAAAGATGATGGCAAAGATGGAAAAATATCTTCATTCTAGCAGATGTAGGAGACA

SEQ ID NO:552WRN的外显子23

AATCATCTTGTCTCATTTTGAGGACAAACAAGTACAAAAAGCCTCCTTGGGAATTATGGGAACTGAAAAATGCTGTGATAATTGCAGGTCCAG

SEQ ID NO:553WRN的外显子24

ATTGGATCATTGCTATTCCATGGATGACTCAGAGGATACATCCTGGGACTTTGGTCCACAAGCATTTAAGCTTTTGTCTGCTGTGGACATCTTAGGCGAAAAATTTGGAATTGGGCTTCCAATTTTATTTCTCCGAGGATCT

SEQ ID NO:554WRN的外显子25

AATTCTCAGCGTCTTGCCGATCAATATCGCAGGCACAGTTTATTTGGCACTGGCAAGGATCAAACAGAGAGTTGGTGGAAGGCTTTTTCCCGTCAGCTGATCACTGAGGGATTCTTGGTAGAAGTTTCTCGGTATAACAAATTTATGAAGATTTGCGCCCTTACGAAAAAG

SEQ ID NO:555WRN的外显子26

GGTAGAAATTGGCTTCATAAAGCTAATACAGAATCTCAGAGCCTCATCCTTCAAGCTAATGAAGAATTGTGTCCAAAGAAGTTGCTTCTGCCTAG

SEQ ID NO:556WRN的外显子27

TTCGAAAACTGTATCTTCGGGCACCAAAGAGCATTGTTATAATCAAGTACCAGTTGAATTAAGTACAGAGAAGAAG

SEQ ID NO:557WRN的外显子28

TCTAACTTGGAGAAGTTATATTCTTATAAACCATGTGATAAGATTTCTTCTGGGAGTAACATTTCTAAAAAAAG

SEQ ID NO:558WRN的外显子29

TATCATGGTACAGTCACCAGAAAAAGCTTACAGTTCCTCACAGCCTGTTATTTCGGCACAAGAGCAGGAGACTCAG

SEQ ID NO:559WRN的外显子30

ATTGTGTTATATGGCAAATTGGTAGAAGCTAGGCAGAAACATGCCAATAAAATGGATGTTCCCCCAGCTATTCTGGCAACAAACAAGATACTGGTGGATATGGCCAAAATGAG

SEQ ID NO:560WRN的外显子31

ACCAACTACGGTTGAAAACGTAAAAAGGATTGATGGTGTTTCTGAAGGCAAAGCTGCCATGTTGGCCCCTCTGTTGGAAGTCATCAAACATTTCTGCCAAACAAATAGTGTTCAG

SEQ ID NO:561WRN的外显子32

ACAGACCTCTTTTCAAGTACAAAACCTCAAGAAGAACAGAAGACGAGTCTGGTAGCAAAAAATAAAATATGCACACTTTCACAGTCTATGGCCATCACATACTCTTTATTCCAAGAAAAGAAGATGCCTTTG

SEQ ID NO:562WRN的外显子33

AAGAGCATAGCTGAGAGCAGGATTCTGCCTCTCATGACAATTGGCATGCACTTATCCCAAGCGGTGAAAGCTGGCTGCCCCCTTGATTTGGAGCGAGCAGGCCTGACTCCAGAGGTTCAGAAGATTATTGCTGATGTTATCCGAAACCCTCCCGTCAACTCAG

SEQ ID NO:563WRN的外显子34

ATATGAGTAAAATTAGCCTAATCAGAATGTTAGTTCCTGAAAACATTGACACGTACCTTATCCACATGGCAATTGAGATCCTTAAACATGGTCCTGACAGCGGACTTCAACCTTCATGTGATGTCAACAAAAGGAGATGTTTTCCCGGTTCTGAAGAGATCTGTTCAAGTTCTAAGAGAAGCAAGGAAGAAGTAGGCATCAATACTGAG

SEQ ID NO:564WRN的外显子35

ACTTCATCTGCAGAGAGAAAGAGACGATTACCTGTGTGGTTTGCCAAAGGAAGTGATACCAGCAAGAAATTAATGGACAAAACGAAAAGGGGAGGTCTTTTTAGTTAAGCTGGCAATTACCAGAACAATTATGTTTCTTGCTGTATTATAAGAGGATAGCTATATTTTATTTCTGAAGAGTAAGGAGTAGTATTTTGGCTTAAAAATCATTCTAATTACAAAGTTCACTGTTTATTGAAGAACTGGCATCTTAAATCAGCCTTCCGCAATTCATGTAGTTTCTGGGTCTTCTGGGAGCCTACGTGAGTACATCACCTAACAGAATATTAAATTAGACTTCCTGTAAGATTGCTTTAAGAAACTGTTACTGTCCTGTTTTCTAATCTCTTTATTAAAACAGTGTATTTGGAAAATGTTATGTGCTCTGATTTGATATAGATAACAGATTAGTAGTTACATGGTAATTATGTGATATAAAATATTCATATATTATCAAAATTCTGTTTTGTAAATGTAAGAAAGCATAGTTATTTTACAAATTGTTTTTACTGTCTTTTGAAGAAGTTCTTAAATACGTTGTTAAATGGTATTAGTTGACCAGGGCAGTGAAAATGAAACCGCATTTTGGGTGCCATTAAATAGGGAAAAAACATGTAAAAAATGTAAAATGGAGACCAATTGCACTAGGCAAGTGTATATTTTGTATTTTATATACAATTTCTATTATTTTTCAAGTAATAAAACAATGTTTTTCATACTGAATATTATATATATATTTTTTAGCTTTCATTTACTTAATTATTTTAAGTACCTTTATTTTTCCAGGATGTCAGAATTTGATTCTAATCTCTCTTATGTAGCACATGTGACTTAATTTAAAACCTATACTGTGACACAGAGTTGGGTAAACGATGATTATTTAACTTTAAGCAGTTCACCATCCATTTCAAAGCCTTTGATTGGCTTTTTTGTAAATAAAAATAACTTGTTAAGAAACAAATATATCTGTCATAGAAGAACTAGAAAATCCAGGGAAGTGAGAAAAATGAAAATAAAAATCATTCATAGTTTTACTAGTAGCTAATCACAGTCAACCTCTTTTGTGTATCCCACCAGACTTTTTTATATTCATTTGTTTTTAGTTAAAATATAAAAGTCTCGTATATTCCCATTTTTCTGCATTGCATTACCAGAAGGTAGTGGCGCCTATTAAATATGTGATATGTTGTTGTCCAGCCATGGCTTCTGCATTTGCATGCTTTTGTGTGTGCATCTGCAATACCCTGTGAATATCCTGTGTGATGGAGTGGCAAGTACGCACAGACACGTCTGCTGCATGCCTAGGTACGAGGCTGTCTCCAGGAGAAGCACTTGTTTGATTATTTGAGTTGCCAATTGAATTTGCTGCTTTTTTTCATGGCTTGCCATTTTCACTGAAAAGAATGACTAATGAAAAACGATGATTGGTTATTAGATTTGGATGTTTGGCAGACATTTTCTCAAAATTGAACTAAGTTGGCCTCTTCACGGAAAACAACTGGTATTTGTTGTGCCAATGATAAAATTGGAGATTTCTAGCAAAATGTATAATTTTGGAAAAGTTGTGTTCCTCCACTGGAAGCTTGACAGCTTTCCTTAACATAAAGACTTCTCTTTCTCTTCGCTTTCACTACTACTACTACTAATTCTTCTTCTGATTCTTCTTCTTCTCCTTCTTCCTTCTTCCTTCCTTCCTCCTCCTCCTCCTTCTTCTTCCTCTTCCTCTTCTTCTTTCTCTCTTTCCTTCCTTCCCTTCCCTTCCCCTTCCTTCCTTCCTTCCTTCCTTCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCTTTCTTTTTCTTTCTCTTTCTTTCTTTCTTTCTCTCTCTCTCTCTCTTTCTTTCTTTTTCTTTCTCTTTTTCTTTCTTTCAAGCAGTCCTCCCGCCTCAGTCCCCCAAAATAGTGGGATTACAGGTGTGAGCCACCATGCACAGCCTTACATAAAGCCTTTTCTAATGAGATGGATAGTAATTAACAAATGTGAGTTTTTGATATTATATAAAGATTTTTTCTGTGTTTCGAAGATCCGTATAACTCAGTGAATCAGTATGTTCTGGATGACTAATATGTGATGTTAAGAAATCATGACTGAGGCCGGGCGCGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGGCGGGCGGATCACGAGATCAGGAGATCGAGACCACCCTGGCCAACATGGTGAAACCCCGTCTCTACTAAAAATACAAAAATTAGCTGGGTGTGTTGGTGCGTGCCTATAATCCCAGCTACTCGGGAGGCTGAGGCAGGAGAATCGCTTGAACTCAGGAGGCGGAGATTGCAGTGAGCTGAGACTGCGCCACTGCACCCCAGCCTGGCGACAGAGCAAGACTCCGTCTCAAAAATAAAAAAAGAAATCATGACTGGGTAAAAGATCTGTTCAGAGTACAAGATGGACCAATGGATTTGATATATTTGAATATAACAGAGTATGAAAAAGTTTATTGATATAGTTTCAGATTACACACTGCAACTAATCTTTAAGAAACTATTACTTGTCCACTTTTTGGTAAAATTTCAGAGAACAATGTCCACCATTATCTGAACAGGCTATTAAAATACTCTTCTCTTTTCCAACTACGTGCCTGTGCAAAGTCAGATTTTTTTCATATACTTCAGCCAAAACAGCATATCAAAATGGATTGAATGCAGAAGTAGATCTGAGAATACAGCCACTTTTGTTAAGCCAGACAATGAGATTTGCAAAATGTAAACAATGCTGCTGTTCTCAGTTTTTAAAAATATGTTTTTTAAAAGTATTTATGTTAATGTGTACTTGGTTTACTACTGCTATTTTTAAATAAAACAAGAAACATTTTTAAATGTCTGTTTTAATTTCTAAAGTGGTAGTGATAGATATAACCCATATTAATAAAAGCTCTTTGGGGTCCTCAGTGATTTTTTTTTAAGAGTATGGAAGGGTTCTCAGACCTAAGAGATTGAGAAATGCTGATGTAATGTTTTATTATAAAGGTGTACCATGAATTATGTACCTTACTTCATATTGTTGGACATTAAAGTTGCTTTCAGTTTTTTTGTTTTAAA

SEQ ID NO:565WRN的全mRNA多核苷酸序列

GTGTACTGTGTGCGCCGGGGAGGCGCCGGCTTGTACTCGGCAGCGCGGGAATAAAGTTTGCTGATTTGGTGTCTAGCCTGGATGCCTGGGTTGCAGGCCCTGCTTGTGGTGGCGCTCCACAGTCATCCGGCTGAAGAAGACCTGTTGGACTGGATCTTCTCGGGTTTTCTTTCAGATATTGTTTTGTATTTACCCATGAAGACATTGTTTTTTGGACTCTGCAAATAGGACATTTCAAAGATGAGTGAAAAAAAATTGGAAACAACTGCACAGCAGCGGAAATGTCCTGAATGGATGAATGTGCAGAATAAAAGATGTGCTGTAGAAGAAAGAAAGGCATGTGTTCGGAAGAGTGTTTTTGAAGATGACCTCCCCTTCTTAGAATTCACTGGATCCATTGTGTATAGTTACGATGCTAGTGATTGCTCTTTCCTGTCAGAAGATATTAGCATGAGTCTATCAGATGGGGATGTGGTGGGATTTGACATGGAGTGGCCACCATTATACAATAGAGGGAAACTTGGCAAAGTTGCACTAATTCAGTTGTGTGTTTCTGAGAGCAAATGTTACTTGTTCCACGTTTCTTCCATG

TCAGTTTTTCCCCAGGGATTAAAAATGTTGCTTGAAAATAAAGCAGTTAAAAAGGCAG

GTGTAGGAATTGAAGGAGATCAGTGGAAACTTCTACGTGACTTTGATATCAAATTGAAG

AATTTTGTGGAGTTGACAGATGTTGCCAATAAAAAGCTGAAATGCACAGAGACCTGGA

GCCTTAACAGTCTGGTTAAACACCTCTTAGGTAAACAGCTCCTGAAAGACAAGTCTATC

CGCTGTAGCAATTGGAGTAAATTTCCTCTCACTGAGGACCAGAAACTGTATGCAGCCAC

TGATGCTTATGCTGGTTTTATTATTTACCGAAATTTAGAGATTTTGGATGATACTGTGCAA

AGGTTTGCTATAAATAAAGAGGAAGAAATCCTACTTAGCGACATGAACAAACAGTTGA

CTTCAATCTCTGAGGAAGTGATGGATCTGGCTAAGCATCTTCCTCATGCTTTCAGTAAAT

TGGAAAACCCACGGAGGGTTTCTATCTTACTAAAGGATATTTCAGAAAATCTATATTCAC

TGAGGAGGATGATAATTGGGTCTACTAACATTGAGACTGAACTGAGGCCCAGCAATAAT

TTAAACTTATTATCCTTTGAAGATTCAACTACTGGGGGAGTACAACAGAAACAAATTAG

AGAACATGAAGTTTTAATTCACGTTGAAGATGAAACATGGGACCCAACACTTGATCATT

TAGCTAAACATGATGGAGAAGATGTACTTGGAAATAAAGTGGAACGAAAAGAAGATGG

ATTTGAAGATGGAGTAGAAGACAACAAATTGAAAGAGAATATGGAAAGAGCTTGTTTG

ATGTCGTTAGATATTACAGAACATGAACTCCAAATTTTGGAACAGCAGTCTCAGGAAGA

ATATCTTAGTGATATTGCTTATAAATCTACTGAGCATTTATCTCCCAATGATAATGAAAAC

GATACGTCCTATGTAATTGAGAGTGATGAAGATTTAGAAATGGAGATGCTTAAGCATTTA

TCTCCCAATGATAATGAAAACGATACGTCCTATGTAATTGAGAGTGATGAAGATTTAGAA

ATGGAGATGCTTAAGTCTTTAGAAAACCTCAATAGTGGCACGGTAGAACCAACTCATTC

TAAATGCTTAAAAATGGAAAGAAATCTGGGTCTTCCTACTAAAGAAGAAGAAGAAGAT

GATGAAAATGAAGCTAATGAAGGGGAAGAAGATGATGATAAGGACTTTTTGTGGCCAG

CACCCAATGAAGAGCAAGTTACTTGCCTCAAGATGTACTTTGGCCATTCCAGTTTTAAA

CCAGTTCAGTGGAAAGTGATTCATTCAGTATTAGAAGAAAGAAGAGATAATGTTGCTGT

CATGGCAACTGGATATGGAAAGAGTTTGTGCTTCCAGTATCCACCTGTTTATGTAGGCA

AGATTGGCCTTGTTATCTCTCCCCTTATTTCTCTGATGGAAGACCAAGTGCTACAGCTTA

AAATGTCCAACATCCCAGCTTGCTTCCTTGGATCAGCACAGTCAGAAAATGTTCTAACA

GATATTAAATTAGGTAAATACCGGATTGTATACGTAACTCCAGAATACTGTTCAGGTAAC

ATGGGCCTGCTCCAGCAACTTGAGGCTGATATTGGTATCACGCTCATTGCTGTGGATGA

GGCTCACTGTATTTCTGAGTGGGGGCATGATTTTAGGGATTCATTCAGGAAGTTGGGCT

CCCTAAAGACAGCACTGCCAATGGTTCCAATCGTTGCACTTACTGCTACTGCAAGTTCT

TCAATCCGGGAAGACATTGTACGTTGCTTAAATCTGAGAAATCCTCAGATCACCTGTAC

TGGTTTTGATCGACCAAACCTGTATTTAGAAGTTAGGCGAAAAACAGGGAATATCCTTC

AGGATCTGCAGCCATTTCTTGTCAAAACAAGTTCCCACTGGGAATTTGAAGGTCCAAC

AATCATCTACTGTCCTTCTAGAAAAATGACACAACAAGTTACAGGTGAACTTAGGAAAC

TGAATCTATCCTGTGGAACATACCATGCGGGCATGAGTTTTAGCACAAGGAAAGACATT

CATCATAGGTTTGTAAGAGATGAAATTCAGTGTGTCATAGCTACCATAGCTTTTGGAATG

GGCATTAATAAAGCTGACATTCGCCAAGTCATTCATTACGGTGCTCCTAAGGACATGGA

ATCATATTATCAGGAGATTGGTAGAGCTGGTCGTGATGGACTTCAAAGTTCTTGTCACGT

CCTCTGGGCTCCTGCAGACATTAACTTAAATAGGCACCTTCTTACTGAGATACGTAATGA

GAAGTTTCGATTATACAAATTAAAGATGATGGCAAAGATGGAAAAATATCTTCATTCTAG

CAGATGTAGGAGACAAATCATCTTGTCTCATTTTGAGGACAAACAAGTACAAAAAGCC

TCCTTGGGAATTATGGGAACTGAAAAATGCTGTGATAATTGCAGGTCCAGATTGGATCA

TTGCTATTCCATGGATGACTCAGAGGATACATCCTGGGACTTTGGTCCACAAGCATTTAA

GCTTTTGTCTGCTGTGGACATCTTAGGCGAAAAATTTGGAATTGGGCTTCCAATTTTATT

TCTCCGAGGATCTAATTCTCAGCGTCTTGCCGATCAATATCGCAGGCACAGTTTATTTGG

CACTGGCAAGGATCAAACAGAGAGTTGGTGGAAGGCTTTTTCCCGTCAGCTGATCACT

GAGGGATTCTTGGTAGAAGTTTCTCGGTATAACAAATTTATGAAGATTTGCGCCCTTACG

AAAAAGGGTAGAAATTGGCTTCATAAAGCTAATACAGAATCTCAGAGCCTCATCCTTCA

AGCTAATGAAGAATTGTGTCCAAAGAAGTTGCTTCTGCCTAGTTCGAAAACTGTATCTT

CGGGCACCAAAGAGCATTGTTATAATCAAGTACCAGTTGAATTAAGTACAGAGAAGAA

GTCTAACTTGGAGAAGTTATATTCTTATAAACCATGTGATAAGATTTCTTCTGGGAGTAA

CATTTCTAAAAAAAGTATCATGGTACAGTCACCAGAAAAAGCTTACAGTTCCTCACAGC

CTGTTATTTCGGCACAAGAGCAGGAGACTCAGATTGTGTTATATGGCAAATTGGTAGAA

GCTAGGCAGAAACATGCCAATAAAATGGATGTTCCCCCAGCTATTCTGGCAACAAACAA

GATACTGGTGGATATGGCCAAAATGAGACCAACTACGGTTGAAAACGTAAAAAGGATT

GATGGTGTTTCTGAAGGCAAAGCTGCCATGTTGGCCCCTCTGTTGGAAGTCATCAAACA

TTTCTGCCAAACAAATAGTGTTCAGACAGACCTCTTTTCAAGTACAAAACCTCAAGAA

GAACAGAAGACGAGTCTGGTAGCAAAAAATAAAATATGCACACTTTCACAGTCTATGG

CCATCACATACTCTTTATTCCAAGAAAAGAAGATGCCTTTGAAGAGCATAGCTGAGAGC

AGGATTCTGCCTCTCATGACAATTGGCATGCACTTATCCCAAGCGGTGAAAGCTGGCTG

CCCCCTTGATTTGGAGCGAGCAGGCCTGACTCCAGAGGTTCAGAAGATTATTGCTGATG

TTATCCGAAACCCTCCCGTCAACTCAGATATGAGTAAAATTAGCCTAATCAGAATGTTAG

TTCCTGAAAACATTGACACGTACCTTATCCACATGGCAATTGAGATCCTTAAACATGGTC

CTGACAGCGGACTTCAACCTTCATGTGATGTCAACAAAAGGAGATGTTTTCCCGGTTCT

GAAGAGATCTGTTCAAGTTCTAAGAGAAGCAAGGAAGAAGTAGGCATCAATACTGAGA

CTTCATCTGCAGAGAGAAAGAGACGATTACCTGTGTGGTTTGCCAAAGGAAGTGATAC

CAGCAAGAAATTAATGGACAAAACGAAAAGGGGAGGTCTTTTTAGTTAAGCTGGCAAT

TACCAGAACAATTATGTTTCTTGCTGTATTATAAGAGGATAGCTATATTTTATTTCTGAAG

AGTAAGGAGTAGTATTTTGGCTTAAAAATCATTCTAATTACAAAGTTCACTGTTTATTGA

AGAACTGGCATCTTAAATCAGCCTTCCGCAATTCATGTAGTTTCTGGGTCTTCTGGGAG

CCTACGTGAGTACATCACCTAACAGAATATTAAATTAGACTTCCTGTAAGATTGCTTTAA

GAAACTGTTACTGTCCTGTTTTCTAATCTCTTTATTAAAACAGTGTATTTGGAAAATGTT

ATGTGCTCTGATTTGATATAGATAACAGATTAGTAGTTACATGGTAATTATGTGATATAAA

ATATTCATATATTATCAAAATTCTGTTTTGTAAATGTAAGAAAGCATAGTTATTTTACAAAT

TGTTTTTACTGTCTTTTGAAGAAGTTCTTAAATACGTTGTTAAATGGTATTAGTTGACCA

GGGCAGTGAAAATGAAACCGCATTTTGGGTGCCATTAAATAGGGAAAAAACATGTAAA

AAATGTAAAATGGAGACCAATTGCACTAGGCAAGTGTATATTTTGTATTTTATATACAATT

TCTATTATTTTTCAAGTAATAAAACAATGTTTTTCATACTGAATATTATATATATATTTTTTA

GCTTTCATTTACTTAATTATTTTAAGTACCTTTATTTTTCCAGGATGTCAGAATTTGATTCT

AATCTCTCTTATGTAGCACATGTGACTTAATTTAAAACCTATACTGTGACACAGAGTTGG

GTAAACGATGATTATTTAACTTTAAGCAGTTCACCATCCATTTCAAAGCCTTTGATTGGC

TTTTTTGTAAATAAAAATAACTTGTTAAGAAACAAATATATCTGTCATAGAAGAACTAGA

AAATCCAGGGAAGTGAGAAAAATGAAAATAAAAATCATTCATAGTTTTACTAGTAGCTA

ATCACAGTCAACCTCTTTTGTGTATCCCACCAGACTTTTTTATATTCATTTGTTTTTAGTT

AAAATATAAAAGTCTCGTATATTCCCATTTTTCTGCATTGCATTACCAGAAGGTAGTGGC

GCCTATTAAATATGTGATATGTTGTTGTCCAGCCATGGCTTCTGCATTTGCATGCTTTTGT

GTGTGCATCTGCAATACCCTGTGAATATCCTGTGTGATGGAGTGGCAAGTACGCACAGA

CACGTCTGCTGCATGCCTAGGTACGAGGCTGTCTCCAGGAGAAGCACTTGTTTGATTAT

TTGAGTTGCCAATTGAATTTGCTGCTTTTTTTCATGGCTTGCCATTTTCACTGAAAAGAA

TGACTAATGAAAAACGATGATTGGTTATTAGATTTGGATGTTTGGCAGACATTTTCTCAA

AATTGAACTAAGTTGGCCTCTTCACGGAAAACAACTGGTATTTGTTGTGCCAATGATAA

AATTGGAGATTTCTAGCAAAATGTATAATTTTGGAAAAGTTGTGTTCCTCCACTGGAAG

CTTGACAGCTTTCCTTAACATAAAGACTTCTCTTTCTCTTCGCTTTCACTACTACTACTAC

TAATTCTTCTTCTGATTCTTCTTCTTCTCCTTCTTCCTTCTTCCTTCCTTCCTCCTCCTCCT

CCTTCTTCTTCCTCTTCCTCTTCTTCTTTCTCTCTTTCCTTCCTTCCCTTCCCTTCCCCTTC

CTTCCTTCCTTCCTTCCTTCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCTTTCTTTTT

CTTTCTCTTTCTTTCTTTCTTTCTCTCTCTCTCTCTCTTTCTTTCTTTTTCTTTCTCTTTTTC

TTTCTTTCAAGCAGTCCTCCCGCCTCAGTCCCCCAAAATAGTGGGATTACAGGTGTGAG

CCACCATGCACAGCCTTACATAAAGCCTTTTCTAATGAGATGGATAGTAATTAACAAATG

TGAGTTTTTGATATTATATAAAGATTTTTTCTGTGTTTCGAAGATCCGTATAACTCAGTGA

ATCAGTATGTTCTGGATGACTAATATGTGATGTTAAGAAATCATGACTGAGGCCGGGCGC

GGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGGCGGGCGGATCACGAGA

TCAGGAGATCGAGACCACCCTGGCCAACATGGTGAAACCCCGTCTCTACTAAAAATAC

AAAAATTAGCTGGGTGTGTTGGTGCGTGCCTATAATCCCAGCTACTCGGGAGGCTGAGGCAGGAGAATCGCTTGAACTCAGGAGGCGGAGATTGCAGTGAGCTGAGACTGCGCCACTGCACCCCAGCCTGGCGACAGAGCAAGACTCCGTCTCAAAAATAAAAAAAGAAATCATGACTGGGTAAAAGATCTGTTCAGAGTACAAGATGGACCAATGGATTTGATATATTTGAATATAACAGAGTATGAAAAAGTTTATTGATATAGTTTCAGATTACACACTGCAACTAATCTTTAAGAAACTATTACTTGTCCACTTTTTGGTAAAATTTCAGAGAACAATGTCCACCATTATCTGAACAGGCTATTAAAATACTCTTCTCTTTTCCAACTACGTGCCTGTGCAAAGTCAGATTTTTTTCATATACTTCAGCCAAAACAGCATATCAAAATGGATTGAATGCAGAAGTAGATCTGAGAATACAGCCACTTTTGTTAAGCCAGACAATGAGATTTGCAAAATGTAAACAATGCTGCTGTTCTCAGTTTTTAAAAATATGTTTTTTAAAAGTATTTATGTTAATGTGTACTTGGTTTACTACTGCTATTTTTAAATAAAACAAGAAACATTTTTAAATGTCTGTTTTAATTTCTAAAGTGGTAGTGATAGATATAACCCATATTAATAAAAGCTCTTTGGGGTCCTCAGTGATTTTTTTTTAAGAGTATGGAAGGGTTCTCAGACCTAAGAGATTGAGAAATGCTGATGTAATGTTTTATTATAAAGGTGTACCATGAATTATGTACCTTACTTCATATTGTTGGACATTAAAGTTGCTTTCAGTTTTTTTGTTTTAAA

SEQ ID NO:566WRN的外显子2的翻译多肽序列

MSEKKLETTAQQRKCPEWMNVQNKRCAVEERK

SEQ ID NO:567WRN的外显子3的翻译多肽序列

ACVRKSVFEDDLPFLEFTGSIVYSYDASDCSFLSEDI

SEQ ID NO:568WRN的外显子4的翻译多肽序列

MSLSDGDVVGFDMEWPPLYNRGKLGKVALIQLCVSESKCYLFHVSSMS

SEQ ID NO:569WRN的外显子5的翻译多肽序列

FPQGLKMLLENKAVKKAGVGIEGDQWKLLRDFDIKLKNFVELTDVANKK

SEQ ID NO:570WRN的外显子6的翻译多肽序列

LKCTETWSLNSLVKHLLGKQLLKDKSIRCSNWSKFPLTEDQKLYAATDAY

SEQ ID NO:571WRN的外显子7的翻译多肽序列

AGFIIYRNLEILDDTVQRFAINK

SEQ ID NO:572WRN的外显子8的翻译多肽序列

EEILLSDMNKQLTSISEEVMDLAKHLPHAFSKLENPR

SEQ ID NO:573WRN的外显子9的翻译多肽序列

VSILLKDISENLYSLRRMIIGSTNIETELRPSNNLNLLSFEDSTTGGVQQKQIREHEVLIHVEDETWDPTLDHLAKHDGEDVLGNKVERKEDGFEDGVEDNKLKENMERACLMSLDITEHELQILEQQSQEEYLSDIAYKSTE

SEQ ID NO:574WRN的外显子10的翻译多肽序列

HLSPNDNENDTSYVIESDEDLEMEMLK

SEQ ID NO:575WRN的外显子11的翻译多肽序列

HLSPNDNENDTSYVIESDEDLEMEMLK

SEQ ID NO:576WRN的外显子12的翻译多肽序列

SLENLNSGTVEPTHSKCLKMERNLGLPTKEEEEDDENEANEGEEDDDK

SEQ ID NO:577WRN的外显子13的翻译多肽序列

FLWPAPNEEQVTCLKMYFGHSSFK

SEQ ID NO:578WRN的外显子14的翻译多肽序列

VQWKVIHSVLEERRDNVAVMAT

SEQ ID NO:579WRN的外显子15的翻译多肽序列

YGKSLCFQYPPVYVGKIGLVISPLISLMEDQVLQL

SEQ ID NO:580WRN的外显子16的翻译多肽序列

MSNIPACFLGSAQSENVLTDIK

SEQ ID NO:581WRN的外显子17的翻译多肽序列

GKYRIVYVTPEYCSGNMGLLQQLEADI

SEQ ID NO:582WRN的外显子18的翻译多肽序列

ITLIAVDEAHCISEWGHDFRDSFRKLGSLKTALPM

SEQ ID NO:583WRN的外显子19的翻译多肽序列

VPIVALTATASSSIREDIVRCLNLRNPQITCTGFDRPNLYLEVRRKTGNILQDLQPFLVKT

SEQ ID NO:584WRN的外显子20的翻译多肽序列

SHWEFEGPTIIYCPSRKMTQQVTGELRKLNLSCGTYHAGMSFSTRKDIHHRFVRDEIQ

SEQ ID NO:585WRN的外显子21的翻译多肽序列

CVIATIAFGMGINKADIRQVIHYGAPKDMESYYQEIGRAGRDGLQSSCHVLWAPADINLN

SEQ ID NO:586WRN的外显子22的翻译多肽序列

HLLTEIRNEKFRLYKLKMMAKMEKYLHSSRCRR

SEQ ID NO:587WRN的外显子23的翻译多肽序列

IILSHFEDKQVQKASLGIMGTEKCCDNCRS

SEQ ID NO:588WRN的外显子24的翻译多肽序列

LDHCYSMDDSEDTSWDFGPQAFKLLSAVDILGEKFGIGLPILFLRGS

SEQ ID NO:589WRN的外显子25的翻译多肽序列

NSQRLADQYRRHSLFGTGKDQTESWWKAFSRQLITEGFLVEVSRYNKFMKICALTKK

SEQ ID NO:590WRN的外显子26的翻译多肽序列

GRNWLHKANTESQSLILQANEELCPKKLLLP

SEQ ID NO:591WRN的外显子27的翻译多肽序列

SKTVSSGTKEHCYNQVPVELSTEKK

SEQ ID NO:592WRN的外显子28的翻译多肽序列

SNLEKLYSYKPCDKISSGSNISKK

SEQ ID NO:593WRN的外显子29的翻译多肽序列

IMVQSPEKAYSSSQPVISAQEQETQ

SEQ ID NO:594WRN的外显子30的翻译多肽序列

IVLYGKLVEARQKHANKMDVPPAILATNKILVDMAKM

SEQ ID NO:595WRN的外显子31的翻译多肽序列

PTTVENVKRIDGVSEGKAAMLAPLLEVIKHFCQTNSVQ

SEQ ID NO:596WRN的外显子32的翻译多肽序列

TDLFSSTKPQEEQKTSLVAKNKICTLSQSMAITYSLFQEKKMPL

SEQ ID NO:597WRN的外显子33的翻译多肽序列

KSIAESRILPLMTIGMHLSQAVKAGCPLDLERAGLTPEVQKIIADVIRNPPVNS

SEQ ID NO:598WRN的外显子34的翻译多肽序列

MSKISLIRMLVPENIDTYLIHMAIEILKHGPDSGLQPSCDVNKRRCFPGSEEICSSSKRSKEEVGINTE

SEQ ID NO:599WRN的外显子35的翻译多肽序列

TSSAERKRRLPVWFAKGSDTSKKLMDKTKRGGLFS

SEQ ID NO:600WRN的全蛋白质序列

MSEKKLETTAQQRKCPEWMNVQNKRCAVEERKACVRKSVFEDDLPFLEFTGSIVYSYDASDCSFLSEDISMSLSDGDVVGFDMEWPPLYNRGKLGKVALIQLCVSESKCYLFHVSSMSVFPQGLKMLLENKAVKKAGVGIEGDQWKLLRDFDIKLKNFVELTDVANKKLKCTETWSLNSLVKHLLGKQLLKDKSIRCSNWSKFPLTEDQKLYAATDAYAGFIIYRNLEILDDTVQRFAINKEEEILLSDMNKQLTSISEEVMDLAKHLPHAFSKLENPRRVSILLKDISENLYSLRRMIIGSTNIETELRPSNNLNLLSFEDSTTGGVQQKQIREHEVLIHVEDETWDPTLDHLAKHDGEDVLGNKVERKEDGFEDGVEDNKLKENMERACLMSLDITEHELQILEQQSQEEYLSDIAYKSTEHLSPNDNENDTSYVIESDEDLEMEMLKHLSPNDNENDTSYVIESDEDLEMEMLKSLENLNSGTVEPTHSKCLKMERNLGLPTKEEEEDDENEANEGEEDDDKDFLWPAPNEEQVTCLKMYFGHSSFKPVQWKVIHSVLEERRDNVAVMATGYGKSLCFQYPPVYVGKIGLVISPLISLMEDQVLQLKMSNIPACFLGSAQSENVLTDIKLGKYRIVYVTPEYCSGNMGLLQQLEADIGITLIAVDEAHCISEWGHDFRDSFRKLGSLKTALPMVPIVALTATASSSIREDIVRCLNLRNPQITCTGFDRPNLYLEVRRKTGNILQDLQPFLVKTSSHWEFEGPTIIYCPSRKMTQQVTGELRKLNLSCGTYHAGMSFSTRKDIHHRFVRDEIQCVIATIAFGMGINKADIRQVIHYGAPKDMESYYQEIGRAGRDGLQSSCHVLWAPADINLNRHLLTEIRNEKFRLYKLKMMAKMEKYLHSSRCRRQIILSHFEDKQVQKASLGIMGTEKCCDNCRSRLDHCYSMDDSEDTSWDFGPQAFKLLSAVDILGEKFGIGLPILFLRGSNSQRLADQYRRHSLFGTGKDQTESWWKAFSRQLITEGFLVEVSRYNKFMKICALTKKGRNWLHKANTESQSLILQANEELCPKKLLLPSSKTVSSGTKEHCYNQVPVELSTEKKSNLEKLYSYKPCDKISSGSNISKKSIMVQSPEKAYSSSQPVISAQEQETQIVLYGKLVEARQKHANKMDVPPAILATNKILVDMAKMRPTTVENVKRIDGVSEGKAAMLAPLLEVIKHFCQTNSVQTDLFSSTKPQEEQKTSLVAKNKICTLSQSMAITYSLFQEKKMPLKSIAESRILPLMTIGMHLSQAVKAGCPLDLERAGLTPEVQKIIADVIRNPPVNSDMSKISLIRMLVPENIDTYLIHMAIEILKHGPDSGLQPSCDVNKRRCFPGSEEICSSSKRSKEEVGINTETSSAERKRRLPVWFAKGSDTSKKLMDKTKRGGLFS

SEQ ID NO:601WRN的全部外显子1-33按顺序排列的多核苷酸序列

SEQ ID NO:602WRN的全部外显子1-33按顺序排列的翻译多肽序列

DAAM1序列信息

SEQ ID NO:603来自DAAM1-NRG1融合物5’处的DAAM1的5'UTR/外显子1的序列

GAAGGAAACTGTTTAACCGGATCCCATTGTACCCAGAGTGCAGAGCCGCCTTTCCAGCATGCAGGGGCTGCTCAG

SEQ ID NO:604DAAM1-NRG1融合物3’处的NRG1的5’UTR/外显子1序列

GACAGAGAGGGAGGAGGCGCGCGGGGACGGGGACGCCCAGGAGGACCCACTCGCGGGTCCCGCTCCGCTCCGGCA

SEQ ID NO:605DAAM1-NRG1多核苷酸序列

GAAGGAAACTGTTTAACCGGATCCCATTGTACCCAGAGTGCAGAGCCGCCTTTCCAGCATGCAGGGGCTGCTCAGGACAGAGAGGGAGGAGGCGCGCGGGGACGGGGACGCCCAGGAGGACCCACTCGCGGGTCCCGCTCCGCTCCGGCA

SEQ ID NO:606DAAM1的外显子1

GCGAGTTAGTAACCTACGAGCGGCTGTGAAGGAAACTGTTTAACCGGATCCCATTGTACCCAGAGTGCAGAGCCGCCTTTCCAGCATGCAGGGGCTGCTCAG

SEQ ID NO:607DAAM1的外显子2

CGTTTAGTCACATCAAGAAATAGAACAGAATTCAGCCATGGCCCCAAGAAAGAGAGGTGGACGAGGTATTTCATTCATCTTTTGCTGTTTCCGAAATAATGATCACCCAGAAATCACGTATCGGCTGCGAAATGATAGCAACTTTGCGCTTCAGACCATGGAACCAGCATTGCCCATGCCCCCTGTGGAGGAGCTGGATGTCATGTTCAGTGAACTGGTG

SEQ ID NO:608DAAM1的外显子3

GATGAACTGGACCTCACAGACAAACACAGAGAAGCCATGTTTGCACTTCCAGCTGAGAAAAAATGGCAAATATACTGTAGCAAGAAAAAG

SEQ ID NO:609DAAM1的外显子4

GACCAGGAAGAAAACAAGGGAGCTACAAGTTGGCCTGAATTCTACATTGATCAGCTCAATTCCATGGCTGCT

SEQ ID NO:610DAAM1的外显子5

AGAAAATCTCTGCTGGCTTTAGAGAAGGAAGAAGAAGAAGAAAGAAGTAAAACTATAGAGAGTTTAAAGACAGCACTGAGGACAAAACCAATGAG

SEQ ID NO:611DAAM1的外显子6

GTTTGTAACCAGATTCATCGACTTGGATGGCCTATCATGTATCCTCAACTTTCTAAAGACCATGGACTACGAGACCTCAGAGTCTCGAATACATACTTCTCTCATTGGCTGTATAAAGGCGTTAATGAACAACTCTCAAGGCCGGGCTCACGTCCTGGCTCATTCTGAGAGTATTAATGTAATTGCTCAGAGTCTGAGCACAGAGAACATTAAAACGAAGGTGGCCGTGCTGGAAATCTTGGGCGCCGTGTGCCTGGTTCCCGGGGGCCACAAGAAGGTTCTGCAGGCCATGCTGCACTACCAGAAGTATGCCAGCGAAAGGACCCGCTTTCAG

SEQ ID NO:612DAAM1的外显子7

ACATTAATTAACGACTTGGATAAAAGCACTGGGCGGTATCGAGATGAAGTGAGTCTCAAGACTGCCATCATGTCCTTCATTAATGCAGTGCTCAGCCAAGGTGCAGGAGTG

SEQ ID NO:613DAAM1的外显子8

GAGAGTTTGGACTTTAGACTTCATCTTCGCTATGAATTTCTGATGTTAGGAATTCAACCTGTAATAGATAAATTAAGGGAACACGAAAATTCAACATTAGATAG

SEQ ID NO:614DAAM1的外显子9

GCATTTAGACTTTTTTGAAATGCTCCGAAATGAAGATGAACTAGAATTTGCCAAAAGATTTGAACTG

SEQ ID NO:615DAAM1的外显子10

GTTCACATAGACACAAAAAGTGCAACTCAGATGTTTGAGCTGACCAGGAAGAGGCTGACACATAGTGAAGCTTACCCGCATTTCATGTCCATCCTGCACCACTGCCTCCAAATGCCTTSEQ ID NO:616DAAM1的外显子11

ACAAGAGGAGTGGCAACACTGTTCAGTACTGGCTACTACTAGATAGAATTATACAGCAGATAGTTATCCAGAATGACAAAGGACAGGACCCTGACTCCACACCTTTGGAAAACTTTAATATTAAGAATGTCGTACGAAT

SEQ ID NO:617DAAM1的外显子12

GTTGGTTAATGAAAATGAAGTTAAGCAGTGGAAAGAACAAGCGGAAAAAATGAGAAAAG

SEQ ID NO:618DAAM1的外显子13

AGCACAATGAGCTACAACAGAAACTGGAAAAGAAAGAACGAGAATGTGATGCTAAGACTCAAGAGAAGGAAGAGATGATGCAGACCTTAAATAAAATGAAAGAGAAACTTGAAAAGGAGACTACTGAGCATAAGCAAGTCAAGCAGCAGGTGGCGGACCTCACAGCACAGCTCCATGAGCTCAGCAGG

SEQ ID NO:619DAAM1的外显子14

AGGGCCGTCTGTGCTTCAATCCCAGGTGGACCCTCGCCTGGAGCACCAGGAGGGCCCTTTCCTTCCTCTGTGCCTGGATCTCTCCTTCCTCCCCCACCACCCCCACCTCTACCAGGTGGGATGCTTCCCCCTCCACCGCCTCCCCTCCCTCCAGGTGGCCCTCCTCCTCCCCCAGGGCCTCCTCCCTTAGGGGCAATCATGCCACCTCCTGGTGCTCCAATGGGCCTAGCACTGAAGAAGAAAAGCATTCCTCAGCCCACAAATGCCCTGAAATCCTTCAACTGGTCTAAACTGCCCGAG

SEQ ID NO:620DAAM1的外显子15

AACAAACTGGAAGGAACAGTATGGACCGAAATTGATGATACAAAAGTCTTCAAAATTCTAGATCTTGAAGACCTGGAAAGAACCTTCTCTGCCTATCAAAGACAGCAG

SEQ ID NO:621DAAM1的外显子16

AAAGAAGCAGATGCCATTGATGACACTCTGAGTTCCAAACTTAAAGTTAAAGAGCTTTCGGTGATTGATGGTCGGAGAGCTCAGAATTGCAACATCCTTCTATCGAG

SEQ ID NO:622DAAM1的外显子17

GTTGAAATTATCCAATGACGAAATCAAACGGGCAATTCTAACAATGGACGAACAGGAAGATCTGCCCAAGGACATGTTGGAACAG

SEQ ID NO:623DAAM1的外显子18

CTCTTGAAATTTGTTCCTGAAAAAAGTGACATTGACCTATTGGAGGAACATAAACACGAACTGGATCGGATGGCCAAGGCTGATAGGTTCCTTTTTGAGATGAGCCG

SEQ ID NO:624DAAM1的外显子19

AATTAATCACTATCAGCAAAGGTTGCAATCGCTGTACTTCAAAAAGAAGTTTGCAGAGCGTGTGGCAGAAGTGAAACCTAAAGTGGAAG

SEQ ID NO:625DAAM1的外显子20

CAATTCGTTCTGGCTCAGAAGAGGTGTTTAGGAGTGGTGCCCTCAAGCAGTTGCTGGAGGTGGTTTTGGCATTTGGAAATTATATGAATAAAGGTCAAAGAGGGAATGCATATGGATTCAAGATATCTAGCCTAAACAAAATTGCTGACACAAAATCCAGCATCGACAA

SEQ ID NO:626DAAM1的外显子21

AAACATTACCCTTTTGCACTATCTCATCACTATTGTGGAAAATAAGTACCCCAGTGTTCTCAATCTAAATGAAGAATTGCGAGATATTCCTCAAGCTGCGAAAGTAAA

SEQ ID NO:627DAAM1的外显子22

CATGACTGAGCTGGACAAAGAAATAAGTACCTTGAGAAGTGGCTTGAAAGCAGTAGAGACA

SEQ ID NO:628DAAM1的外显子23

GAGCTGGAATATCAGAAGTCTCAGCCCCCACAGCCCGGAGATAAGTTTGTGTCTGTTGTCAGCCAGTTCATCACAGTAGCCAGCTTCAGCTTCTCTGATGTTGAAGACCTTCTAGCAGAAGCTAAAGACCTG

SEQ ID NO:629DAAM1的外显子24

TTTACTAAAGCAGTGAAGCACTTTGGGGAAGAGGCTGGCAAAATACAACCAGATGAGTTCTTTGGCATTTTTGATCAATTTCTTCAAGCTGTGTCAGAAGCCAAACAAGAAAACGAAAATATGAGAAAGAAAAAGGAGGAAGAAGAACGTCGAGCTCGCATGGAAGCTCAG

SEQ ID NO:630DAAM1的外显子25

CTCAAAGAACAACGTGAAAGGGAACGTAAAATGAGAAAAGCTAAAGAGAATAGTGAAGAAAGCGGAGAGTTTGATGACCTTGTTTCAGCTTTACGCTCAGGAGAAGTGTTTGACAAAGACCTTTCTAAATTGAAACGGAATCGCAAACGTATTACCAACCAGATGACTGACAGCAGCAGAGAGAGACCAATCACAAAACTTAATTTCTAATTTTCCATGAATACTTTTTTTTAGAAAGCTCATTAGCAGCCCTCTAAAGTGACTAGAACGTTTCATTACACTGCCTTGCAATCCAAACAGTGGCAATTTTTTCCTTCATCTGTGAGTGAATGTGTGAACGTGTGTATGTAAATGTATGTGTGTATATATTAAAAAATGTATATAGATGTCTGAGTGTTGTCTGGAGACCTATACGTATGGTTAAAAAGATTTATGTTAATGTATGTGCTCCAAAACCTTTCGTGTATGCATTCACATTGAGTGTGGCTCATTTTCTTTCCCCGAACGCCATGACTGTTCAGAAGCACAATACTATCTCCTGAAAGAGATAAGAGACATTCCCTAGATTCAAAGGCAAAACAGAAGAAACAAACAAACAAACAAAAAAAGCTTGCAAAATATTTTATGGTTTCCAAGCTTGATATCCTTTAAAATTATTTTCATTGATGGAACTGGAGTTGTTGGAAAAACATAGATTTAAAATGATTTTTGATAGCTGACATTGTGATGTTGATGTATCACATCAGTAATAGGACCAGCTTTGAATTTCTGACATTGGTGTGGGGATACAGTCTGTAAATGTTTATTGAGAACATCTTGCACACAATTTGAATTATGTAGAATGTCAATCAAGTTTTTGTATATTTAAAAGTTGGACATCAATTTTTTCCCCTGATTTCATCAAGTTATCTCTGCCAAGTGCTCTTGATAATTTCTTCAGATTTTTGGAAAAAAACACTATATAAATGCAATCCATGCTTTTTTTAAAGAACAACATTGCCAGAGTATGCTTGTTCTAACAATATAGATATATAAACCTTAAAAATAATAAAATATCTCACCCAAGACTTAAAGGAAGAATTCTCTGAAGGGATAAAGATTACTAAAAAAAAAAAAAAAAAAAAAAAATTAATGGGGTGCCTTTTTGTTATAGTTTCTATTTTCTGTTTTGTAGGACAAGCTGCATTTTCTGTAAATATAGGTCTGGACTAAAGGATACATAAAGAATGCACAAAATGTCAACATCAGCAGAGATGCCCAGATCTATTTATCTCTAAGTATATTTGAAGTGATTGCTGTTTATATGTTGTCATTTTAAAATTGTGTGTCAGTAAAGCTACCTGTAAAATTTCAGTCCAAAAAAATAAAGCTCTCAGGGAGACATGAATAAAATCAATGAACATTAGAAAATAAAATATAGATGCTTACCATTAACCTACCAACTCTTAATATCCTTAAATTATGTGATATATAAAGAGGACTGTTACTTTTTTACTTTTTTTTTTTTTTTTTTTTTTTTTTGGCTTTGCTTTATTTATTTGTAGTTGGGGGCTAACGTTTTCTCTTTTCTTTCTATTGATCCTGTTGTGGTTGGGTTTCCTGTGGAGAGAGTAGTTTGTCCTGTTGCACTAGAACATTATTTACTCACTAAATTGAGTTTTTCAGTCAATTAACAAATATTTATTAAGTTCCTACTATGTACCAGGCATAGTAGGGCTACAATGGTAAGCAAGACAGAGTCCCTGCCCCCAAAGAGCTTATATTCTAATGGGGATATTAAGGGATGAATAGAATACCAATGTGTGCACTGTACAGGAATCATACTATTTAAAAATAATTTGTATAAACTATAATGCTTAGCACAGATGGCGAGTTATCTGTGCTATGTGAAAGCTGTGAAATAGTGCTCTAAGAGTTGTCAAGAGCTGTGGTTTTACATCTTTTCCTCATTGCAAATTTAGTGACTTTCTACACACTATATGGAAATAAATGACTAGCAAATAAAACAGTCATAAATACAAAGCAGAGGTTGCACTCCCCCAATCCCGAGTTAACCCAGGTCTGCAATAACACCATGTTAAAGGTGCAGATAGAGACTTGGCTCAAAAAGGCTTGGAGATGAGGAAGATTGGAATATAATGATGGTTTTGTCTGTTCCTTAACTAAAGTGCCTCTATGTATATTCTTTTCTATTTGTAGCAGGATAAATTTGGTCTGGCTCAGTTTTGGAACTGTATTTTGAAAATGGCTTTGTCTTACAGTTTAAGGAATAGACAGGTGGAGGGAAAGTCACATAAAGGAGCAAGTTTGTGTAGCTGTCCCTCTTGCCCCTTTTAATCATCCTCCTTTGATATGGCCATCCTGGTGGGCCTCCTTTGCCATTTCCATTTTTGGTTTCTTTCCCTGAAAACTGTGTGCAGGTAATTCCATGTGCCATTGTTGAAAAGAAAAAAAAAAAACAAAAAAAAAACCTACTTTTTAGATTGGTGCTGGTGTAAGTAGCCACTTTTCTCTCTTGGGTGTGTATTTTAAACTTTTTTTGTTTTTTTAAATTAATGCCAAAAAGAAAATGCATAATTTGTAAACTTAATTATATGTCTTATATCTTATTAGCTTAGTAGTTGGAACCACTTAGTCTTTAGGTGCAAGACTGTTGTTAGATAGTACTGAGAAAAAAAAAGTATGTGTTATGAGACTGTACATGTTTTTTTAAAAATAGCAATATGCAATAAAGAGATGAATTCATTGGGTGTA

SEQ ID NO:631DAAM1的全mRNA多核苷酸序列

GCGAGTTAGTAACCTACGAGCGGCTGTGAAGGAAACTGTTTAACCGGATCCCATTGTACCCAGAGTGCAGAGCCGCCTTTCCAGCATGCAGGGGCTGCTCAGCGTTTAGTCACATCAAGAAATAGAACAGAATTCAGCCATGGCCCCAAGAAAGAGAGGTGGACGAGGTATTTCATTCATCTTTTGCTGTTTCCGAAATAATGATCACCCAGAAATCACGTATCGGCTGCGAAATGATAGCAACTTTGCGCTTCAGACCATGGAACCAGCATTGCCCATGCCCCCTGTGGAGGAGCTGGATGTCATGTTCAGTGAACTGGTGGATGAACTGGACCTCACAGACAAACACAGAGAAGCCATGTTTGCACTTCCAGCTGAGAAAAAATGGCAAATATACTGTAGCAAGAAAAAGGACCAGGAAGAAAACAAGGGAGCTACAAGTTGGCCTGAATTCTACATTGATCAGCTCAATTCCATGGCTGCTAGAAAATCTCTGCTGGCTTTAGAGAAGGAAGAAGAAGAAGAAAGAAGTAAAACTATAGAGAGTTTAAAGACAGCACTGAGGACAAAACCAATGAGGTTTGTAACCAGATTCATCGACTTGGATGGCCTATCATGTATCCTCAACTTTCTAAAGACCATGGACTACGAGACCTCAGAGTCTCGAATACATACTTCTCTCATTGGCTGTATAAAGGCGTTAATGAACAACTCTCAAGGCCGGGCTCACGTCCTGGCTCATTCTGAGAGTATTAATGTAATTGCTCAGAGTCTGAGCACAGAGAACATTAAAACGAAGGTGGCCGTGCTGGAAATCTTGGGCGCCGTGTGCCTGGTTCCCGGGGGCCACAAGAAGGTTCTGCAGGCCATGCTGCACTACCAGAAGTATGCCAGCGAAAGGACCCGCTTTCAGACATTAATTAACGACTTGGATAAAAGCACTGGGCGGTATCGAGATGAAGTGAGTCTCAAGACTGCCATCATGTCCTTCATTAATGCAGTGCTCAGCCAAGGTGCAGGAGTGGAGAGTTTGGACTTTAGACTTCATCTTCGCTATGAATTTCTGATGTTAGGAATTCAACCTGTAATAGATAAATTAAGGGAACACGAAAATTCAACATTAGATAGGCATTTAGACTTTTTTGAAATGCTCCGAAATGAAGATGAACTAGAATTTGCCAAAAGATTTGAACTGGTTCACATAGACACAAAAAGTGCAACTCAGATGTTTGAGCTGACCAGGAAGAGGCTGACACATAGTGAAGCTTACCCGCATTTCATGTCCATCCTGCACCACTGCCTCCAAATGCCTTACAAGAGGAGTGGCAACACTGTTCAGTACTGGCTACTACTAGATAGAATTATACAGCAGATAGTTATCCAGAATGACAAAGGACAGGACCCTGACTCCACACCTTTGGAAAACTTTAATATTAAGAATGTCGTACGAATGTTGGTTAATGAAAATGAAGTTAAGCAGTGGAAAGAACAAGCGGAAAAAATGAGAAAAGAGCACAATGAGCTACAACAGAAACTGGAAAAGAAAGAACGAGAATGTGATGCTAAGACTCAAGAGAAGGAAGAGATGATGCAGACCTTAAATAAAATGAAAGAGAAACTTGAAAAGGAGACTACTGAGCATAAGCAAGTCAAGCAGCAGGTGGCGGACCTCACAGCACAGCTCCATGAGCTCAGCAGGAGGGCCGTCTGTGCTTCAATCCCAGGTGGACCCTCGCCTGGAGCACCAGGAGGGCCCTTTCCTTCCTCTGTGCCTGGATCTCTCCTTCCTCCCCCACCACCCCCACCTCTACCAGGTGGGATGCTTCCCCCTCCACCGCCTCCCCTCCCTCCAGGTGGCCCTCCTCCTCCCCCAGGGCCTCCTCCCTTAGGGGCAATCATGCCACCTCCTGGTGCTCCAATGGGCCTAGCACTGAAGAAGAAAAGCATTCCTCAGCCCACAAATGCCCTGAAATCCTTCAACTGGTCTAAACTGCCCGAGAACAAACTGGAAGGAACAGTATGGACCGAAATTGATGATACAAAAGTCTTCAAAATTCTAGATCTTGAAGACCTGGAAAGAACCTTCTCTGCCTATCAAAGACAGCAGAAAGAAGCAGATGCCATTGATGACACTCTGAGTTCCAAACTTAAAGTTAAAGAGCTTTCGGTGATTGATGGTCGGAGAGCTCAGAATTGCAACATCCTTCTATCGAGGTTGAAATTATCCAATGACGAAATCAAACGGGCAATTCTAACAATGGACGAACAGGAAGATCTGCCCAAGGACATGTTGGAACAGCTCTTGAAATTTGTTCCTGAAAAAAGTGACATTGACCTATTGGAGGAACATAAACACGAACTGGATCGGATGGCCAAGGCTGATAGGTTCCTTTTTGAGATGAGCCGAATTAATCACTATCAGCAAAGGTTGCAATCGCTGTACTTCAAAAAGAAGTTTGCAGAGCGTGTGGCAGAAGTGAAACCTAAAGTGGAAGCAATTCGTTCTGGCTCAGAAGAGGTGTTTAGGAGTGGTGCCCTCAAGCAGTTGCTGGAGGTGGTTTTGGCATTTGGA

AATTATATGAATAAAGGTCAAAGAGGGAATGCATATGGATTCAAGATATCTAGCCTAAAC

AAAATTGCTGACACAAAATCCAGCATCGACAAAAACATTACCCTTTTGCACTATCTCAT

CACTATTGTGGAAAATAAGTACCCCAGTGTTCTCAATCTAAATGAAGAATTGCGAGATAT

TCCTCAAGCTGCGAAAGTAAACATGACTGAGCTGGACAAAGAAATAAGTACCTTGAGA

AGTGGCTTGAAAGCAGTAGAGACAGAGCTGGAATATCAGAAGTCTCAGCCCCCACAGC

CCGGAGATAAGTTTGTGTCTGTTGTCAGCCAGTTCATCACAGTAGCCAGCTTCAGCTTC

TCTGATGTTGAAGACCTTCTAGCAGAAGCTAAAGACCTGTTTACTAAAGCAGTGAAGC

ACTTTGGGGAAGAGGCTGGCAAAATACAACCAGATGAGTTCTTTGGCATTTTTGATCAA

TTTCTTCAAGCTGTGTCAGAAGCCAAACAAGAAAACGAAAATATGAGAAAGAAAAAG

GAGGAAGAAGAACGTCGAGCTCGCATGGAAGCTCAGCTCAAAGAACAACGTGAAAGG

GAACGTAAAATGAGAAAAGCTAAAGAGAATAGTGAAGAAAGCGGAGAGTTTGATGAC

CTTGTTTCAGCTTTACGCTCAGGAGAAGTGTTTGACAAAGACCTTTCTAAATTGAAACG

GAATCGCAAACGTATTACCAACCAGATGACTGACAGCAGCAGAGAGAGACCAATCACA

AAACTTAATTTCTAATTTTCCATGAATACTTTTTTTTAGAAAGCTCATTAGCAGCCCTCTA

AAGTGACTAGAACGTTTCATTACACTGCCTTGCAATCCAAACAGTGGCAATTTTTTCCT

TCATCTGTGAGTGAATGTGTGAACGTGTGTATGTAAATGTATGTGTGTATATATTAAAAA

ATGTATATAGATGTCTGAGTGTTGTCTGGAGACCTATACGTATGGTTAAAAAGATTTATGT

TAATGTATGTGCTCCAAAACCTTTCGTGTATGCATTCACATTGAGTGTGGCTCATTTTCTT

TCCCCGAACGCCATGACTGTTCAGAAGCACAATACTATCTCCTGAAAGAGATAAGAGA

CATTCCCTAGATTCAAAGGCAAAACAGAAGAAACAAACAAACAAACAAAAAAAGCTT

GCAAAATATTTTATGGTTTCCAAGCTTGATATCCTTTAAAATTATTTTCATTGATGGAACT

GGAGTTGTTGGAAAAACATAGATTTAAAATGATTTTTGATAGCTGACATTGTGATGTTGA

TGTATCACATCAGTAATAGGACCAGCTTTGAATTTCTGACATTGGTGTGGGGATACAGTC

TGTAAATGTTTATTGAGAACATCTTGCACACAATTTGAATTATGTAGAATGTCAATCAAG

TTTTTGTATATTTAAAAGTTGGACATCAATTTTTTCCCCTGATTTCATCAAGTTATCTCTG

CCAAGTGCTCTTGATAATTTCTTCAGATTTTTGGAAAAAAACACTATATAAATGCAATCC

ATGCTTTTTTTAAAGAACAACATTGCCAGAGTATGCTTGTTCTAACAATATAGATATATAA

ACCTTAAAAATAATAAAATATCTCACCCAAGACTTAAAGGAAGAATTCTCTGAAGGGAT

AAAGATTACTAAAAAAAAAAAAAAAAAAAAAAAATTAATGGGGTGCCTTTTTGTTATA

GTTTCTATTTTCTGTTTTGTAGGACAAGCTGCATTTTCTGTAAATATAGGTCTGGACTAA

AGGATACATAAAGAATGCACAAAATGTCAACATCAGCAGAGATGCCCAGATCTATTTAT

CTCTAAGTATATTTGAAGTGATTGCTGTTTATATGTTGTCATTTTAAAATTGTGTGTCAGT

AAAGCTACCTGTAAAATTTCAGTCCAAAAAAATAAAGCTCTCAGGGAGACATGAATAA

AATCAATGAACATTAGAAAATAAAATATAGATGCTTACCATTAACCTACCAACTCTTAAT

ATCCTTAAATTATGTGATATATAAAGAGGACTGTTACTTTTTTACTTTTTTTTTTTTTTTTT

TTTTTTTTTGGCTTTGCTTTATTTATTTGTAGTTGGGGGCTAACGTTTTCTCTTTTCTTTCT

ATTGATCCTGTTGTGGTTGGGTTTCCTGTGGAGAGAGTAGTTTGTCCTGTTGCACTAGA

ACATTATTTACTCACTAAATTGAGTTTTTCAGTCAATTAACAAATATTTATTAAGTTCCTA

CTATGTACCAGGCATAGTAGGGCTACAATGGTAAGCAAGACAGAGTCCCTGCCCCCAA

AGAGCTTATATTCTAATGGGGATATTAAGGGATGAATAGAATACCAATGTGTGCACTGTA

CAGGAATCATACTATTTAAAAATAATTTGTATAAACTATAATGCTTAGCACAGATGGCGA

GTTATCTGTGCTATGTGAAAGCTGTGAAATAGTGCTCTAAGAGTTGTCAAGAGCTGTGG

TTTTACATCTTTTCCTCATTGCAAATTTAGTGACTTTCTACACACTATATGGAAATAAATG

ACTAGCAAATAAAACAGTCATAAATACAAAGCAGAGGTTGCACTCCCCCAATCCCGAG

TTAACCCAGGTCTGCAATAACACCATGTTAAAGGTGCAGATAGAGACTTGGCTCAAAA

AGGCTTGGAGATGAGGAAGATTGGAATATAATGATGGTTTTGTCTGTTCCTTAACTAAA

GTGCCTCTATGTATATTCTTTTCTATTTGTAGCAGGATAAATTTGGTCTGGCTCAGTTTTG

GAACTGTATTTTGAAAATGGCTTTGTCTTACAGTTTAAGGAATAGACAGGTGGAGGGAA

AGTCACATAAAGGAGCAAGTTTGTGTAGCTGTCCCTCTTGCCCCTTTTAATCATCCTCCT

TTGATATGGCCATCCTGGTGGGCCTCCTTTGCCATTTCCATTTTTGGTTTCTTTCCCTGAA

AACTGTGTGCAGGTAATTCCATGTGCCATTGTTGAAAAGAAAAAAAAAAAACAAAAAA

AAAACCTACTTTTTAGATTGGTGCTGGTGTAAGTAGCCACTTTTCTCTCTTGGGTGTGTATTTTAAACTTTTTTTGTTTTTTTAAATTAATGCCAAAAAGAAAATGCATAATTTGTAAACTTAATTATATGTCTTATATCTTATTAGCTTAGTAGTTGGAACCACTTAGTCTTTAGGTGCAAGACTGTTGTTAGATAGTACTGAGAAAAAAAAAGTATGTGTTATGAGACTGTACATGTTTTTTTAAAAATAGCAATATGCAATAAAGAGATGAATTCATTGGGTGTA

SEQ ID NO:632DAAM1的全蛋白质序列

MAPRKRGGRGISFIFCCFRNNDHPEITYRLRNDSNFALQTMEPALPMPPVEELDVMFSELVDELDLTDKHREAMFALPAEKKWQIYCSKKKDQEENKGATSWPEFYIDQLNSMAARKSLLALEKEEEEERSKTIESLKTALRTKPMRFVTRFIDLDGLSCILNFLKTMDYETSESRIHTSLIGCIKALMNNSQGRAHVLAHSESINVIAQSLSTENIKTKVAVLEILGAVCLVPGGHKKVLQAMLHYQKYASERTRFQTLINDLDKSTGRYRDEVSLKTAIMSFINAVLSQGAGVESLDFRLHLRYEFLMLGIQPVIDKLREHENSTLDRHLDFFEMLRNEDELEFAKRFELVHIDTKSATQMFELTRKRLTHSEAYPHFMSILHHCLQMPYKRSGNTVQYWLLLDRIIQQIVIQNDKGQDPDSTPLENFNIKNVVRMLVNENEVKQWKEQAEKMRKEHNELQQKLEKKERECDAKTQEKEEMMQTLNKMKEKLEKETTEHKQVKQQVADLTAQLHELSRRAVCASIPGGPSPGAPGGPFPSSVPGSLLPPPPPPPLPGGMLPPPPPPLPPGGPPPPPGPPPLGAIMPPPGAPMGLALKKKSIPQPTNALKSFNWSKLPENKLEGTVWTEIDDTKVFKILDLEDLERTFSAYQRQQKEADAIDDTLSSKLKVKELSVIDGRRAQNCNILLSRLKLSNDEIKRAILTMDEQEDLPKDMLEQLLKFVPEKSDIDLLEEHKHELDRMAKADRFLFEMSRINHYQQRLQSLYFKKKFAERVAEVKPKVEAIRSGSEEVFRSGALKQLLEVVLAFGNYMNKGQRGNAYGFKISSLNKIADTKSSIDKNITLLHYLITIVENKYPSVLNLNEELRDIPQAAKVNMTELDKEISTLRSGLKAVETELEYQKSQPPQPGDKFVSVVSQFITVASFSFSDVEDLLAEAKDLFTKAVKHFGEEAGKIQPDEFFGIFDQFLQAVSEAKQENENMRKKKEEEERRARMEAQLKEQRERERKMRKAKENSEESGEFDDLVSALRSGEVFDKDLSKLKRNRKRITNQMTDSSRERPITKLNF

ASPH序列信息

SEQ ID NO:633来自ASPH-NRG1融合物5’处的ASPH外显子22的序列

AAGGTCTCTTCCTGCCTGAGGATGAAAACCTGAGGGAAAAAGGGGACTGGAGCCAGTTCACGCTGTGGCAGCAAG

SEQ ID NO:634ASPH-NRG1融合物3’处的NRG1外显子2序列

CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA

SEQ ID NO:635ASPH-NRG1多核苷酸序列

AAGGTCTCTTCCTGCCTGAGGATGAAAACCTGAGGGAAAAAGGGGACTGGAGCCAGTTCACGCTGTGGCAGCAAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA

SEQ ID NO:636ASPH-NRG1多肽序列

GLFLPEDENLREKGDWSQFTLWQQALPPRLKEMKSQESAAGSKLVLRCE

SEQ ID NO:637ASPH的外显子1

AGTCTCAAGCTCTGGTAGGCAAGTGCATGCAGTGTGCCTAAAACCTGCCAGCAGTACTTTTGAGTTTTTTTTTTTGTTTTGTTTTACTTTAGCATTTATTATTCATGGATTGAAGAAATCAAAATGGCTGAAGATAAAG

SEQ ID NO:638ASPH的外显子2

AGACAAAGCATGGAGGACACAAGAATGGGAGGAAAGGCGGACTCTCAGGAACTTCATTCTTCACGTGGTTTATGGTGATTGCATTGCTGGGCGTCTGGACATCTGTAGCTGTCGTTTGGTTTGATCTTGTTGACTATGAGGAAGTTCTAG

SEQ ID NO:639ASPH的外显子3

GAAAACTAGGAATCTATGATGCTGATGGTGATGGAGATTTTGATGTGGATGATGCCAAAGTTTTATTAG

SEQ ID NO:640ASPH的外显子4

GACTTAAAGAGAGATCTACTTCAGAGCCAGCAGTCCCGCCAGAAGAGGCTGAGCCACACACTGAGCCCGAGGAGCAGGTTCCTGTGGAGGCAG

SEQ ID NO:641ASPH的外显子5AACCCCAGAATATCGAAGATGAAGCAAAAGAACAAATTCAGTCCCTTCTCCATGAAATGGTACACGCAGAACATG

SEQ ID NO:642ASPH的外显子6

TTGAGGGAGAAGACTTGCAACAAGAAGATGGACCCACAGGAGAACCACAACAAGAGGATGATGAGTTTCTTATGGCGACTGATGTAGATGATAGATTTGAGACCCTGGAACCTGAAGTATCTCATGAAG

SEQ ID NO:643ASPH的外显子7

AAACCGAGCATAGTTACCACGTGGAAGAGACAG

SEQ ID NO:644ASPH的外显子8

TTTCACAAGACTGTAATCAGGATATGGAAGAGATGATGTCTGAGCAGGAAAATCCAG

SEQ ID NO:645ASPH的外显子9

ATTCCAGTGAACCAGTAGTAGAAGATGAAAGATTGCACCATGATACAG

SEQ ID NO:646ASPH的外显子10

ATGATGTAACATACCAAGTCTATGAGGAACAAG

SEQ ID NO:647ASPH的外显子11

CAGTATATGAACCTCTAGAAAATGAAGGGATAGAAATCACAG

SEQ ID NO:648ASPH的外显子12

AAGTAACTGCTCCCCCTGAGGATAATCCTGTAGAAGATTCACAGGTAATTGTAGAAG

SEQ ID NO:649ASPH的外显子13

AAGTAAGCATTTTTCCTGTGGAAGAACAGCAGGAAGTACCACCAG

SEQ ID NO:650ASPH的外显子14

AAACAAATAGAAAAACAGATGATCCAGAACAAAAAGCAAAAG

SEQ ID NO:651ASPH的外显子15

TTAAGAAAAAGAAGCCTAAACTTTTAAATAAATTTGATAAGACTATTAAAGCTGAACTTGATGCTGCAGAAAAACTCCGTAAAAGG

SEQ ID NO:652ASPH的外显子16

GGAAAAATTGAGGAAGCAGTGAATGCATTTAAAGAACTAGTACGCAAATACCCTCAGAGTCCACGAGCAAGATATGGGAAGGCGCAG

SEQ ID NO:653ASPH的外显子17

TGTGAGGATGATTTGGCTGAGAAGAGGAGAAGTAATGAGGTGCTACGTGGAGCCATCGAGACCTACCAAGAGGTGGCCAGCCTACCTGATGTCCCTGCAGACCTGCTGAAGCTGAGTTTGAAGCGTCGCTCAGACAGGCAACAATTTCTAG

SEQ ID NO:654ASPH的外显子18

GTCATATGAGAGGTTCCCTGCTTACCCTGCAGAGATTAGTTCAACTATTTCCCAATGATACTTCCTTAAAAAATGACCTTGGCGTGGGATACCTCTTGATAGGAGATAATGACAATGCAAAGAAAGTTTATGAAGAG

SEQ ID NO:655ASPH的外显子19

GTGCTGAGTGTGACACCTAATGATGGCTTTGCTAAAGTCCATTATGGCTTCATCCTGAAGGCACAGAACAAAATTGCTGAGAGCATCCCATATTTAAAG

SEQ ID NO:656ASPH的外显子20

GAAGGAATAGAATCCGGAGATCCTGGCACTGATGATGGGAGATTTTATTTCCACCTGGGGGATGCCATGCAGAGGGTTGGGAACAAAGAG

SEQ ID NO:657ASPH的外显子21

GCATATAAGTGGTATGAGCTTGGGCACAAGAGAGGACACTTTGCATCTGTCTGGCAACGCTCACTCTACAATGTGAATGGACTGAAAGCACAGCCTTGGTGGACCCCAAAAGAAACGGGCTACACAGAGTTAGTAAAG

SEQ ID NO:658ASPH的外显子22

TCTTTAGAAAGAAACTGGAAGTTAATCCGAGATGAAGGCCTTGCAGTGATGGATAAAGCCAAAGGTCTCTTCCTGCCTGAGGATGAAAACCTGAGGGAAAAAGGGGACTGGAGCCAGTTCACGCTGTGGCAGCAAG

SEQ ID NO:659ASPH的外显子23

GAAGAAGAAATGAAAATGCCTGCAAAGGAGCTCCTAAAACCTGTACCTTACTAGAAAAGTTCCCCGAGACAACAGGATGCAGAAGAGGACAG

SEQ ID NO:660ASPH的外显子24

ATCAAATATTCCATCATGCACCCCGGGACTCACGTGTGGCCGCACACAGGGCCCACAAACTGCAGGCTCCGAATGCACCTGGGCTTGGTGATTCCCAAGGAAGGCTGCAAGATTCGATGTGCCAACGAGACCAA

SEQ ID NO:661ASPH的外显子25

GACCTGGGAGGAAGGCAAGGTGCTCATCTTTGATGACTCCTTTGAGCACGAGGTATGGCAGGATGCCTCATCTTTCCGGCTGATATTCATCGTGGATGTGTGGCATCCGGAACTGACACCACAGCAGAGACGCAGCCTTCCAGCAATTTAGCATGAATTCATGCAAGCTTGGGAAACTCTGGAGAGAGGCTGCCTTTCTGGTTCCATCTCCTTGGGTGTGAGGATAGAATTTCGAACACCAAGAGTCAATTCCCTTGACTTGCAGCCCGAGTAATTCAAAGCCTCCTCCTAGGGTCAGAAGACACTAAAGGGAATATTTGCCTCGCTGCAATTCATTTAGGAAACACCCTGCTGTGTGTCATCTCATGACAGCACTGGTCTTCTGCCAGTATTTAAGGTGAACATTTGATAGCTTCTACCTTACCAGCCAAAGATATTTTTTCCACATAGAATAGGTCTAATTCAATGTATAATGAGAACATATGTAGAAACTGTGAATGGATTGCTTTAGTTTGTAATTTTTCTATGCAGTTATATTTTTCTAGTGTAGCTAGACTATTTTGTCATCATGTACCACTACATTTTTGTTTATTTTAATGACAAGCTGTATAAATGCTTTACTTCTAGCTATTTAATGGTAGCATTACTGGGGAACTCAGACTTCCCTCTTTTAATTCTTCTTAGTAAAAGATACTCATGAAAAAAGCAGTTTTATTTTCCTAACAAAAAAGAAAGAGCTCATTATGTCAGTGTCTATGAACTGTACCCATCCCAACTCTCAAATCGTTTGGTTTTTTTTATCTTGATTGAGATCCTCTTCTCACTATGCTAGTGGTGGAGATATTGACAAAATCCTATTTCTTTCAAAGAGGAACTTTTCACACCGAAAAAAGAGCATGGAATTATTTTATATTGTTATAAAAATCCCAGATGCAAATTTTTTTAATGCCAATTATTAGAGCTTCTGGGGAAAAAGTATAGTTCACGGAAATAAAACTATGTTCTTTCAGGGTTGGGTGGATAGGTGGCTGCTAGGGTGTCTGGCTCCTGGCGGCTTTGCCATCCATGAGGCAAGGGCTGGGAACACAGTGTCTTTGCCTATGGTAGATCCATGTGAATGTCAGGAAGCCAGCTCTTCAGTCTTGGAGATGATTTCTGCTACAATTCTGTAGAAAGATTAAGGATGGCAGAGTAAAAGGTTACCAAGAATGCCAGGATGTTTTTCTTGGGCGTAGGAGGTCCAGATTACTTTCCTTTTTGATGAAAGAGTTTGGAAGACTGTCCCATCTCTCTGGCTTGAGAAATCTCTGCCATTTTAAACATCACTGTGAAATAGCAATTATTATCATCTGTATTTAGTTTTAACATTACCCACAACATAGAAATAATAGGTAAAAATCGTCTTGCCTACTCATTCCAAAGATGATCAAGTCATTAATCTAGCAAAGTATTCATGTATCAGATTTTGTATATTTTGAATCAAAGCTAACTAGGAATGTTAGATATAAGAATGTAATGATATTCATGCACTGAATTCTAAGCCAATATGAACAAAAATGCTGCATGAATGGCACATATAGGTCACCAAAGTTCATTCACAGGTAGAAAAAACTTGTGCTTTCTTTTCCATCTAAAAACAAAAGGAGACTTTCTTTATCTCATTTAAAGAACAGCTCTTTGAAATTGAAATTGACCCTTTTTGCTTGACCTTAAGGAGATTAGCTTCCAGTAGATGAGTTTGCAAAATACTTTTCCTGTTCTTTTGTTTTGCTGGTATTGAAAACATCCCACTAAATCAGATGAAGAGGCATGGGAGGAAAAATATCCAAATTAATTACTAAAATCGAGAAGAGAAGGCAAACTCTTGAAAAGTAAAAAGGTGTTTGTGACCTTCAGTATTTATTGAACAGAGGAAATAACTGACAAGGGCAATACAATTCAATGTTCATGTAGTAACATTCATGTCACTTGTTGAATTTGGTTCTCATATGTATATTGCATACACATAAATTCAAACTATAAGTCGTCATTTTTGAGCCATCATCTTACATTCATGTAATGAAATTATGGAAGAGAGTAAAAACTAGCTCTTAACTTAGTAAATATAATATGGTATTTAAAATCAGGTCACTACAGTAAGGTTCTAAGTATTGCCAATTGAAAAGCTAGAAATGGTATTACTGTTGCAAAGTGTTGTCAATAATTGACTCCAATAGCATTGTAAATACTTGTATCCCACAACTATTTTAAACCCAAGCAATAAAATGGATTTTCTAATTCACTTCAATTCTTTATTTCTCTTACCTATCTATGTCTTGGTACATAAGAAAAGTGTTTCCATCACTGCATTGGTAGAATTATTTCAGTGTTATTATTTTTGTGATTTCGTATGTCTACACAAAAATGAATTAGTTTAATTTATATTGTGATACAGTTGTTTGAGAAATATTTTTAATTCTGTTTCAACTTTATTTCTCCAAGTGTATAATATAAAAATTACTTCTGTTATTGTTCTCTACCAATAGGGGAAAAAATTAAAACATTAGATCCATTGAGAAAGAGATGATGTAATAAATAATTAAGATTAGTAATAATATTATCAGGGGTGATTATGACCAGTTGAATAATCTCTTTCCCTTGAATTATTTAGCTAACAAATTAACTCTCCCAAATATTTAAAATAATGTAAAATCATATTTTACTGCCCATTATTAACTAAAATATTTTTGTTTGACTTTGAGCACCAACTGGTAATACTAATAAATACCCATGTCATGCAGATGGCTGGGCGAATAAGAGATGTCTAAAAATATGCACTGGTCTTGGAAAACATGGCACAAGTAAGGATATCATATATGATGTCTGTTTATTTTATGTCTGATTTCTTTTGAATGAGTAGTTGGGGACTCCATTTCTAAGGAGACTAGGTAAATAAAATGACCTTTGACATTTCA

SEQ ID NO:662ASPH的全mRNA多核苷酸序列

AGTCTCAAGCTCTGGTAGGCAAGTGCATGCAGTGTGCCTAAAACCTGCCAGCAGTACTTTTGAGTTTTTTTTTTTGTTTTGTTTTACTTTAGCATTTATTATTCATGGATTGAAGAAATCAAAATGGCTGAAGATAAAGAGACAAAGCATGGAGGACACAAGAATGGGAGGAAAGGCGGACTCTCAGGAACTTCATTCTTCACGTGGTTTATGGTGATTGCATTGCTGGGCGTCTGGACATCTGTAGCTGTCGTTTGGTTTGATCTTGTTGACTATGAGGAAGTTCTAGGAAAACTAGGAATCTATGATGCTGATGGTGATGGAGATTTTGATGTGGATGATGCCAAAGTTTTATTAGGACTTAAAGAGAGATCTACTTCAGAGCCAGCAGTCCCGCCAGAAGAGGCTGAGCCACACACTGAGCCCGAGGAGCAGGTTCCTGTGGAGGCAGAACCCCAGAATATCGAAGATGAAGCAAAAGAACAAATTCAGTCCCTTCTCCATGAAATGGTACACGCAGAACATGTTGAGGGAGAAGACTTGCAACAAGAAGATGGACCCACAGGAGAACCACAACAAGAGGATGATGAGTTTCTTATGGCGACTGATGTAGATGATAGATTTGAGACCCTGGAACCTGAAGTATCTCATGAAGAAACCGAGCATAGTTACCACGTGGAAGAGACAGTTTCACAAGACTGTAATCAGGATATGGAAGAGATGATGTCTGAGCAGGAAAATCCAGATTCCAGTGAACCAGTAGTAGAAGATGAAAGATTGCACCATGATACAGATGATGTAACATACCAAGTCTATGAGGAACAAGCAGTATATGAACCTCTAGAAAATGAAGGGATAGAAATCACAGAAGTAACTGCTCCCCCTGAGGATAATCCTGTAGAAGATTCACAGGTAATTGTAGAAGAAGTAAGCATTTTTCCTGTGGAAGAACAGCAGGAAGTACCACCAGAAACAAATAGAAAAACAGATGATCCAGAACAAAAAGCAAAAGTTAAGAAAAAGAAGCCTAAACTTTTAAATAAATTTGATAAGACTATTAAAGCTGAACTTGATGCTGCAGAAAAACTCCGTAAAAGGGGAAAAATTGAGGAAGCAGTGAATGCATTTAAAGAACTAGTACGCAAATACCCTCAGAGTCCACGAGCAAGATATGGGAAGGCGCAGTGTGAGGATGATTTGGCTGAGAAGAGGAGAAGTAATGAGGTGCTACGTGGAGCCATCGAGACCTACCAAGAGGTGGCCAGCCTACCTGATGTCCCTGCAGACCTGCTGAAGCTGAGTTTGAAGCGTCGCTCAGACAGGCAACAATTTCTAGGTCATATGAGAGGTTCCCTGCTTACCCTGCAGAGATTAGTTCAACTATTTCCCAATGATACTTCCTTAAAAAATGACCTTGGCGTGGGATACCTCTTGATAGGAGATAATGACAATGCAAAGAAAGTTTATGAAGAGGTGCTGAGTGTGACACCTAATGATGGCTTTGCTAAAGTCCATTATGGCTTCATCCTGAAGGCACAGAACAAAATTGCTGAGAGCATCCCATATTTAAAGGAAGGAATAGAATCCGGAGATCCTGGCACTGATGATGGGAGATTTTATTTCCACCTGGGGGATGCCATGCAGAGGGTTGGGAACAAAGAGGCATATAAGTGGTATGAGCTTGGGCACAAGAGAGGACACTTTGCATCTGTCTGGCAACGCTCACTCTACAATGTGAATGGACTGAAAGCACAGCCTTGGTGGACCCCAAAAGAAACGGGCTACACAGAGTTAGTAAAGTCTTTAGAAAGAAACTGGAAGTTAATCCGAGATGAAGGCCTTGCAGTGATGGATAAAGCCAAAGGTCTCTTCCTGCCTGAGGATGAAAACCTGAGGGAAAAAGGGGACTGGAGCCAGTTCACGCTGTGGCAGCAAGGAAGAAGAAATGAAAATGCCTGCAAAGGAGCTCCTAAAACCTGTACCTTACTAGAAAAGTTCCCCGAGACAACAGGATGCAGAAGAGGACAGATCAAATATTCCATCATGCACCCCGGGACTCACGTGTGGCCGCACACAGGGCCCACAAACTGCAGGCTCCGAATGCACCTGGGCTTGGTGATTCCCAAGGAAGGCTGCAAGATTCGATGTGCCAACGAGACCAAGACCTGGGAGGAAGGCAAGGTGCTCATCTTTGATGACTCCTTTGAGCACGAGGTATGGCAGGATGCCTCATCTTTCCGGCTGATATTCATCGTGGATGTGTGGCATCCGGAACTGACACCACAGCAGAGACGCAGCCTTCCAGCAATTTAGCATGAATTCATGCAAGCTTGGGAAACTCTGGAGAGAGGCTGCCTTTCTGGTTCCATCTCCTTGGGTGTGAGGATAGAATTTCGAACACCAAGAGTCAATTCCCTTGACTTGCAGCCCGAGTAATTCAAAGCCTCCTCCTAGGGTCAGAAGACACTAAAGGGAATATTTGCCTCGCTGCAATTCATTTAGGAAACACCCTGCTGTGTGTCATCTCATGACAGCACTGGTCTTCTGCCAGTATTTAAGGTGAACATTTGATAGCTTCTACCTTACCAGCCAAAGATATTTTTTCCACATAGAATAGGTCTAATTCAATGTATAATGAGAACATATGTAGAAACTGTGAATGGATTGCTTTAGTTTGTAATTTTTCTATGCAGTTATATTTTTCTAGTGTAGCTAGACTATTTTGTCATCATGTACCACTACATTTTTGTTTATTTTAATGACAAGCTGTATAAATGCTTTACTTCTAGCTATTTAATGGTAGCATTACTGGGGAACTCAGACTTCCCTCTTTTAATTCTTCTTAGTAAAAGATACTCATGAAAAAAGCAGTTTTATTTTCCTAACAAAAAAGAAAGAGCTCATTATGTCAGTGTCTATGAACTGTACCCATCCCAACTCTCAAATCGTTTGGTTTTTTTTATCTTGATTGAGATCCTCTTCTCACTATGCTAGTGGTGGAGATATTGACAAAATCCTATTTCTTTCAAAGAGGAACTTTTCACACCGAAAAAAGAGCATGGAATTATTTTATATTGTTATAAAAATCCCAGATGCAAATTTTTTTAATGCCAATTATTAGAGCTTCTGGGGAAAAAGTATAGTTCACGGAAATAAAACTATGTTCTTTCAGGGTTGGGTGGATAGGTGGCTGCTAGGGTGTCTGGCTCCTGGCGGCTTTGCCATCCATGAGGCAAGGGCTGGGAACACAGTGTCTTTGCCTATGGTAGATCCATGTGAATGTCAGGAAGCCAGCTCTTCAGTCTTGGAGATGATTTCTGCTACAATTCTGTAGAAAGATTAAGGATGGCAGAGTAAAAGGTTACCAAGAATGCCAGGATGTTTTTCTTGGGCGTAGGAGGTCCAGATTACTTTCCTTTTTGATGAAAGAGTTTGGAAGACTGTCCCATCTCTCTGGCTTGAGAAATCTCTGCCATTTTAAACATCACTGTGAAATAGCAATTATTATCATCTGTATTTAGTTTTAACATTACCCACAACATAGAAATAATAGGTAAAAATCGTCTTGCCTACTCATTCCAAAGATGATCAAGTCATTAATCTAGCAAAGTATTCATGTATCAGATTTTGTATATTTTGAATCAAAGCTAACTAGGAATGTTAGATATAAGAATGTAATGATATTCATGCACTGAATTCTAAGCCAATATGAACAAAAATGCTGCATGAATGGCACATATAGGTCACCAAAGTTCATTCACAGGTAGAAAAAACTTGTGCTTTCTTTTCCATCTAAAAACAAAAGGAGACTTTCTTTATCTCATTTAAAGAACAGCTCTTTGAAATTGAAATTGACCCTTTTTGCTTGACCTTAAGGAGATTAGCTTCCAGTAGATGAGTTTGCAAAATACTTTTCCTGTTCTTTTGTTTTGCTGGTATTGAAAACATCCCACTAAATCAGATGAAGAGGCATGGGAGGAAAAATATCCAAATTAATTACTAAAATCGAGAAGAGAAGGCAAACTCTTGAAAAGTAAAAAGGTGTTTGTGACCTTCAGTATTTATTGAACAGAGGAAATAACTGACAAGGGCAATACAATTCAATGTTCATGTAGTAACATTCATGTCACTTGTTGAATTTGGTTCTCATATGTATATTGCATACACATAAATTCAAACTATAAGTCGTCATTTTTGAGCCATCATCTTACATTCATGTAATGAAATTATGGAAGAGAGTAAAAACTAGCTCTTAACTTAGTAAATATAATATGGTATTTAAAATCAGGTCACTACAGTAAGGTTCTAAGTATTGCCAATTGAAAAGCTAGAAATGGTATTACTGTTGCAAAGTGTTGTCAATAATTGACTCCAATAGCATTGTAAATACTTGTATCCCACAACTATTTTAAACCCAAGCAATAAAATGGATTTTCTAATTCACTTCAATTCTTTATTTCTCTTACCTATCTATGTCTTGGTACATAAGAAAAGTGTTTCCATCACTGCATTGGTAGAATTATTTCAGTGTTATTATTTTTGTGATTTCGTATGTCTACACAAAAATGAATTAGTTTAATTTATATTGTGATACAGTTGTTTGAGAAATATTTTTAATTCTGTTTCAACTTTATTTCTCCAAGTGTATAATATAAAAATTACTTCTGTTATTGTTCTCTACCAATAGGGGAAAAAATTAAAACATTAGATCCATTGAGAAAGAGATGATGTAATAAATAATTAAGATTAGTAATAATATTATCAGGGGTGATTATGACCAGTTGAATAATCTCTTTCCCTTGAATTATTTAGCTAACAAATTAACTCTCCCAAATATTTAAAATAATGTAAAATCATATTTTACTGCCCATTATTAACTAAAATATTTTTGTTTGACTTTGAGCACCAACTGGTAATACTAATAAATACCCATGTCATGCAGATGGCTGGGCGAATAAGAGATGTCTAAAAATATGCACTGGTCTTGGAAAACATGGCACAAGTAAGGATATCATATATGATGTCTGTTTATTTTATGTCTGATTTCTTTTGAATGAGTAGTTGGGGACTCCATTTCTAAGGAGACTAGGTAAATAAAATGACCTTTGACATTTCA

SEQ ID NO:663ASPH的外显子1的翻译多肽序列

MAEDK

SEQ ID NO:664ASPH的外显子2的翻译多肽序列

TKHGGHKNGRKGGLSGTSFFTWFMVIALLGVWTSVAVVWFDLVDYEEVL

SEQ ID NO:665ASPH的外显子3的翻译多肽序列

KLGIYDADGDGDFDVDDAKVLL

SEQ ID NO:666ASPH的外显子4的翻译多肽序列

LKERSTSEPAVPPEEAEPHTEPEEQVPVEA

SEQ ID NO:667ASPH的外显子5的翻译多肽序列

PQNIEDEAKEQIQSLLHEMVHAEH

SEQ ID NO:668ASPH的外显子6的翻译多肽序列

EGEDLQQEDGPTGEPQQEDDEFLMATDVDDRFETLEPEVSHE

SEQ ID NO:669ASPH的外显子7的翻译多肽序列

TEHSYHVEET

SEQ ID NO:670ASPH的外显子8的翻译多肽序列

SQDCNQDMEEMMSEQENP

SEQ ID NO:671ASPH的外显子9的翻译多肽序列

SSEPVVEDERLHHDT

SEQ ID NO:672ASPH的外显子10的翻译多肽序列

DVTYQVYEEQ

SEQ ID NO:673ASPH的外显子11的翻译多肽序列

VYEPLENEGIEIT

SEQ ID NO:674ASPH的外显子12的翻译多肽序列

VTAPPEDNPVEDSQVIVE

SEQ ID NO:675ASPH的外显子13的翻译多肽序列

VSIFPVEEQQEVPP

SEQ ID NO:676ASPH的外显子14的翻译多肽序列

TNRKTDDPEQKAK

SEQ ID NO:677ASPH的外显子15的翻译多肽序列

KKKKPKLLNKFDKTIKAELDAAEKLRKR

SEQ ID NO:678ASPH的外显子16的翻译多肽序列

GKIEEAVNAFKELVRKYPQSPRARYGKAQ

SEQ ID NO:679ASPH的外显子17的翻译多肽序列

CEDDLAEKRRSNEVLRGAIETYQEVASLPDVPADLLKLSLKRRSDRQQFL

SEQ ID NO:680ASPH的外显子18的翻译多肽序列

HMRGSLLTLQRLVQLFPNDTSLKNDLGVGYLLIGDNDNAKKVYEE

SEQ ID NO:681ASPH的外显子19的翻译多肽序列

VLSVTPNDGFAKVHYGFILKAQNKIAESIPYLK

SEQ ID NO:682ASPH的外显子20的翻译多肽序列

EGIESGDPGTDDGRFYFHLGDAMQRVGNKE

SEQ ID NO:683ASPH的外显子21的翻译多肽序列

AYKWYELGHKRGHFASVWQRSLYNVNGLKAQPWWTPKETGYTELVK

SEQ ID NO:684ASPH的外显子22的翻译多肽序列

SLERNWKLIRDEGLAVMDKAKGLFLPEDENLREKGDWSQFTLWQQ

SEQ ID NO:685ASPH的外显子23的翻译多肽序列

RRNENACKGAPKTCTLLEKFPETTGCRRGQ

SEQ ID NO:686ASPH的外显子24的翻译多肽序列

IKYSIMHPGTHVWPHTGPTNCRLRMHLGLVIPKEGCKIRCANET

SEQ ID NO:687ASPH的外显子25的翻译多肽序列TWEEGKVLIFDDSFEHEVWQDASSFRLIFIVDVWHPELTPQQRRSLPAI

SEQ ID NO:688ASPH的全蛋白质序列

MAEDKETKHGGHKNGRKGGLSGTSFFTWFMVIALLGVWTSVAVVWFDLVDYEEVLGKLGIYDADGDGDFDVDDAKVLLGLKERSTSEPAVPPEEAEPHTEPEEQVPVEAEPQNIEDEAKEQIQSLLHEMVHAEHVEGEDLQQEDGPTGEPQQEDDEFLMATDVDDRFETLEPEVSHEETEHSYHVEETVSQDCNQDMEEMMSEQENPDSSEPVVEDERLHHDTDDVTYQVYEEQAVYEPLENEGIEITEVTAPPEDNPVEDSQVIVEEVSIFPVEEQQEVPPETNRKTDDPEQKAKVKKKKPKLLNKFDKTIKAELDAAEKLRKRGKIEEAVNAFKELVRKYPQSPRARYGKAQCEDDLAEKRRSNEVLRGAIETYQEVASLPDVPADLLKLSLKRRSDRQQFLGHMRGSLLTLQRLVQLFPNDTSLKNDLGVGYLLIGDNDNAKKVYEEVLSVTPNDGFAKVHYGFILKAQNKIAESIPYLKEGIESGDPGTDDGRFYFHLGDAMQRVGNKEAYKWYELGHKRGHFASVWQRSLYNVNGLKAQPWWTPKETGYTELVKSLERNWKLIRDEGLAVMDKAKGLFLPEDENLREKGDWSQFTLWQQGRRNENACKGAPKTCTLLEKFPETTGCRRGQIKYSIMHPGTHVWPHTGPTNCRLRMHLGLVIPKEGCKIRCANETKTWEEGKVLIFDDSFEHEVWQDASSFRLIFIVDVWHPELTPQQRRSLPAI

SEQ ID NO:689ASPH的全部外显子1-22按顺序排列的多核苷酸序列

SEQ ID NO:690ASPH的全部外显子1-22按顺序排列的翻译多肽序列

NOTCH2序列信息

SEQ ID NO:691来自NOTCH2-NRG1融合物5’处的NOTCH2外显子6的序列

CCTCCTGTACTCCAGGCTCCACCTGCATCGACCGTGTGGCCTCCTTCTCTTGCATGTGCCCAGAGGGGAAGGCAG

SEQ ID NO:692NOTCH2-NRG1融合物3’处的NRG1外显子6序列

CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG

SEQ ID NO:693Notch2-NRG1多核苷酸序列

CCTCCTGTACTCCAGGCTCCACCTGCATCGACCGTGTGGCCTCCTTCTCTTGCATGTGCCCAGAGGGGAAGGCAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG

SEQ ID NO:694Notch2-NRG1多肽序列

SCTPGSTCIDRVASFSCMCPEGKAATSTSTTGTSHLVKCAEKEKTFCVN

SEQ ID NO:695NOTCH2的外显子1

AGGCTGCTTCGTTGCACACCCGAGAAAGTTTCAGCCAAACTTCGGGCGGCGGCTGAGGCGGCGGCCGAGGAGCGGCGGACTCGGGGCGCGGGGAGTCGAGGCATTTGCGCCTGGGCTTCGGAGCGTAGCGCCAGGGCCTGAGCCTTTGAAGCAGGAGGAGGGGAGGAGAGAGTGGGGCTCCTCTATCGGGACCCCCTCCCCATGTGGATCTGCCCAGGCGGCGGCGGCGGCGGCGGAGGAGGAGGCGACCGAGAAGATGCCCGCCCTGCGCCCCGCTCTGCTGTGGGCGCTGCTGGCGCTCTGGCTGTGCTGCGCGGCCCCCGCGCATG

SEQ ID NO:696NOTCH2的外显子2

CATTGCAGTGTCGAGATGGCTATGAACCCTGTGTAAATGAAGGAATGTGTGTTACCTACCACAATGGCACAGGATACTGCAA

SEQ ID NO:697NOTCH2的外显子3

ATGTCCAGAAGGCTTCTTGGGGGAATATTGTCAACATCGAGACCCCTGTGAGAAGAACCGCTGCCAGAATGGTGGGACTTGTGTGGCCCAGGCCATGCTGGGGAAAGCCACGTGCCGATGTGCCTCAGGGTTTACAGGAGAGGACTGCCAGTACTCAACATCTCATCCATGCTTTGTGTCTCGACCCTGCCTGAATGGCGGCACATGCCATATGCTCAGCCGGGATACCTATGAGTGCACCTGTCAAGTCGGGTTTACAG

SEQ ID NO:698NOTCH2的外显子4

GTAAGGAGTGCCAATGGACGGATGCCTGCCTGTCTCATCCCTGTGCAAATGGAAGTACCTGTACCACTGTGGCCAACCAGTTCTCCTGCAAATGCCTCACAGGCTTCACAGGGCAGAAATGTGAGACTGATGTCAATGAGTGTGACATTCCAGGACACTGCCAGCATGGTGGCACCTGCCTCAACCTGCCTGGTTCCTACCAGTGCCAGTGCCCTCAGGGCTTCACAGGCCAGTACTGTGACAGCCTGTATGTGCCCTGTGCACCCTCACCTTGTGTCAATGGAGGCACCTGTCGGCAGACTGGTGACTTCACTTTTGAGTGCAACTGCCTTCCAG

SEQ ID NO:699NOTCH2的外显子5

GTTTTGAAGGGAGCACCTGTGAGAGGAATATTGATGACTGCCCTAACCACAGGTGTCAGAATGGAGGGGTTTGTGTGGATGGGGTCAACACTTACAACTGCCGCTGTCCCCCACAATGGACAG

SEQ ID NO:700NOTCH2的外显子6

GACAGTTCTGCACAGAGGATGTGGATGAATGCCTGCTGCAGCCCAATGCCTGTCAAAATGGGGGCACCTGTGCCAACCGCAATGGAGGCTATGGCTGTGTATGTGTCAACGGCTGGAGTGGAGATGACTGCAGTGAGAACATTGATGATTGTGCCTTCGCCTCCTGTACTCCAGGCTCCACCTGCATCGACCGTGTGGCCTCCTTCTCTTGCATGTGCCCAGAGGGGAAGGCAG

SEQ ID NO:701NOTCH2的外显子7

GTCTCCTGTGTCATCTGGATGATGCATGCATCAGCAATCCTTGCCACAAGGGGGCACTGTGTGACACCAACCCCCTAAATGGGCAATATATTTGCACCTGCCCACAAGGCTACAAAGGGGCTGACTGCACAGAAGATGTGGATGAATGTGCCATGG

SEQ ID NO:702NOTCH2的外显子8-34

CCAATAGCAATCCTTGTGAGCATGCAGGAAAATGTGTGAACACGGATGGCGCCTTCCACTGTGAGTGTCTGAAGGGTTATGCAGGACCTCGTTGTGAGATGGACATCAATGAGTGCCATTCAGACCCCTGCCAGAATGATGCTACCTGTCTGGATAAGATTGGAGGCTTCACATGTCTGTGCATGCCAGGTTTCAAAGGTGTGCATTGTGAATTAGAAATAAATGAATGTCAGAGCAACCCTTGTGTGAACAATGGGCAGTGTGTGGATAAAGTCAATCGTTTCCAGTGCCTGTGTCCTCCTGGTTTCACTGGGCCAGTTTGCCAGATTGATATTGATGACTGTTCCAGTACTCCGTGTCTGAATGGGGCAAAGTGTATCGATCACCCGAATGGCTATGAATGCCAGTGTGCCACAGGTTTCACTGGTGTGTTGTGTGAGGAGAACATTGACAACTGTGACCCCGATCCTTGCCACCATGGTCAGTGTCAGGATGGTATTGATTCCTACACCTGCATCTGCAATCCCGGGTACATGGGCGCCATCTGCAGTGACCAGATTGATGAATGTTACAGCAGCCCTTGCCTGAACGATGGTCGCTGCATTGACCTGGTCAATGGCTACCAGTGCAACTGCCAGCCAGGCACGTCAGGGGTTAATTGTGAAATTAATTTTGATGACTGTGCAAGTAACCCTTGTATCCATGGAATCTGTATGGATGGCATTAATCGCTACAGTTGTGTCTGCTCACCAGGATTCACAGGGCAGAGATGTAACATTGACATTGATGAGTGTGCCTCCAATCCCTGTCGCAAGGGTGCAACATGTATCAACGGTGTGAATGGTTTCCGCTGTATATGCCCCGAGGGACCCCATCACCCCAGCTGCTACTCACAGGTGAACGAATGCCTGAGCAATCCCTGCATCCATGGAAACTGTACTGGAGGTCTCAGTGGATATAAGTGTCTCTGTGATGCAGGCTGGGTTGGCATCAACTGTGAAGTGGACAAAAATGAATGCCTTTCGAATCCATGCCAGAATGGAGGAACTTGTGACAATCTGGTGAATGGATACAGGTGTACTTGCAAGAAGGGCTTTAAAGGCTATAACTGCCAGGTGAATATTGATGAATGTGCCTCAAATCCATGCCTGAACCAAGGAACCTGCTTTGATGACATAAGTGGCTACACTTGCCACTGTGTGCTGCCATACACAGGCAAGAATTGTCAGACAGTATTGGCTCCCTGTTCCCCAAACCCTTGTGAGAATGCTGCTGTTTGCAAAGAGTCACCAAATTTTGAGAGTTATACTTGCTTGTGTGCTCCTGGCTGGCAAGGTCAGCGGTGTACCATTGACATTGACGAGTGTATCTCCAAGCCCTGCATGAACCATGGTCTCTGCCATAACACCCAGGGCAGCTACATGTGTGAATGTCCACCAGGCTTCAGTGGTATGGACTGTGAGGAGGACATTGATGACTGCCTTGCCAATCCTTGCCAGAATGGAGGTTCCTGTATGGATGGAGTGAATACTTTCTCCTGCCTCTGCCTTCCGGGTTTCACTGGGGATAAGTGCCAGACAGACATGAATGAGTGTCTGAGTGAACCCTGTAAGAATGGAGGGACCTGCTCTGACTACGTCAACAGTTACACTTGCAAGTGCCAGGCAGGATTTGATGGAGTCCATTGTGAGAACAACATCAATGAGTGCACTGAGAGCTCCTGTTTCAATGGTGGCACATGTGTTGATGGGATTAACTCCTTCTCTTGCTTGTGCCCTGTGGGTTTCACTGGATCCTTCTGCCTCCATGAGATCAATGAATGCAGCTCTCATCCATGCCTGAATGAGGGAACGTGTGTTGATGGCCTGGGTACCTACCGCTGCAGCTGCCCCCTGGGCTACACTGGGAAAAACTGTCAGACCCTGGTGAATCTCTGCAGTCGGTCTCCATGTAAAAACAAAGGTACTTGCGTTCAGAAAAAAGCAGAGTCCCAGTGCCTATGTCCATCTGGATGGGCTGGTGCCTATTGTGACGTGCCCAATGTCTCTTGTGACATAGCAG

CCTCCAGGAGAGGTGTGCTTGTTGAACACTTGTGCCAGCACTCAGGTGTCTGCATCAAT

GCTGGCAACACGCATTACTGTCAGTGCCCCCTGGGCTATACTGGGAGCTACTGTGAGGA

GCAACTCGATGAGTGTGCGTCCAACCCCTGCCAGCACGGGGCAACATGCAGTGACTTC

ATTGGTGGATACAGATGCGAGTGTGTCCCAGGCTATCAGGGTGTCAACTGTGAGTATGA

AGTGGATGAGTGCCAGAATCAGCCCTGCCAGAATGGAGGCACCTGTATTGACCTTGTG

AACCATTTCAAGTGCTCTTGCCCACCAGGCACTCGGGGCCTACTCTGTGAAGAGAACA

TTGATGACTGTGCCCGGGGTCCCCATTGCCTTAATGGTGGTCAGTGCATGGATAGGATT

GGAGGCTACAGTTGTCGCTGCTTGCCTGGCTTTGCTGGGGAGCGTTGTGAGGGAGACA

TCAACGAGTGCCTCTCCAACCCCTGCAGCTCTGAGGGCAGCCTGGACTGTATACAGCT

CACCAATGACTACCTGTGTGTTTGCCGTAGTGCCTTTACTGGCCGGCACTGTGAAACCT

TCGTCGATGTGTGTCCCCAGATGCCCTGCCTGAATGGAGGGACTTGTGCTGTGGCCAGT

AACATGCCTGATGGTTTCATTTGCCGTTGTCCCCCGGGATTTTCCGGGGCAAGGTGCCA

GAGCAGCTGTGGACAAGTGAAATGTAGGAAGGGGGAGCAGTGTGTGCACACCGCCTC

TGGACCCCGCTGCTTCTGCCCCAGTCCCCGGGACTGCGAGTCAGGCTGTGCCAGTAGC

CCCTGCCAGCACGGGGGCAGCTGCCACCCTCAGCGCCAGCCTCCTTATTACTCCTGCCA

GTGTGCCCCACCATTCTCGGGTAGCCGCTGTGAACTCTACACGGCACCCCCCAGCACC

CCTCCTGCCACCTGTCTGAGCCAGTATTGTGCCGACAAAGCTCGGGATGGCGTCTGTGA

TGAGGCCTGCAACAGCCATGCCTGCCAGTGGGATGGGGGTGACTGTTCTCTCACCATG

GAGAACCCCTGGGCCAACTGCTCCTCCCCACTTCCCTGCTGGGATTATATCAACAACCA

GTGTGATGAGCTGTGCAACACGGTCGAGTGCCTGTTTGACAACTTTGAATGCCAGGGG

AACAGCAAGACATGCAAGTATGACAAATACTGTGCAGACCACTTCAAAGACAACCACT

GTGACCAGGGGTGCAACAGTGAGGAGTGTGGTTGGGATGGGCTGGACTGTGCTGCTG

ACCAACCTGAGAACCTGGCAGAAGGTACCCTGGTTATTGTGGTATTGATGCCACCTGAA

CAACTGCTCCAGGATGCTCGCAGCTTCTTGCGGGCACTGGGTACCCTGCTCCACACCA

ACCTGCGCATTAAGCGGGACTCCCAGGGGGAACTCATGGTGTACCCCTATTATGGTGAG

AAGTCAGCTGCTATGAAGAAACAGAGGATGACACGCAGATCCCTTCCTGGTGAACAAG

AACAGGAGGTGGCTGGCTCTAAAGTCTTTCTGGAAATTGACAACCGCCAGTGTGTTCA

AGACTCAGACCACTGCTTCAAGAACACGGATGCAGCAGCAGCTCTCCTGGCCTCTCAC

GCCATACAGGGGACCCTGTCATACCCTCTTGTGTCTGTCGTCAGTGAATCCCTGACTCC

AGAACGCACTCAGCTCCTCTATCTCCTTGCTGTTGCTGTTGTCATCATTCTGTTTATTATT

CTGCTGGGGGTAATCATGGCAAAACGAAAGCGTAAGCATGGCTCTCTCTGGCTGCCTG

AAGGTTTCACTCTTCGCCGAGATGCAAGCAATCACAAGCGTCGTGAGCCAGTGGGACA

GGATGCTGTGGGGCTGAAAAATCTCTCAGTGCAAGTCTCAGAAGCTAACCTAATTGGTA

CTGGAACAAGTGAACACTGGGTCGATGATGAAGGGCCCCAGCCAAAGAAAGTAAAGG

CTGAAGATGAGGCCTTACTCTCAGAAGAAGATGACCCCATTGATCGACGGCCATGGAC

ACAGCAGCACCTTGAAGCTGCAGACATCCGTAGGACACCATCGCTGGCTCTCACCCCT

CCTCAGGCAGAGCAGGAGGTGGATGTGTTAGATGTGAATGTCCGTGGCCCAGATGGCT

GCACCCCATTGATGTTGGCTTCTCTCCGAGGAGGCAGCTCAGATTTGAGTGATGAAGAT

GAAGATGCAGAGGACTCTTCTGCTAACATCATCACAGACTTGGTCTACCAGGGTGCCA

GCCTCCAGGCCCAGACAGACCGGACTGGTGAGATGGCCCTGCACCTTGCAGCCCGCTA

CTCACGGGCTGATGCTGCCAAGCGTCTCCTGGATGCAGGTGCAGATGCCAATGCCCAG

GACAACATGGGCCGCTGTCCACTCCATGCTGCAGTGGCAGCTGATGCCCAAGGTGTCT

TCCAGATTCTGATTCGCAACCGAGTAACTGATCTAGATGCCAGGATGAATGATGGTACT

ACACCCCTGATCCTGGCTGCCCGCCTGGCTGTGGAGGGAATGGTGGCAGAACTGATCA

ACTGCCAAGCGGATGTGAATGCAGTGGATGACCATGGAAAATCTGCTCTTCACTGGGC

AGCTGCTGTCAATAATGTGGAGGCAACTCTTTTGTTGTTGAAAAATGGGGCCAACCGA

GACATGCAGGACAACAAGGAAGAGACACCTCTGTTTCTTGCTGCCCGGGAGGGGAGC

TATGAAGCAGCCAAGATCCTGTTAGACCATTTTGCCAATCGAGACATCACAGACCATAT

GGATCGTCTTCCCCGGGATGTGGCTCGGGATCGCATGCACCATGACATTGTGCGCCTTC

TGGATGAATACAATGTGACCCCAAGCCCTCCAGGCACCGTGTTGACTTCTGCTCTCTCA

CCTGTCATCTGTGGGCCCAACAGATCTTTCCTCAGCCTGAAGCACACCCCAATGGGCAA

GAAGTCTAGACGGCCCAGTGCCAAGAGTACCATGCCTACTAGCCTCCCTAACCTTGCCA

AGGAGGCAAAGGATGCCAAGGGTAGTAGGAGGAAGAAGTCTCTGAGTGAGAAGGTCC

AACTGTCTGAGAGTTCAGTAACTTTATCCCCTGTTGATTCCCTAGAATCTCCTCACACGT

ATGTTTCCGACACCACATCCTCTCCAATGATTACATCCCCTGGGATCTTACAGGCCTCAC

CCAACCCTATGTTGGCCACTGCCGCCCCTCCTGCCCCAGTCCATGCCCAGCATGCACTA

TCTTTTTCTAACCTTCATGAAATGCAGCCTTTGGCACATGGGGCCAGCACTGTGCTTCC

CTCAGTGAGCCAGTTGCTATCCCACCACCACATTGTGTCTCCAGGCAGTGGCAGTGCTG

GAAGCTTGAGTAGGCTCCATCCAGTCCCAGTCCCAGCAGATTGGATGAACCGCATGGA

GGTGAATGAGACCCAGTACAATGAGATGTTTGGTATGGTCCTGGCTCCAGCTGAGGGC

ACCCATCCTGGCATAGCTCCCCAGAGCAGGCCACCTGAAGGGAAGCACATAACCACCC

CTCGGGAGCCCTTGCCCCCCATTGTGACTTTCCAGCTCATCCCTAAAGGCAGTATTGCC

CAACCAGCGGGGGCTCCCCAGCCTCAGTCCACCTGCCCTCCAGCTGTTGCGGGCCCCC

TGCCCACCATGTACCAGATTCCAGAAATGGCCCGTTTGCCCAGTGTGGCTTTCCCCACT

GCCATGATGCCCCAGCAGGACGGGCAGGTAGCTCAGACCATTCTCCCAGCCTATCATCC

TTTCCCAGCCTCTGTGGGCAAGTACCCCACACCCCCTTCACAGCACAGTTATGCTTCCT

CAAATGCTGCTGAGCGAACACCCAGTCACAGTGGTCACCTCCAGGGTGAGCATCCCTA

CCTGACACCATCCCCAGAGTCTCCTGACCAGTGGTCAAGTTCATCACCCCACTCTGCTT

CTGACTGGTCAGATGTGACCACCAGCCCTACCCCTGGGGGTGCTGGAGGAGGTCAGCG

GGGACCTGGGACACACATGTCTGAGCCACCACACAACAACATGCAGGTTTATGCGTGA

GAGAGTCCACCTCCAGTGTAGAGACATAACTGACTTTTGTAAATGCTGCTGAGGAACA

AATGAAGGTCATCCGGGAGAGAAATGAAGAAATCTCTGGAGCCAGCTTCTAGAGGTAG

GAAAGAGAAGATGTTCTTATTCAGATAATGCAAGAGAAGCAATTCGTCAGTTTCACTGG

GTATCTGCAAGGCTTATTGATTATTCTAATCTAATAAGACAAGTTTGTGGAAATGCAAGA

TGAATACAAGCCTTGGGTCCATGTTTACTCTCTTCTATTTGGAGAATAAGATGGATGCTT

ATTGAAGCCCAGACATTCTTGCAGCTTGGACTGCATTTTAAGCCCTGCAGGCTTCTGCC

ATATCCATGAGAAGATTCTACACTAGCGTCCTGTTGGGAATTATGCCCTGGAATTCTGCC

TGAATTGACCTACGCATCTCCTCCTCCTTGGACATTCTTTTGTCTTCATTTGGTGCTTTTG

GTTTTGCACCTCTCCGTGATTGTAGCCCTACCAGCATGTTATAGGGCAAGACCTTTGTGC

TTTTGATCATTCTGGCCCATGAAAGCAACTTTGGTCTCCTTTCCCCTCCTGTCTTCCCGG

TATCCCTTGGAGTCTCACAAGGTTTACTTTGGTATGGTTCTCAGCACAAACCTTTCAAGT

ATGTTGTTTCTTTGGAAAATGGACATACTGTATTGTGTTCTCCTGCATATATCATTCCTGG

AGAGAGAAGGGGAGAAGAATACTTTTCTTCAACAAATTTTGGGGGCAGGAGATCCCTT

CAAGAGGCTGCACCTTAATTTTTCTTGTCTGTGTGCAGGTCTTCATATAAACTTTACCAG

GAAGAAGGGTGTGAGTTTGTTGTTTTTCTGTGTATGGGCCTGGTCAGTGTAAAGTTTTA

TCCTTGATAGTCTAGTTACTATGACCCTCCCCACTTTTTTAAAACCAGAAAAAGGTTTGG

AATGTTGGAATGACCAAGAGACAAGTTAACTCGTGCAAGAGCCAGTTACCCACCCACA

GGTCCCCCTACTTCCTGCCAAGCATTCCATTGACTGCCTGTATGGAACACATTTGTCCCA

GATCTGAGCATTCTAGGCCTGTTTCACTCACTCACCCAGCATATGAAACTAGTCTTAACT

GTTGAGCCTTTCCTTTCATATCCACAGAAGACACTGTCTCAAATGTTGTACCCTTGCCAT

TTAGGACTGAACTTTCCTTAGCCCAAGGGACCCAGTGACAGTTGTCTTCCGTTTGTCAG

ATGATCAGTCTCTACTGATTATCTTGCTGCTTAAAGGCCTGCTCACCAATCTTTCTTTCAC

ACCGTGTGGTCCGTGTTACTGGTATACCCAGTATGTTCTCACTGAAGACATGGACTTTAT

ATGTTCAAGTGCAGGAATTGGAAAGTTGGACTTGTTTTCTATGATCCAAAACAGCCCTA

TAAGAAGGTTGGAAAAGGAGGAACTATATAGCAGCCTTTGCTATTTTCTGCTACCATTTC

TTTTCCTCTGAAGCGGCCATGACATTCCCTTTGGCAACTAACGTAGAAACTCAACAGAA

CATTTTCCTTTCCTAGAGTCACCTTTTAGATGATAATGGACAACTATAGACTTGCTCATTG

TTCAGACTGATTGCCCCTCACCTGAATCCACTCTCTGTATTCATGCTCTTGGCAATTTCT

TTGACTTTCTTTTAAGGGCAGAAGCATTTTAGTTAATTGTAGATAAAGAATAGTTTTCTT

CCTCTTCTCCTTGGGCCAGTTAATAATTGGTCCATGGCTACACTGCAACTTCCGTCCAGT

GCTGTGATGCCCATGACACCTGCAAAATAAGTTCTGCCTGGGCATTTTGTAGATATTAAC

AGGTGAATTCCCGACTCTTTTGGTTTGAATGACAGTTCTCATTCCTTCTATGGCTGCAAG

TATGCATCAGTGCTTCCCACTTACCTGATTTGTCTGTCGGTGGCCCCATATGGAAACCCT

GCGTGTCTGTTGGCATAATAGTTTACAAATGGTTTTTTCAGTCCTATCCAAATTTATTGAACCAACAAAAATAATTACTTCTGCCCTGAGATAAGCAGATTAAGTTTGTTCATTCTCTGCTTTATTCTCTCCATGTGGCAACATTCTGTCAGCCTCTTTCATAGTGTGCAAACATTTTATCATTCTAAATGGTGACTCTCTGCCCTTGGACCCATTTATTATTCACAGATGGGGAGAACCTATCTGCATGGACCTCTGTGGACCACAGCGTACCTGCCCCTTTCTGCCCTCCTGCTCCAGCCCCACTTCTGAAAGTATCAGCTACTGATCCAGCCACTGGATATTTTATATCCTCCCTTTTCCTTAAGCACAATGTCAGACCAAATTGCTTGTTTCTTTTTCTTGGACTACTTTAATTTGGATCCTTTGGGTTTGGAGAAAGGGAATGTGAAAGCTGTCATTACAGACAACAGGTTTCAGTGATGAGGAGGACAACACTGCCTTTCAAACTTTTTACTGATCTCTTAGATTTTAAGAACTCTTGAATTGTGTGGTATCTAATAAAAGGGAAGGTAAGATGGATAATCACTTTCTCATTTGGGTTCTGAATTGGAGACTCAGTTTTTATGAGACACATCTTTTATGCCATGTATAGATCCTCCCCTGCTATTTTTGGTTTATTTTTATTGTTATAAATGCTTTCTTTCTTTGACTCCTCTTCTGCCTGCCTTTGGGGATAGGTTTTTTTGTTTGTTTATTTGCTTCCTCTGTTTTGTTTTAAGCATCATTTTCTTATGTGAGGTGGGGAAGGGAAAGGTATGAGGGAAAGAGAGTCTGAGAATTAAAATATTTTAGTATAAGCAATTGGCTGTGATGCTCAAATCCATTGCATCCTCTTATTGAATTTGCCAATTTGTAATTTTTGCATAATAAAGAACCAAAGGTGTAATGTTTTGTTGAGAGGTGGTTTAGGGATTTTGGCCCTAACCAATACATTGAATGTATGATGACTATTTGGGAGGACACATTTATGTACCCAGAGGCCCCCACTAATAAGTGGTACTATGGTTACTTCCTTGTGTACATTTCTCTTAAAAGTGATATTATATCTGTTTGTATGAGAAACCCAGTAACCAATAAAATGACCGCATATTCCTGACTAAACGTAGTAAGGAAAATGCACACTTTGTTTTTACTTTTCCGTTTCATTCTAAAGGTAGTTAAGATGAAATTTATATGAAAGCATTTTTATCACAAAATAAAAAAGGTTTGCCAAGCTCAGTGGTGTTGTATTTTTTATTTTCCAATACTGCATCCATGGCCTGGCAGTGTTACCTCATGATGTCATAATTTGCTGAGAGAGCAAATTTTCTTTTCTTTCTGAATCCCACAAAGCCTAGCACCAAACTTCTTTTTTTCTTCCTTTAATTAGATCATAAATAAATGATCCTGGGGAAAAAGCATCTGTCAAATAGGAAACATCACAAAACTGAGCACTCTTCTGTGCACTAGCCATAGCTGGTGACAAACAGATGGTTGCTCAGGGACAAGGTGCCTTCCAATGGAAATGCGAAGTAGTTGCTATAGCAAGAATTGGGAACTGGGATATAAGTCATAATATTAATTATGCTGTTATGTAAATGATTGGTTTGTAACATTCCTTAAGTGAAATTTGTGTAGAACTTAATATACAGGATTATAAAATAATATTTTGTGTATAAATTTGTTATAAGTTCACATTCATACATTTATTTATAAAGTCAGTGAGATATTTGAACATGAA

SEQ ID NO:703NOTCH2的全mRNA多核苷酸序列

AGGCTGCTTCGTTGCACACCCGAGAAAGTTTCAGCCAAACTTCGGGCGGCGGCTGAGGCGGCGGCCGAGGAGCGGCGGACTCGGGGCGCGGGGAGTCGAGGCATTTGCGCCTGGGCTTCGGAGCGTAGCGCCAGGGCCTGAGCCTTTGAAGCAGGAGGAGGGGAGGAGAGAGTGGGGCTCCTCTATCGGGACCCCCTCCCCATGTGGATCTGCCCAGGCGGCGGCGGCGGCGGCGGAGGAGGAGGCGACCGAGAAGATGCCCGCCCTGCGCCCCGCTCTGCTGTGGGCGCTGCTGGCGCTCTGGCTGTGCTGCGCGGCCCCCGCGCATGCATTGCAGTGTCGAGATGGCTATGAACCCTGTGTAAATGAAGGAATGTGTGTTACCTACCACAATGGCACAGGATACTGCAAATGTCCAGAAGGCTTCTTGGGGGAATATTGTCAACATCGAGACCCCTGTGAGAAGAACCGCTGCCAGAATGGTGGGACTTGTGTGGCCCAGGCCATGCTGGGGAAAGCCACGTGCCGATGTGCCTCAGGGTTTACAGGAGAGGACTGCCAGTACTCAACATCTCATCCATGCTTTGTGTCTCGACCCTGCCTGAATGGCGGCACATGCCATATGCTCAGCCGGGATACCTATGAGTGCACCTGTCAAGTCGGGTTTACAGGTAAGGAGTGCCAATGGACGGATGCCTGCCTGTCTCATCCCTGTGCAAATGGAAGTACCTGTACCACTGTGGCCAACCAGTTCTCCTGCAAATGCCTCACAGGCTTCACAGGGCAGAAATGTGAGACTGATGTCAATGAGTGTGACATTCCAGGACACTGCCAGCATGGTGGCACCTGCCTCAACCTGCCTGGTTCCTACCAGTGCCAGTGCCCTCAGGGCTTCACAGGCCAGTACTGTGACAGCCTGTATGTGCCCTGTGCACCCTCACCTTGTGTCAATGGAGGCACCTGTCGGCAGACTGGTGACTTCACTTTTGAGTGCAACTGCCTTCCAGGTTTTGAAGGGAGCACCTGTGAGAGGAATATTGATGACTGCCCTAACCACAGGTGTCAGAATGGAGGGGTTTGTGTGGATGGGGTCAACACTTACAACTGCCGCTGTCCCCCACAATGGACAGGACAGTTCTGCACAGAGGATGTGGATGAATGCCTGCTGCAGCCCAATGCCTGTCAAAATGGGGGCACCTGTGCCAACCGCAATGGAGGCTATGGCTGTGTATGTGTCAACGGCTGGAGTGGAGATGACTGCAGTGAGAACATTGATGATT

GTGCCTTCGCCTCCTGTACTCCAGGCTCCACCTGCATCGACCGTGTGGCCTCCTTCTCTT

GCATGTGCCCAGAGGGGAAGGCAGGTCTCCTGTGTCATCTGGATGATGCATGCATCAGC

AATCCTTGCCACAAGGGGGCACTGTGTGACACCAACCCCCTAAATGGGCAATATATTTG

CACCTGCCCACAAGGCTACAAAGGGGCTGACTGCACAGAAGATGTGGATGAATGTGCC

ATGGCCAATAGCAATCCTTGTGAGCATGCAGGAAAATGTGTGAACACGGATGGCGCCTT

CCACTGTGAGTGTCTGAAGGGTTATGCAGGACCTCGTTGTGAGATGGACATCAATGAGT

GCCATTCAGACCCCTGCCAGAATGATGCTACCTGTCTGGATAAGATTGGAGGCTTCACA

TGTCTGTGCATGCCAGGTTTCAAAGGTGTGCATTGTGAATTAGAAATAAATGAATGTCA

GAGCAACCCTTGTGTGAACAATGGGCAGTGTGTGGATAAAGTCAATCGTTTCCAGTGC

CTGTGTCCTCCTGGTTTCACTGGGCCAGTTTGCCAGATTGATATTGATGACTGTTCCAGT

ACTCCGTGTCTGAATGGGGCAAAGTGTATCGATCACCCGAATGGCTATGAATGCCAGTG

TGCCACAGGTTTCACTGGTGTGTTGTGTGAGGAGAACATTGACAACTGTGACCCCGAT

CCTTGCCACCATGGTCAGTGTCAGGATGGTATTGATTCCTACACCTGCATCTGCAATCCC

GGGTACATGGGCGCCATCTGCAGTGACCAGATTGATGAATGTTACAGCAGCCCTTGCCT

GAACGATGGTCGCTGCATTGACCTGGTCAATGGCTACCAGTGCAACTGCCAGCCAGGC

ACGTCAGGGGTTAATTGTGAAATTAATTTTGATGACTGTGCAAGTAACCCTTGTATCCAT

GGAATCTGTATGGATGGCATTAATCGCTACAGTTGTGTCTGCTCACCAGGATTCACAGG

GCAGAGATGTAACATTGACATTGATGAGTGTGCCTCCAATCCCTGTCGCAAGGGTGCAA

CATGTATCAACGGTGTGAATGGTTTCCGCTGTATATGCCCCGAGGGACCCCATCACCCC

AGCTGCTACTCACAGGTGAACGAATGCCTGAGCAATCCCTGCATCCATGGAAACTGTAC

TGGAGGTCTCAGTGGATATAAGTGTCTCTGTGATGCAGGCTGGGTTGGCATCAACTGTG

AAGTGGACAAAAATGAATGCCTTTCGAATCCATGCCAGAATGGAGGAACTTGTGACAA

TCTGGTGAATGGATACAGGTGTACTTGCAAGAAGGGCTTTAAAGGCTATAACTGCCAGG

TGAATATTGATGAATGTGCCTCAAATCCATGCCTGAACCAAGGAACCTGCTTTGATGAC

ATAAGTGGCTACACTTGCCACTGTGTGCTGCCATACACAGGCAAGAATTGTCAGACAGT

ATTGGCTCCCTGTTCCCCAAACCCTTGTGAGAATGCTGCTGTTTGCAAAGAGTCACCAA

ATTTTGAGAGTTATACTTGCTTGTGTGCTCCTGGCTGGCAAGGTCAGCGGTGTACCATT

GACATTGACGAGTGTATCTCCAAGCCCTGCATGAACCATGGTCTCTGCCATAACACCCA

GGGCAGCTACATGTGTGAATGTCCACCAGGCTTCAGTGGTATGGACTGTGAGGAGGAC

ATTGATGACTGCCTTGCCAATCCTTGCCAGAATGGAGGTTCCTGTATGGATGGAGTGAA

TACTTTCTCCTGCCTCTGCCTTCCGGGTTTCACTGGGGATAAGTGCCAGACAGACATGA

ATGAGTGTCTGAGTGAACCCTGTAAGAATGGAGGGACCTGCTCTGACTACGTCAACAG

TTACACTTGCAAGTGCCAGGCAGGATTTGATGGAGTCCATTGTGAGAACAACATCAATG

AGTGCACTGAGAGCTCCTGTTTCAATGGTGGCACATGTGTTGATGGGATTAACTCCTTC

TCTTGCTTGTGCCCTGTGGGTTTCACTGGATCCTTCTGCCTCCATGAGATCAATGAATGC

AGCTCTCATCCATGCCTGAATGAGGGAACGTGTGTTGATGGCCTGGGTACCTACCGCTG

CAGCTGCCCCCTGGGCTACACTGGGAAAAACTGTCAGACCCTGGTGAATCTCTGCAGT

CGGTCTCCATGTAAAAACAAAGGTACTTGCGTTCAGAAAAAAGCAGAGTCCCAGTGCC

TATGTCCATCTGGATGGGCTGGTGCCTATTGTGACGTGCCCAATGTCTCTTGTGACATAG

CAGCCTCCAGGAGAGGTGTGCTTGTTGAACACTTGTGCCAGCACTCAGGTGTCTGCAT

CAATGCTGGCAACACGCATTACTGTCAGTGCCCCCTGGGCTATACTGGGAGCTACTGTG

AGGAGCAACTCGATGAGTGTGCGTCCAACCCCTGCCAGCACGGGGCAACATGCAGTG

ACTTCATTGGTGGATACAGATGCGAGTGTGTCCCAGGCTATCAGGGTGTCAACTGTGAG

TATGAAGTGGATGAGTGCCAGAATCAGCCCTGCCAGAATGGAGGCACCTGTATTGACCT

TGTGAACCATTTCAAGTGCTCTTGCCCACCAGGCACTCGGGGCCTACTCTGTGAAGAG

AACATTGATGACTGTGCCCGGGGTCCCCATTGCCTTAATGGTGGTCAGTGCATGGATAG

GATTGGAGGCTACAGTTGTCGCTGCTTGCCTGGCTTTGCTGGGGAGCGTTGTGAGGGA

GACATCAACGAGTGCCTCTCCAACCCCTGCAGCTCTGAGGGCAGCCTGGACTGTATAC

AGCTCACCAATGACTACCTGTGTGTTTGCCGTAGTGCCTTTACTGGCCGGCACTGTGAA

ACCTTCGTCGATGTGTGTCCCCAGATGCCCTGCCTGAATGGAGGGACTTGTGCTGTGGC

CAGTAACATGCCTGATGGTTTCATTTGCCGTTGTCCCCCGGGATTTTCCGGGGCAAGGT

GCCAGAGCAGCTGTGGACAAGTGAAATGTAGGAAGGGGGAGCAGTGTGTGCACACCG

CCTCTGGACCCCGCTGCTTCTGCCCCAGTCCCCGGGACTGCGAGTCAGGCTGTGCCAG

TAGCCCCTGCCAGCACGGGGGCAGCTGCCACCCTCAGCGCCAGCCTCCTTATTACTCCT

GCCAGTGTGCCCCACCATTCTCGGGTAGCCGCTGTGAACTCTACACGGCACCCCCCAG

CACCCCTCCTGCCACCTGTCTGAGCCAGTATTGTGCCGACAAAGCTCGGGATGGCGTCT

GTGATGAGGCCTGCAACAGCCATGCCTGCCAGTGGGATGGGGGTGACTGTTCTCTCAC

CATGGAGAACCCCTGGGCCAACTGCTCCTCCCCACTTCCCTGCTGGGATTATATCAACA

ACCAGTGTGATGAGCTGTGCAACACGGTCGAGTGCCTGTTTGACAACTTTGAATGCCA

GGGGAACAGCAAGACATGCAAGTATGACAAATACTGTGCAGACCACTTCAAAGACAA

CCACTGTGACCAGGGGTGCAACAGTGAGGAGTGTGGTTGGGATGGGCTGGACTGTGCT

GCTGACCAACCTGAGAACCTGGCAGAAGGTACCCTGGTTATTGTGGTATTGATGCCACC

TGAACAACTGCTCCAGGATGCTCGCAGCTTCTTGCGGGCACTGGGTACCCTGCTCCAC

ACCAACCTGCGCATTAAGCGGGACTCCCAGGGGGAACTCATGGTGTACCCCTATTATGG

TGAGAAGTCAGCTGCTATGAAGAAACAGAGGATGACACGCAGATCCCTTCCTGGTGAA

CAAGAACAGGAGGTGGCTGGCTCTAAAGTCTTTCTGGAAATTGACAACCGCCAGTGTG

TTCAAGACTCAGACCACTGCTTCAAGAACACGGATGCAGCAGCAGCTCTCCTGGCCTC

TCACGCCATACAGGGGACCCTGTCATACCCTCTTGTGTCTGTCGTCAGTGAATCCCTGA

CTCCAGAACGCACTCAGCTCCTCTATCTCCTTGCTGTTGCTGTTGTCATCATTCTGTTTAT

TATTCTGCTGGGGGTAATCATGGCAAAACGAAAGCGTAAGCATGGCTCTCTCTGGCTGC

CTGAAGGTTTCACTCTTCGCCGAGATGCAAGCAATCACAAGCGTCGTGAGCCAGTGGG

ACAGGATGCTGTGGGGCTGAAAAATCTCTCAGTGCAAGTCTCAGAAGCTAACCTAATT

GGTACTGGAACAAGTGAACACTGGGTCGATGATGAAGGGCCCCAGCCAAAGAAAGTA

AAGGCTGAAGATGAGGCCTTACTCTCAGAAGAAGATGACCCCATTGATCGACGGCCAT

GGACACAGCAGCACCTTGAAGCTGCAGACATCCGTAGGACACCATCGCTGGCTCTCAC

CCCTCCTCAGGCAGAGCAGGAGGTGGATGTGTTAGATGTGAATGTCCGTGGCCCAGAT

GGCTGCACCCCATTGATGTTGGCTTCTCTCCGAGGAGGCAGCTCAGATTTGAGTGATGA

AGATGAAGATGCAGAGGACTCTTCTGCTAACATCATCACAGACTTGGTCTACCAGGGTG

CCAGCCTCCAGGCCCAGACAGACCGGACTGGTGAGATGGCCCTGCACCTTGCAGCCCG

CTACTCACGGGCTGATGCTGCCAAGCGTCTCCTGGATGCAGGTGCAGATGCCAATGCCC

AGGACAACATGGGCCGCTGTCCACTCCATGCTGCAGTGGCAGCTGATGCCCAAGGTGT

CTTCCAGATTCTGATTCGCAACCGAGTAACTGATCTAGATGCCAGGATGAATGATGGTA

CTACACCCCTGATCCTGGCTGCCCGCCTGGCTGTGGAGGGAATGGTGGCAGAACTGAT

CAACTGCCAAGCGGATGTGAATGCAGTGGATGACCATGGAAAATCTGCTCTTCACTGG

GCAGCTGCTGTCAATAATGTGGAGGCAACTCTTTTGTTGTTGAAAAATGGGGCCAACC

GAGACATGCAGGACAACAAGGAAGAGACACCTCTGTTTCTTGCTGCCCGGGAGGGGA

GCTATGAAGCAGCCAAGATCCTGTTAGACCATTTTGCCAATCGAGACATCACAGACCAT

ATGGATCGTCTTCCCCGGGATGTGGCTCGGGATCGCATGCACCATGACATTGTGCGCCT

TCTGGATGAATACAATGTGACCCCAAGCCCTCCAGGCACCGTGTTGACTTCTGCTCTCT

CACCTGTCATCTGTGGGCCCAACAGATCTTTCCTCAGCCTGAAGCACACCCCAATGGGC

AAGAAGTCTAGACGGCCCAGTGCCAAGAGTACCATGCCTACTAGCCTCCCTAACCTTGC

CAAGGAGGCAAAGGATGCCAAGGGTAGTAGGAGGAAGAAGTCTCTGAGTGAGAAGGT

CCAACTGTCTGAGAGTTCAGTAACTTTATCCCCTGTTGATTCCCTAGAATCTCCTCACAC

GTATGTTTCCGACACCACATCCTCTCCAATGATTACATCCCCTGGGATCTTACAGGCCTC

ACCCAACCCTATGTTGGCCACTGCCGCCCCTCCTGCCCCAGTCCATGCCCAGCATGCAC

TATCTTTTTCTAACCTTCATGAAATGCAGCCTTTGGCACATGGGGCCAGCACTGTGCTTC

CCTCAGTGAGCCAGTTGCTATCCCACCACCACATTGTGTCTCCAGGCAGTGGCAGTGCT

GGAAGCTTGAGTAGGCTCCATCCAGTCCCAGTCCCAGCAGATTGGATGAACCGCATGG

AGGTGAATGAGACCCAGTACAATGAGATGTTTGGTATGGTCCTGGCTCCAGCTGAGGG

CACCCATCCTGGCATAGCTCCCCAGAGCAGGCCACCTGAAGGGAAGCACATAACCACC

CCTCGGGAGCCCTTGCCCCCCATTGTGACTTTCCAGCTCATCCCTAAAGGCAGTATTGC

CCAACCAGCGGGGGCTCCCCAGCCTCAGTCCACCTGCCCTCCAGCTGTTGCGGGCCCC

CTGCCCACCATGTACCAGATTCCAGAAATGGCCCGTTTGCCCAGTGTGGCTTTCCCCAC

TGCCATGATGCCCCAGCAGGACGGGCAGGTAGCTCAGACCATTCTCCCAGCCTATCATC

CTTTCCCAGCCTCTGTGGGCAAGTACCCCACACCCCCTTCACAGCACAGTTATGCTTCC

TCAAATGCTGCTGAGCGAACACCCAGTCACAGTGGTCACCTCCAGGGTGAGCATCCCT

ACCTGACACCATCCCCAGAGTCTCCTGACCAGTGGTCAAGTTCATCACCCCACTCTGCT

TCTGACTGGTCAGATGTGACCACCAGCCCTACCCCTGGGGGTGCTGGAGGAGGTCAGC

GGGGACCTGGGACACACATGTCTGAGCCACCACACAACAACATGCAGGTTTATGCGTG

AGAGAGTCCACCTCCAGTGTAGAGACATAACTGACTTTTGTAAATGCTGCTGAGGAAC

AAATGAAGGTCATCCGGGAGAGAAATGAAGAAATCTCTGGAGCCAGCTTCTAGAGGTA

GGAAAGAGAAGATGTTCTTATTCAGATAATGCAAGAGAAGCAATTCGTCAGTTTCACTG

GGTATCTGCAAGGCTTATTGATTATTCTAATCTAATAAGACAAGTTTGTGGAAATGCAAG

ATGAATACAAGCCTTGGGTCCATGTTTACTCTCTTCTATTTGGAGAATAAGATGGATGCT

TATTGAAGCCCAGACATTCTTGCAGCTTGGACTGCATTTTAAGCCCTGCAGGCTTCTGC

CATATCCATGAGAAGATTCTACACTAGCGTCCTGTTGGGAATTATGCCCTGGAATTCTGC

CTGAATTGACCTACGCATCTCCTCCTCCTTGGACATTCTTTTGTCTTCATTTGGTGCTTTT

GGTTTTGCACCTCTCCGTGATTGTAGCCCTACCAGCATGTTATAGGGCAAGACCTTTGTG

CTTTTGATCATTCTGGCCCATGAAAGCAACTTTGGTCTCCTTTCCCCTCCTGTCTTCCCG

GTATCCCTTGGAGTCTCACAAGGTTTACTTTGGTATGGTTCTCAGCACAAACCTTTCAA

GTATGTTGTTTCTTTGGAAAATGGACATACTGTATTGTGTTCTCCTGCATATATCATTCCT

GGAGAGAGAAGGGGAGAAGAATACTTTTCTTCAACAAATTTTGGGGGCAGGAGATCCC

TTCAAGAGGCTGCACCTTAATTTTTCTTGTCTGTGTGCAGGTCTTCATATAAACTTTACC

AGGAAGAAGGGTGTGAGTTTGTTGTTTTTCTGTGTATGGGCCTGGTCAGTGTAAAGTTT

TATCCTTGATAGTCTAGTTACTATGACCCTCCCCACTTTTTTAAAACCAGAAAAAGGTTT

GGAATGTTGGAATGACCAAGAGACAAGTTAACTCGTGCAAGAGCCAGTTACCCACCCA

CAGGTCCCCCTACTTCCTGCCAAGCATTCCATTGACTGCCTGTATGGAACACATTTGTCC

CAGATCTGAGCATTCTAGGCCTGTTTCACTCACTCACCCAGCATATGAAACTAGTCTTAA

CTGTTGAGCCTTTCCTTTCATATCCACAGAAGACACTGTCTCAAATGTTGTACCCTTGCC

ATTTAGGACTGAACTTTCCTTAGCCCAAGGGACCCAGTGACAGTTGTCTTCCGTTTGTC

AGATGATCAGTCTCTACTGATTATCTTGCTGCTTAAAGGCCTGCTCACCAATCTTTCTTT

CACACCGTGTGGTCCGTGTTACTGGTATACCCAGTATGTTCTCACTGAAGACATGGACT

TTATATGTTCAAGTGCAGGAATTGGAAAGTTGGACTTGTTTTCTATGATCCAAAACAGC

CCTATAAGAAGGTTGGAAAAGGAGGAACTATATAGCAGCCTTTGCTATTTTCTGCTACC

ATTTCTTTTCCTCTGAAGCGGCCATGACATTCCCTTTGGCAACTAACGTAGAAACTCAA

CAGAACATTTTCCTTTCCTAGAGTCACCTTTTAGATGATAATGGACAACTATAGACTTGC

TCATTGTTCAGACTGATTGCCCCTCACCTGAATCCACTCTCTGTATTCATGCTCTTGGCA

ATTTCTTTGACTTTCTTTTAAGGGCAGAAGCATTTTAGTTAATTGTAGATAAAGAATAGT

TTTCTTCCTCTTCTCCTTGGGCCAGTTAATAATTGGTCCATGGCTACACTGCAACTTCCG

TCCAGTGCTGTGATGCCCATGACACCTGCAAAATAAGTTCTGCCTGGGCATTTTGTAGA

TATTAACAGGTGAATTCCCGACTCTTTTGGTTTGAATGACAGTTCTCATTCCTTCTATGG

CTGCAAGTATGCATCAGTGCTTCCCACTTACCTGATTTGTCTGTCGGTGGCCCCATATGG

AAACCCTGCGTGTCTGTTGGCATAATAGTTTACAAATGGTTTTTTCAGTCCTATCCAAAT

TTATTGAACCAACAAAAATAATTACTTCTGCCCTGAGATAAGCAGATTAAGTTTGTTCAT

TCTCTGCTTTATTCTCTCCATGTGGCAACATTCTGTCAGCCTCTTTCATAGTGTGCAAAC

ATTTTATCATTCTAAATGGTGACTCTCTGCCCTTGGACCCATTTATTATTCACAGATGGGG

AGAACCTATCTGCATGGACCTCTGTGGACCACAGCGTACCTGCCCCTTTCTGCCCTCCT

GCTCCAGCCCCACTTCTGAAAGTATCAGCTACTGATCCAGCCACTGGATATTTTATATCC

TCCCTTTTCCTTAAGCACAATGTCAGACCAAATTGCTTGTTTCTTTTTCTTGGACTACTT

TAATTTGGATCCTTTGGGTTTGGAGAAAGGGAATGTGAAAGCTGTCATTACAGACAACA

GGTTTCAGTGATGAGGAGGACAACACTGCCTTTCAAACTTTTTACTGATCTCTTAGATTT

TAAGAACTCTTGAATTGTGTGGTATCTAATAAAAGGGAAGGTAAGATGGATAATCACTT

TCTCATTTGGGTTCTGAATTGGAGACTCAGTTTTTATGAGACACATCTTTTATGCCATGT

ATAGATCCTCCCCTGCTATTTTTGGTTTATTTTTATTGTTATAAATGCTTTCTTTCTTTGAC

TCCTCTTCTGCCTGCCTTTGGGGATAGGTTTTTTTGTTTGTTTATTTGCTTCCTCTGTTTT

GTTTTAAGCATCATTTTCTTATGTGAGGTGGGGAAGGGAAAGGTATGAGGGAAAGAGAGTCTGAGAATTAAAATATTTTAGTATAAGCAATTGGCTGTGATGCTCAAATCCATTGCATCCTCTTATTGAATTTGCCAATTTGTAATTTTTGCATAATAAAGAACCAAAGGTGTAATGTTTTGTTGAGAGGTGGTTTAGGGATTTTGGCCCTAACCAATACATTGAATGTATGATGACTATTTGGGAGGACACATTTATGTACCCAGAGGCCCCCACTAATAAGTGGTACTATGGTTACTTCCTTGTGTACATTTCTCTTAAAAGTGATATTATATCTGTTTGTATGAGAAACCCAGTAACCAATAAAATGACCGCATATTCCTGACTAAACGTAGTAAGGAAAATGCACACTTTGTTTTTACTTTTCCGTTTCATTCTAAAGGTAGTTAAGATGAAATTTATATGAAAGCATTTTTATCACAAAATAAAAAAGGTTTGCCAAGCTCAGTGGTGTTGTATTTTTTATTTTCCAATACTGCATCCATGGCCTGGCAGTGTTACCTCATGATGTCATAATTTGCTGAGAGAGCAAATTTTCTTTTCTTTCTGAATCCCACAAAGCCTAGCACCAAACTTCTTTTTTTCTTCCTTTAATTAGATCATAAATAAATGATCCTGGGGAAAAAGCATCTGTCAAATAGGAAACATCACAAAACTGAGCACTCTTCTGTGCACTAGCCATAGCTGGTGACAAACAGATGGTTGCTCAGGGACAAGGTGCCTTCCAATGGAAATGCGAAGTAGTTGCTATAGCAAGAATTGGGAACTGGGATATAAGTCATAATATTAATTATGCTGTTATGTAAATGATTGGTTTGTAACATTCCTTAAGTGAAATTTGTGTAGAACTTAATATACAGGATTATAAAATAATATTTTGTGTATAAATTTGTTATAAGTTCACATTCATACATTTATTTATAAAGTCAGTGAGATATTTGAACATGAA

SEQ ID NO:704NOTCH2的外显子1的翻译多肽序列

MPALRPALLWALLALWLCCAAPAH

SEQ ID NO:705NOTCH2的外显子2的翻译多肽序列

LQCRDGYEPCVNEGMCVTYHNGTGYC

SEQ ID NO:706NOTCH2的外显子3的翻译多肽序列

CPEGFLGEYCQHRDPCEKNRCQNGGTCVAQAMLGKATCRCASGFTGEDCQYSTSHPCFVSRPCLNGGTCHMLSRDTYECTCQVGFT

SEQ ID NO:707NOTCH2的外显子4的翻译多肽序列

KECQWTDACLSHPCANGSTCTTVANQFSCKCLTGFTGQKCETDVNECDIPGHCQHGGTCLNLPGSYQCQCPQGFTGQYCDSLYVPCAPSPCVNGGTCRQTGDFTFECNCLP

SEQ ID NO:708NOTCH2的外显子5的翻译多肽序列

FEGSTCERNIDDCPNHRCQNGGVCVDGVNTYNCRCPPQWT

SEQ ID NO:709NOTCH2的外显子6的翻译多肽序列

QFCTEDVDECLLQPNACQNGGTCANRNGGYGCVCVNGWSGDDCSENIDDCAFASCTPGSTCIDRVASFSCMCPEGKA

SEQ ID NO:710NOTCH2的外显子7的翻译多肽序列

LLCHLDDACISNPCHKGALCDTNPLNGQYICTCPQGYKGADCTEDVDECAM

SEQ ID NO:711NOTCH2的外显子8-34的翻译多肽序列

NSNPCEHAGKCVNTDGAFHCECLKGYAGPRCEMDINECHSDPCQNDATCLDKIGGFTCLCMPGFKGVHCELEINECQSNPCVNNGQCVDKVNRFQCLCPPGFTGPVCQIDIDDCSSTPCLNGAKCIDHPNGYECQCATGFTGVLCEENIDNCDPDPCHHGQCQDGIDSYTCICNPGYMGAICSDQIDECYSSPCLNDGRCIDLVNGYQCNCQPGTSGVNCEINFDDCASNPCIHGICMDGINRYSCVCSPGFTGQRCNIDIDECASNPCRKGATCINGVNGFRCICPEGPHHPSCYSQVNECLSNPCIHGNCTGGLSGYKCLCDAGWVGINCEVDKNECLSNPCQNGGTCDNLVNGYRCTCKKGFKGYNCQVNIDECASNPCLNQGTCFDDISGYTCHCVLPYTGKNCQTVLAPCSPNPCENAAVCKESPNFESYTCLCAPGWQGQRCTIDIDECISKPCMNHGLCHNTQGSYMCECPPGFSGMDCEEDIDDCLANPCQNGGSCMDGVNTFSCLCLPGFTGDKCQTDMNECLSEPCKNGGTCSDYVNSYTCKCQAGFDGVHCENNINECTESSCFNGGTCVDGINSFSCLCPVGFTGSFCLHEINECSSHPCLNEGTCVDGLGTYRCSCPLGYTGKNCQTLVNLCSRSPCKNKGTCVQKKAESQCLCPSGWAGAYCDVPNVSCDIAASRRGVLVEHLCQHSGVCINAGNTHYCQCPLGYTGSYCEEQLDECASNPCQHGATCSDFIGGYRCECVPGYQGVNCEYEVDECQNQPCQNGGTCIDLVNHFKCSCPPGTRGLLCEENIDDCARGPHCLNGGQCMDRIGGYSCRCLPGFAGERCEGDINECLSNPCSSEGSLDCIQLTNDYLCVCRSAFTGRHCETFVDVCPQMPCLNGGTCAVASNMPDGFICRCPPGFSGARCQSSCGQVKCRKGEQCVHTASGPRCFCPSPRDCESGCASSPCQHGGSCHPQRQPPYYSCQCAPPFSGSRCELYTAPPSTPPATCLSQYCADKARDGVCDEACNSHACQWDGGDCSLTMENPWANCSSPLPCWDYINNQCDELCNTVECLFDNFECQGNSKTCKYDKYCADHFKDNHCDQGCNSEECGWDGLDCAADQPENLAEGTLVIVVLMPPEQLLQDARSFLRALGTLLHTNLRIKRDSQGELMVYPYYGEKSAAMKKQRMTRRSLPGEQEQEVAGSKVFLEIDNRQCVQDSDHCFKNTDAAAALLASHAIQGTLSYPLVSVVSESLTPERTQLLYLLAVAVVIILFIILLGVIMAKRKRKHGSLWLPEGFTLRRDASNHKRREPVGQDAVGLKNLSVQVSEANLIGTGTSEHWVDDEGPQPKKVKAEDEALLSEEDDPIDRRPWTQQHLEAADIRRTPSLALTPPQAEQEVDVLDVNVRGPDGCTPLMLASLRGGSSDLSDEDEDAEDSSANIITDLVYQGASLQAQTDRTGEMALHLAARYSRADAAKRLLDAGADANAQDNMGRCPLHAAVAADAQGVFQILIRNRVTDLDARMNDGTTPLILAARLAVEGMVAELINCQADVNAVDDHGKSALHWAAAVNNVEATLLLLKNGANRDMQDNKEETPLFLAAREGSYEAAKILLDHFANRDITDHMDRLPRDVARDRMHHDIVRLLDEYNVTPSPPGTVLTSALSPVICGPNRSFLSLKHTPMGKKSRRPSAKSTMPTSLPNLAKEAKDAKGSRRKKSLSEKVQLSESSVTLSPVDSLESPHTYVSDTTSSPMITSPGILQASPNPMLATAAPPAPVHAQHALSFSNLHEMQPLAHGASTVLPSVSQLLSHHHIVSPGSGSAGSLSRLHPVPVPADWMNRMEVNETQYNEMFGMVLAPAEGTHPGIAPQSRPPEGKHITTPREPLPPIVTFQLIPKGSIAQPAGAPQPQSTCPPAVAGPLPTMYQIPEMARLPSVAFPTAMMPQQDGQVAQTILPAYHPFPASVGKYPTPPSQHSYASSNAAERTPSHSGHLQGEHPYLTPSPESPDQWSSSSPHSASDWSDVTTSPTPGGAGGGQRGPGTHMSEPPHNNMQVYA

SEQ ID NO:712NOTCH2的全蛋白质序列

MPALRPALLWALLALWLCCAAPAHALQCRDGYEPCVNEGMCVTYHNGTGYCKCPEGFLGEYCQHRDPCEKNRCQNGGTCVAQAMLGKATCRCASGFTGEDCQYSTSHPCFVSRPCLNGGTCHMLSRDTYECTCQVGFTGKECQWTDACLSHPCANGSTCTTVANQFSCKCLTGFTGQKCETDVNECDIPGHCQHGGTCLNLPGSYQCQCPQGFTGQYCDSLYVPCAPSPCVNGGTCRQTGDFTFECNCLPGFEGSTCERNIDDCPNHRCQNGGVCVDGVNTYNCRCPPQWTGQFCTEDVDECLLQPNACQNGGTCANRNGGYGCVCVNGWSGDDCSENIDDCAFASCTPGSTCIDRVASFSCMCPEGKAGLLCHLDDACISNPCHKGALCDTNPLNGQYICTCPQGYKGADCTEDVDECAMANSNPCEHAGKCVNTDGAFHCECLKGYAGPRCEMDINECHSDPCQNDATCLDKIGGFTCLCMPGFKGVHCELEINECQSNPCVNNGQCVDKVNRFQCLCPPGFTGPVCQIDIDDCSSTPCLNGAKCIDHPNGYECQCATGFTGVLCEENIDNCDPDPCHHGQCQDGIDSYTCICNPGYMGAICSDQIDECYSSPCLNDGRCIDLVNGYQCNCQPGTSGVNCEINFDDCASNPCIHGICMDGINRYSCVCSPGFTGQRCNIDIDECASNPCRKGATCINGVNGFRCICPEGPHHPSCYSQVNECLSNPCIHGNCTGGLSGYKCLCDAGWVGINCEVDKNECLSNPCQNGGTCDNLVNGYRCTCKKGFKGYNCQVNIDECASNPCLNQGTCFDDISGYTCHCVLPYTGKNCQTVLAPCSPNPCENAAVCKESPNFESYTCLCAPGWQGQRCTIDIDECISKPCMNHGLCHNTQGSYMCECPPGFSGMDCEEDIDDCLANPCQNGGSCMDGVNTFSCLCLPGFTGDKCQTDMNECLSEPCKNGGTCSDYVNSYTCKCQAGFDGVHCENNINECTESSCFNGGTCVDGINSFSCLCPVGFTGSFCLHEINECSSHPCLNEGTCVDGLGTYRCSCPLGYTGKNCQTLVNLCSRSPCKNKGTCVQKKAESQCLCPSGWAGAYCDVPNVSCDIAASRRGVLVEHLCQHSGVCINAGNTHYCQCPLGYTGSYCEEQLDECASNPCQHGATCSDFIGGYRCECVPGYQGVNCEYEVDECQNQPCQNGGTCIDLVNHFKCSCPPGTRGLLCEENIDDCARGPHCLNGGQCMDRIGGYSCRCLPGFAGERCEGDINECLSNPCSSEGSLDCIQLTNDYLCVCRSAFTGRHCETFVDVCPQMPCLNGGTCAVASNMPDGFICRCPPGFSGARCQSSCGQVKCRKGEQCVHTASGPRCFCPSPRDCESGCASSPCQHGGSCHPQRQPPYYSCQCAPPFSGSRCELYTAPPSTPPATCLSQYCADKARDGVCDEACNSHACQWDGGDCSLTMENPWANCSSPLPCWDYINNQCDELCNTVECLFDNFECQGNSKTCKYDKYCADHFKDNHCDQGCNSEECGWDGLDCAADQPENLAEGTLVIVVLMPPEQLLQDARSFLRALGTLLHTNLRIKRDSQGELMVYPYYGEKSAAMKKQRMTRRSLPGEQEQEVAGSKVFLEIDNRQCVQDSDHCFKNTDAAAALLASHAIQGTLSYPLVSVVSESLTPERTQLLYLLAVAVVIILFIILLGVIMAKRKRKHGSLWLPEGFTLRRDASNHKRREPVGQDAVGLKNLSVQVSEANLIGTGTSEHWVDDEGPQPKKVKAEDEALLSEEDDPIDRRPWTQQHLEAADIRRTPSLALTPPQAEQEVDVLDVNVRGPDGCTPLMLASLRGGSSDLSDEDEDAEDSSANIITDLVYQGASLQAQTDRTGEMALHLAARYSRADAAKRLLDAGADANAQDNMGRCPLHAAVAADAQGVFQILIRNRVTDLDARMNDGTTPLILAARLAVEGMVAELINCQADVNAVDDHGKSALHWAAAVNNVEATLLLLKNGANRDMQDNKEETPLFLAAREGSYEAAKILLDHFANRDITDHMDRLPRDVARDRMHHDIVRLLDEYNVTPSPPGTVLTSALSPVICGPNRSFLSLKHTPMGKKSRRPSAKSTMPTSLPNLAKEAKDAKGSRRKKSLSEKVQLSESSVTLSPVDSLESPHTYVSDTTSSPMITSPGILQASPNPMLATAAPPAPVHAQHALSFSNLHEMQPLAHGASTVLPSVSQLLSHHHIVSPGSGSAGSLSRLHPVPVPADWMNRMEVNETQYNEMFGMVLAPAEGTHPGIAPQSRPPEGKHITTPREPLPPIVTFQLIPKGSIAQPAGAPQPQSTCPPAVAGPLPTMYQIPEMARLPSVAFPTAMMPQQDGQVAQTILPAYHPFPASVGKYPTPPSQHSYASSNAAERTPSHSGHLQGEHPYLTPSPESPDQWSSSSPHSASDWSDVTTSPTPGGAGGGQRGPGTHMSEPPHNNMQVYA

SEQ ID NO:713NOTCH2的全部外显子1-6按顺序排列的多核苷酸序列

SEQ ID NO:714NOTCH2的全部外显子1-6按顺序排列的翻译多肽序列

CD74序列信息

SEQ ID NO:715来自CD74-NRG1融合物5’处的CD74外显子2的序列

AGGGCCGGCTGGACAAACTGACAGTCACCTCCCAGAACCTGCAGCTGGAGAACCTGCGCATGAAGCTTCCCAAGC

SEQ ID NO:716CD74-NRG1融合物3’处的NRG1外显子2序列

CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA

SEQ ID NO:717CD74-NRG1多核苷酸序列

AGGGCCGGCTGGACAAACTGACAGTCACCTCCCAGAACCTGCAGCTGGAGAACCTGCGCATGAAGCTTCCCAAGCCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA

SEQ ID NO:718CD74-NRG1多肽序列

GRLDKLTVTSQNLQLENLRMKLPKPLPPRLKEMKSQESAAGSKLVLRCE

SEQ ID NO:719CD74的外显子1

ATCCTGCCCCGCAAAAGGCAGCTTCACCAAAGTGGGGTATTTCCAGCCTTTGTAGCTTTCACTTCCACATCTACCAAGTGGGCGGAGTGGCCTTCTGTGGACGAATCAGATTCCTCTCCAGCACCGACTTTAAGAGGCGAGCCGGGGGGTCAGGGTCCCAGATGCACAGGAGGAGAAGCAGGAGCTGTCGGGAAGATCAGAAGCCAGTCATGGATGACCAGCGCGACCTTATCTCCAACAATGAGCAACTGCCCATGCTGGGCCGGCGCCCTGGGGCCCCGGAGAG

SEQ ID NO:720CD74的外显子2

CAAGTGCAGCCGCGGAGCCCTGTACACAGGCTTTTCCATCCTGGTGACTCTGCTCCTCGCTGGCCAGGCCACCACCGCCTACTTCCTGTACCAGCAGCAGGGCCGGCTGGACAAACTGACAGTCACCTCCCAGAACCTGCAGCTGGAGAACCTGCGCATGAAGCTTCCCAAGC

SEQ ID NO:721CD74的外显子3

CTCCCAAGCCTGTGAGCAAGATGCGCATGGCCACCCCGCTGCTGATGCAGGCGCTGCCCATGGGAGCCCTGCCCCAGGGG

SEQ ID NO:722CD74的外显子4

CCCATGCAGAATGCCACCAAGTATGGCAACATGACAGAGGACCATGTGATGCACCTGCTCCAG

SEQ ID NO:723CD74的外显子5

AATGCTGACCCCCTGAAGGTGTACCCGCCACTGAAGGGGAGCTTCCCGGAGAACCTGAGACACCTTAAGAACACCATGGAGACCATAGACTGGAAG

SEQ ID NO:724CD74的外显子6

GTCTTTGAGAGCTGGATGCACCATTGGCTCCTGTTTGAAATGAGCAGGCACTCCTTGGAGCAAAAGCCCACTGACGCTCCACCGAAAG

SEQ ID NO:725CD74的外显子7

TACTGACCAAGTGCCAGGAAGAGGTCAGCCACATCCCTGCTGTCCACCCGGGTTCATTCAGGCCCAAGTGCGACGAGAACGGCAACTATCTGCCACTCCAGTGCTATGGGAGCATCGGCTACTGCTGGTGTGTCTTCCCCAACGGCACGGAGGTCCCCAACACCAGAAGCCGCGGGCACCATAACTGCAGTG

SEQ ID NO:726CD74的外显子8

AGTCACTGGAACTGGAGGACCCGTCTTCTGGGCTGGGTGTGACCAAGCAGGATCTGGGCCCAG

SEQ ID NO:727CD74的外显子9

TCCCCATGTGAGAGCAGCAGAGGCGGTCTTCAACATCCTGCCAGCCCCACACAGCTACAGCTTTCTTGCTCCCTTCAGCCCCCAGCCCCTCCCCCATCTCCCACCCTGTACCTCATCCCATGAGACCCTGGTGCCTGGCTCTTTCGTCACCCTTGGACAAGACAAACCAAGTCGGAACAGCAGATAACAATGCAGCAAGGCCCTGCTGCCCAATCTCCATCTGTCAACAGGGGCGTGAGGTCCCAGGAAGTGGCCAAAAGCTAGACAGATCCCCGTTCCTGACATCACAGCAGCCTCCAACACAAGGCTCCAAGACCTAGGCTCATGGACGAGATGGGAAGGCACAGGGAGAAGGGATAACCCTACACCCAGACCCCAGGCTGGACATGCTGACTGTCCTCTCCCCTCCAGCCTTTGGCCTTGGCTTTTCTAGCCTATTTACCTGCAGGCTGAGCCACTCTCTTCCCTTTCCCCAGCATCACTCCCCAAGGAAGAGCCAATGTTTTCCACCCATAATCCTTTCTGCCGACCCCTAGTTCCCTCTGCTCAGCCAAGCTTGTTATCAGCTTTCAGGGCCATGGTTCACATTAGAATAAAAGGTAGTAATTAGAA

SEQ ID NO:728CD74的全mRNA多核苷酸序列

ATCCTGCCCCGCAAAAGGCAGCTTCACCAAAGTGGGGTATTTCCAGCCTTTGTAGCTTTCACTTCCACATCTACCAAGTGGGCGGAGTGGCCTTCTGTGGACGAATCAGATTCCTCTCCAGCACCGACTTTAAGAGGCGAGCCGGGGGGTCAGGGTCCCAGATGCACAGGAGGAGAAGCAGGAGCTGTCGGGAAGATCAGAAGCCAGTCATGGATGACCAGCGCGACCTTATCTCCAACAATGAGCAACTGCCCATGCTGGGCCGGCGCCCTGGGGCCCCGGAGAGCAAGTGCAGCCGCGGAGCCCTGTACACAGGCTTTTCCATCCTGGTGACTCTGCTCCTCGCTGGCCAGGCCACCACCGCCTACTTCCTGTACCAGCAGCAGGGCCGGCTGGACAAACTGACAGTCACCTCCCAGAACCTGCAGCTGGAGAACCTGCGCATGAAGCTTCCCAAGCCTCCCAAGCCTGTGAGCAAGATGCGCATGGCCACCCCGCTGCTGATGCAGGCGCTGCCCATGGGAGCCCTGCCCCAGGGGCCCATGCAGAATGCCACCAAGTATGGCAACATGACAGAGGACCATGTGATGCACCTGCTCCAGAATGCTGACCCCCTGAAGGTGTACCCGCCACTGAAGGGGAGCTTCCCGGAGAACCTGAGACACCTTAAGAACACCATGGAGACCATAGACTGGAAGGTCTTTGAGAGCTGGATGCACCATTGGCTCCTGTTTGAAATGAGCAGGCACTCCTTGGAGCAAAAGCCCACTGACGCTCCACCGAAAGTACTGACCAAGTGCCAGGAAGAGGTCAGCCACATCCCTGCTGTCCACCCGGGTTCATTCAGGCCCAAGTGCGACGAGAACGGCAACTATCTGCCACTCCAGTGCTATGGGAGCATCGGCTACTGCTGGTGTGTCTTCCCCAACGGCACGGAGGTCCCCAACACCAGAAGCCGCGGGCACCATAACTGCAGTGAGTCACTGGAACTGGAGGACCCGTCTTCTGGGCTGGGTGTGACCAAGCAGGATCTGGGCCCAGTCCCCATGTGAGAGCAGCAGAGGCGGTCTTCAACATCCTGCCAGCCCCACACAGCTACAGCTTTCTTGCTCCCTTCAGCCCCCAGCCCCTCCCCCATCTCCCACCCTGTACCTCATCCCATGAGACCCTGGTGCCTGGCTCTTTCGTCACCCTTGGACAAGACAAACCAAGTCGGAACAGCAGATAACAATGCAGCAAGGCCCTGCTGCCCAATCTCCATCTGTCAACAGGGGCGTGAGGTCCCAGGAAGTGGCCAAAAGCTAGACAGATCCCCGTTCCTGACATCACAGCAGCCTCCAACACAAGGCTCCAAGACCTAGGCTCATGGACGAGATGGGAAGGCACAGGGAGAAGGGATAACCCTACACCCAGACCCCAGGCTGGACATGCTGACTGTCCTCTCCCCTCCAGCCTTTGGCCTTGGCTTTTCTAGCCTATTTACCTGCAGGCTGAGCCACTCTCTTCCCTTTCCCCAGCATCACTCCCCAAGGAAGAGCCAATGTTTTCCACCCATAATCCTTTCTGCCGACCCCTAGTTCCCTCTGCTCAGCCAAGCTTGTTATCAGCTTTCAGGGCCATGGTTCACATTAGAATAAAAGGTAGTAATTAGAA

SEQ ID NO:729CD74的外显子1的翻译多肽序列

MHRRRSRSCREDQKPVMDDQRDLISNNEQLPMLGRRPGAPE

SEQ ID NO:730CD74的外显子2的翻译多肽序列

KCSRGALYTGFSILVTLLLAGQATTAYFLYQQQGRLDKLTVTSQNLQLENLRMKLPK

SEQ ID NO:731CD74的外显子3的翻译多肽序列

PKPVSKMRMATPLLMQALPMGALPQG

SEQ ID NO:732CD74的外显子4的翻译多肽序列

PMQNATKYGNMTEDHVMHLLQ

SEQ ID NO:733CD74的外显子5的翻译多肽序列

NADPLKVYPPLKGSFPENLRHLKNTMETIDWK

SEQ ID NO:734CD74的外显子6的翻译多肽序列

VFESWMHHWLLFEMSRHSLEQKPTDAPPK

SEQ ID NO:735CD74的外显子7的翻译多肽序列

LTKCQEEVSHIPAVHPGSFRPKCDENGNYLPLQCYGSIGYCWCVFPNGTEVPNTRSRGHHNCS

SEQ ID NO:736CD74的外显子8的翻译多肽序列

SLELEDPSSGLGVTKQDLGP

SEQ ID NO:737CD74的外显子9的翻译多肽序列

PM

SEQ ID NO:738CD74的全蛋白质序列

MHRRRSRSCREDQKPVMDDQRDLISNNEQLPMLGRRPGAPESKCSRGALYTGFSILVTLLLAGQATTAYFLYQQQGRLDKLTVTSQNLQLENLRMKLPKPPKPVSKMRMATPLLMQALPMGALPQGPMQNATKYGNMTEDHVMHLLQNADPLKVYPPLKGSFPENLRHLKNTMETIDWKVFESWMHHWLLFEMSRHSLEQKPTDAPPKVLTKCQEEVSHIPAVHPGSFRPKCDENGNYLPLQCYGSIGYCWCVFPNGTEVPNTRSRGHHNCSESLELEDPSSGLGVTKQDLGPVPM

SEQ ID NO:739CD74的全部外显子1-2按顺序排列的多核苷酸序列

SEQ ID NO:740CD74的全部外显子1-2按顺序排列的翻译多肽序列

SDC4序列信息

SEQ ID NO:741来自SDC4-NRG1融合物5’处的SDC4外显子2的序列

TACCAGACGATGAGGATGTAGTGGGGCCCGGGCAGGAATCTGATGACTTTGAGCTGTCTGGCTCTGGAGATCTGG

SEQ ID NO:742SDC4-NRG1融合物3’处的NRG1外显子2序列

CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA

SEQ ID NO:743SDC4-NRG1多核苷酸序列

TACCAGACGATGAGGATGTAGTGGGGCCCGGGCAGGAATCTGATGACTTTGAGCTGTCTGGCTCTGGAGATCTGGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA

SEQ ID NO:744SDC4-NRG1多肽序列

PDDEDVVGPGQESDDFELSGSGDLALPPRLKEMKSQESAAGSKLVLRCE

SEQ ID NO:745SDC4的外显子1

ACTCGCCGCAGCCTGCGCGCCTTCTCCAGTCCGCGGTGCCATGGCCCCCGCCCGTCTGTTCGCGCTGCTGCTGTTCTTCGTAGGCGGAGTCGCCGAGTCG

SEQ ID NO:746SDC4的外显子2

ATCCGAGAGACTGAGGTCATCGACCCCCAGGACCTCCTAGAAGGCCGATACTTCTCCGGAGCCCTACCAGACGATGAGGATGTAGTGGGGCCCGGGCAGGAATCTGATGACTTTGAGCTGTCTGGCTCTGGAGATCTGG

SEQ ID NO:747SDC4的外显子3

ATGACTTGGAAGACTCCATGATCGGCCCTGAAGTTGTCCATCCCTTG

SEQ ID NO:748SDC4的外显子4

GTGCCTCTAGATAACCATATCCCTGAGAGGGCAGGGTCTGGGAGCCAAGTCCCCACCGAACCCAAGAAACTAGAGGAGAATGAGGTTATCCCCAAGAGAATCTCACCCGTTGAAGAGAGTGAGGATGTGTCCAACAAGGTGTCAATGTCCAGCACTGTGCAGGGCAGCAACATCTTTGAGAGAACGGAGGTCCTGGCAG

SEQ ID NO:749SDC4的外显子5

CTCTGATTGTGGGTGGCATCGTGGGCATCCTCTTTGCCGTCTTCCTGATCCTACTGCTCATGTACCGTATGAAGAAGAAGGATGAAGGCAGCTATGACCTGGGCAAGAAACCCATCTACAAGAAAGCCCCCACCAATGAGTTCTACGCGTGAAGCTTGCTTGTGGGCACTGGCTTGGACTTTAGCGGGGAGGGAAGCCAGGGGATTTTGAAGGGTGGACATTAGGGTAGGGTGAGGTCAACCTAATACTGACTTGTCAGTATCTCCAGCTCTGATTACCTTTGAAGTGTTCAGAAGAGACATTGTCTTCTACTGTTCTGCCAGGTTCTTCTTGAGCTTTGGGCCTCAGTTGCCCTGGCAGAAAAATGGATTCAACTTGGCCTTTCTGAAGGCAAGACTGGGATTGGATCACTTCTTAAACTTCCAGTTAAGAATCTAGGTCCGCCCTCAAGCCCATACTGACCATGCCTCATCCAGAGCTCCTCTGAAGCCAGGGGGCTAACGGATGTTGTGTGGAGTCCTGGCTGGAGGTCCTCCCCCAGTGGCCTTCCTCCCTTCCTTTCACAGCCGGTCTCTCTGCCAGGAAATGGGGGAAGGAACTAGAACCACCTGCACCTTGAGATGTTTCTGTAAATGGGTACTTGTGATCACACTACGGGAATCTCTGTGGTATATACCTGGGGCCATTCTAGGCTCTTTCAAGTGACTTTTGGAAATCAACCTTTTTTATTTGGGGGGGAGGATGGGGAAAAGAGCTGAGAGTTTATGCTGAAATGGATTTATAGAATATTTGTAAATCTATTTTTAGTGTTTGTTCGTTTTTTTAACTGTTCATTCCTTTGTGCAGAGTGTATATCTCTGCCTGGGCAAGAGTGTGGAGGTGCCGAGGTGTCTTCATTCTCTCGCACATTTCCACAGCACCTGCTAAGTTTGTATTTAATGGTTTTTGTTTTTGTTTTTGTTTGTTTCTTGAAAATGAGAGAAGAGCCGGAGAGATGATTTTTATTAATTTTTTTTTTTTTTTTTTTTTTTTACTATTTATAGCTTTAGATAGGGCCTCCCTTCCCCTCTTCTTTCTTTGTTCTCTTTCATTAAACCCCTTCCCCAGTTTTTTTTTTATACTTTAAACCCCGCTCCTCATGGCCTTGGCCCTTTCTGAAGCTGCTTCCTCTTATAAAATAGCTTTTGCCGAAACATAGTTTTTTTTTAGCAGATCCCAAAATATAATGAAGGGGATGGTGGGATATTTGTGTCTGTGTTCTTATAATATATTATTATTCTTCCTTGGTTCTAGAAAAATAGATAAATATATTTTTTTCAGGAAATAGTGTGGTGTTTCCAGTTTGATGTTGCTGGGTGGTTGAGTGAGTGAATTTTCATGTGGCTGGGTGGGTTTTTGCCTTTTTCTCTTGCCCTGTTCCTGGTGCCTTCTGATGGGGCTGGAATAGTTGAGGTGGATGGTTCTACCCTTTCTGCCTTCTGTTTGGGACCCAGCTGGTGTTCTTTGGTTTGCTTTCTTCAGGCTCTAGGGCTGTGCTATCCAATACAGTAACCACATGCGGCTGTTTAAAGTTAAGCCAATTAAAATCACATAAGATTAAAAATTCCTTCCTCAGTTGCACTAACCACGTTTCTAGAGGCGTCACTGTATGTAGTTCATGGCTACTGTACTGACAGCGAGAGCATGTCCATCTGTTGGACAGCACTATTCTAGAGAACTAAACTGGCTTAACGAGTCACAGCCTCAGCTGTGCTGGGACGACCCTTGTCTCCCTGGGTAGGGGGGGGGGAATGGGGGAGGGCTGATGAGGCCCCAGCTGGGGCCTGTTGTCTGGGACCCTCCCTCTCCTGAGAGGGGAGGCCTGGTGGCTTAGCCTGGGCAGGTCGTGTCTCCTCCTGACCCCAGTGGCTGCGGTGAGGGGAACCACCCTCCCTTGCTGCACCAGTGGCCATTAGCTCCCGTCACCACTGCAACCCAGGGTCCCAGCTGGCTGGGTCCTCTTCTGCCCCCAGTGCCCTTCCCCTTGGGCTGTGTTGGAGTGAGCACCTCCTCTGTAGGCACCTCTCACACTGTTGTCTGTTACTGATTTTTTTTGATAAAAAGATAATAAAACCTGGTACTTTCTAAA

SEQ ID NO:750SDC4的全mRNA多核苷酸序列

ACTCGCCGCAGCCTGCGCGCCTTCTCCAGTCCGCGGTGCCATGGCCCCCGCCCGTCTGTTCGCGCTGCTGCTGTTCTTCGTAGGCGGAGTCGCCGAGTCGATCCGAGAGACTGAGGTCATCGACCCCCAGGACCTCCTAGAAGGCCGATACTTCTCCGGAGCCCTACCAGACGATGAGGATGTAGTGGGGCCCGGGCAGGAATCTGATGACTTTGAGCTGTCTGGCTCTGGAGATCTGGATGACTTGGAAGACTCCATGATCGGCCCTGAAGTTGTCCATCCCTTGGTGCCTCTAGATAACCATATCCCTGAGAGGGCAGGGTCTGGGAGCCAAGTCCCCACCGAACCCAAGAAACTAGAGGAGAATGAGGTTATCCCCAAGAGAATCTCACCCGTTGAAGAGAGTGAGGATGTGTCCAACAAGGTGTCAATGTCCAGCACTGTGCAGGGCAGCAACATCTTTGAGAGAACGGAGGTCCTGGCAGCTCTGATTGTGGGTGGCATCGTGGGCATCCTCTTTGCCGTCTTCCTGATCCTACTGCTCATGTACCGTATGAAGAAGAAGGATGAAGGCAGCTATGACCTGGGCAAGAAACCCATCTACAAGAAAGCCCCCACCAATGAGTTCTACGCGTGAAGCTTGCTTGTGGGCACTGGCTTGGACTTTAGCGGGGAGGGAAGCCAGGGGATTTTGAAGGGTGGACATTAGGGTAGGGTGAGGTCAACCTAATACTGACTTGTCAGTATCTCCAGCTCTGATTACCTTTGAAGTGTTCAGAAGAGACATTGTCTTCTACTGTTCTGCCAGGTTCTTCTTGAGCTTTGGGCCTCAGTTGCCCTGGCAGAAAAATGGATTCAACTTGGCCTTTCTGAAGGCAAGACTGGGATTGGATCACTTCTTAAACTTCCAGTTAAGAATCTAGGTCCGCCCTCAAGCCCATACTGACCATGCCTCATCCAGAGCTCCTCTGAAGCCAGGGGGCTAACGGATGTTGTGTGGAGTCCTGGCTGGAGGTCCTCCCCCAGTGGCCTTCCTCCCTTCCTTTCACAGCCGGTCTCTCTGCCAGGAAATGGGGGAAGGAACTAGAACCACCTGCACCTTGAGATGTTTCTGTAAATGGGTACTTGTGATCACACTACGGGAATCTCTGTGGTATATACCTGGGGCCATTCTAGGCTCTTTCAAGTGACTTTTGGAAATCAACCTTTTTTATTTGGGGGGGAGGATGGGGAAAAGAGCTGAGAGTTTATGCTGAAATGGATTTATAGAATATTTGTAAATCTATTTTTAGTGTTTGTTCGTTTTTTTAACTGTTCATTCCTTTGTGCAGAGTGTATATCTCTGCCTGGGCAAGAGTGTGGAGGTGCCGAGGTGTCTTCATTCTCTCGCACATTTCCACAGCACCTGCTAAGTTTGTATTTAATGGTTTTTGTTTTTGTTTTTGTTTGTTTCTTGAAAATGAGAGAAGAGCCGGAGAGATGATTTTTATTAATTTTTTTTTTTTTTTTTTTTTTTTACTATTTATAGCTTTAGATAGGGCCTCCCTTCCCCTCTTCTTTCTTTGTTCTCTTTCATTAAACCCCTTCCCCAGTTTTTTTTTTATACTTTAAACCCCGCTCCTCATGGCCTTGGCCCTTTCTGAAGCTGCTTCCTCTTATAAAATAGCTTTTGCCGAAACATAGTTTTTTTTTAGCAGATCCCAAAATATAATGAAGGGGATGGTGGGATATTTGTGTCTGTGTTCTTATAATATATTATTATTCTTCCTTGGTTCTAGAAAAATAGATAAATATATTTTTTTCAGGAAATAGTGTGGTGTTTCCAGTTTGATGTTGCTGGGTGGTTGAGTGAGTGAATTTTCATGTGGCTGGGTGGGTTTTTGCCTTTTTCTCTTGCCCTGTTCCTGGTGCCTTCTGATGGGGCTGGAATAGTTGAGGTGGATGGTTCTACCCTTTCTGCCTTCTGTTTGGGACCCAGCTGGTGTTCTTTGGTTTGCTTTCTTCAGGCTCTAGGGCTGTGCTATCCAATACAGTAACCACATGCGGCTGTTTAAAGTTAAGCCAATTAAAATCACATAAGATTAAAAATTCCTTCCTCAGTTGCACTAACCACGTTTCTAGAGGCGTCACTGTATGTAGTTCATGGCTACTGTACTGACAGCGAGAGCATGTCCATCTGTTGGACAGCACTATTCTAGAGAACTAAACTGGCTTAACGAGTCACAGCCTCAGCTGTGCTGGGACGACCCTTGTCTCCCTGGGTAGGGGGGGGGGAATGGGGGAGGGCTGATGAGGCCCCAGCTGGGGCCTGTTGTCTGGGACCCTCCCTCTCCTGAGAGGGGAGGCCTGGTGGCTTAGCCTGGGCAGGTCGTGTCTCCTCCTGACCCCAGTGGCTGCGGTGAGGGGAACCACCCTCCCTTGCTGCACCAGTGGCCATTAGCTCCCGTCACCACTGCAACCCAGGGTCCCAGCTGGCTGGGTCCTCTTCTGCCCCCAGTGCCCTTCCCCTTGGGCTGTGTTGGAGTGAGCACCTCCTCTGTAGGCACCTCTCACACTGTTGTCTGTTACTGATTTTTTTTGATAAAAAGATAATAAAACCTGGTACTTTCTAAA

SEQ ID NO:751SDC4的外显子1的翻译多肽序列

MAPARLFALLLFFVGGVAES

SEQ ID NO:752SDC4的外显子2的翻译多肽序列

IRETEVIDPQDLLEGRYFSGALPDDEDVVGPGQESDDFELSGSGDL

SEQ ID NO:753SDC4的外显子3的翻译多肽序列

DLEDSMIGPEVVHPL

SEQ ID NO:754SDC4的外显子4的翻译多肽序列

VPLDNHIPERAGSGSQVPTEPKKLEENEVIPKRISPVEESEDVSNKVSMSSTVQGSNIFERTEVLA

SEQ ID NO:755SDC4的外显子5的翻译多肽序列

LIVGGIVGILFAVFLILLLMYRMKKKDEGSYDLGKKPIYKKAPTNEFYA

SEQ ID NO:756SDC4的全蛋白质序列

MAPARLFALLLFFVGGVAESIRETEVIDPQDLLEGRYFSGALPDDEDVVGPGQESDDFELSGSGDLDDLEDSMIGPEVVHPLVPLDNHIPERAGSGSQVPTEPKKLEENEVIPKRISPVEESEDVSNKVSMSSTVQGSNIFERTEVLAALIVGGIVGILFAVFLILLLMYRMKKKDEGSYDLGKKPIYKKAPTNEFYA

SEQ ID NO:757SDC4的全部外显子1-2按顺序排列的多核苷酸序列

SEQ ID NO:758SDC4的全部外显子1-2按顺序排列的翻译多肽序列

CD44(2)序列信息

SEQ ID NO:759来自CD44-NRG1融合物5’处的CD44外显子5的序列

TTTCTACTGTACACCCCATCCCAGACGAAGACAGTCCCTGGATCACCGACAGCACAGACAGAATCCCTGCTACCA

SEQ ID NO:760CD44-NRG1融合物3’处的NRG1外显子6序列

CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG

SEQ ID NO:761CD44-NRG1多核苷酸序列

TTTCTACTGTACACCCCATCCCAGACGAAGACAGTCCCTGGATCACCGACAGCACAGACAGAATCCCTGCTACCACTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG

SEQ ID NO:762CD44-NRG1多肽序列

STVHPIPDEDSPWITDSTDRIPATTTSTSTTGTSHLVKCAEKEKTFCVN

SLC4A4序列信息

SEQ ID NO:763来自SLC4A4-NRG1融合物5’处的SLC4A4外显子14的序列

ACTACCCCATCAACTCCAACTTCAAAGTGGGCTACAACACTCTCTTTTCCTGTACCTGTGTGCCACCTGACCCAG

SEQ ID NO:764SLC4A4-NRG1融合物3’处的NRG1外显子6序列

CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG

SEQ ID NO:765SCL4A4-NRG1多核苷酸序列

ACTACCCCATCAACTCCAACTTCAAAGTGGGCTACAACACTCTCTTTTCCTGTACCTGTGTGCCACCTGACCCAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG

SEQ ID NO:766SCL4A4-NRG1多肽序列

YPINSNFKVGYNTLFSCTCVPPDPATSTSTTGTSHLVKCAEKEKTFCVN

SEQ ID NO:767SLC4A4的外显子1

GGCGGCGCGCCGGGCAGCGCTTCGGTGGCGGCGGCGGCCGCGGTGGCAGCGAAGGCGGCGGCGGCGGCGGCAGTGGCAGTGGCCGCTGCAGCCCCACACTCCGCCGCCAAACTGGAGGAGCGACGGAAGCCAGACCCCAGGAG

SEQ ID NO:768SLC4A4的外显子2

GATGGAGGATGAAGCTGTCCTGGACAGAGGGGCTTCCTTCCTCAAGCATGTGTGTGATGAAGAAGAAGTAGAAG

SEQ ID NO:769SLC4A4的外显子3

GCCACCATACCATTTACATCGGAGTCCATGTGCCGAAGAGTTACAGGAGAAGGAGACGTCACAAGAGAAAGACAGGGCACAAAGAAAAGAAGGAAAAGGAGAGAATCTCTGAGAACTACTCTGACAAATCAGATATTGAAAATGCTGATGAATCCAGCAGCAGCATCCTAAAACCTCTCA

SEQ ID NO:770SLC4A4的外显子4

TCTCTCCTGCTGCAGAACGCATCCGATTCATCTTGGGAGAGGAGGATGACAGCCCAGCTCCCCCTCAGCTCTTCACGGAACTGGATGAGCTGCTGGCCGTGGATGGGCAGGAGATGGAGTGGAAGGAAACAGCCAG

SEQ ID NO:771SLC4A4的外显子5

GTGGATCAAGTTTGAAGAAAAAGTGGAACAGGGTGGGGAAAGATGGAGCAAGCCCCATGTGGCCACATTGTCCCTTCATAGTTTATTTGAGCTGAGGACATGTATGGAGAAAGGATCCATCATGCTTGATCGGGAGGCTTCTTCTCTCCCACAGTTGGTGG

SEQ ID NO:772SLC4A4的外显子6

AGATGATTGTTGACCATCAGATTGAGACAGGCCTATTGAAACCTGAACTTAAGGATAAGGTGACCTATACTTTGCTCCGGAAGCACCGGCATCAAACCAAGAAATCCAACCTTCGGTCCCTGGCTGACATTGGGAAGACAGTCTCCAGTGCAAGTAGGATGTTTACCAACCCTGATAATG

SEQ ID NO:773SLC4A4的外显子7

GTAGCCCAGCCATGACCCATAGGAATCTGACTTCCTCCAGTCTGAATGACATTTCTGATAAACCGGAGAAGGACCAG

SEQ ID NO:774SLC4A4的外显子8

CTGAAGAATAAGTTCATGAAAAAATTGCCACGTGATGCAGAAGCTTCCAACGTGCTTGTTGGGGAGGTTGACTTTTTGGATACTCCTTTCATTGCCTTTGTTAGGCTACAGCAGGCTGTCATGCTGGGTGCCCTGACTGAAGTTCCTGTGCCCACAAG

SEQ ID NO:775SLC4A4的外显子9

GTTCTTGTTCATTCTCTTAGGTCCTAAGGGGAAAGCCAAGTCCTACCACGAGATTGGCAGAGCCATTGCCACCCTGATGTCTGATGAG

SEQ ID NO:776SLC4A4的外显子10

GTGTTCCATGACATTGCTTATAAAGCAAAAGACAGGCACGACCTGATTGCTGGTATTGATGAGTTCCTAGATGAAGTCATCGTCCTTCCACCTGGGGAATGGGATCCAGCAATTAGGATAGAGCCTCCTAAGAGTCTTCCATCCTCTGACAAAAG

SEQ ID NO:777SLC4A4的外显子11

AAAGAATATGTACTCAGGTGGAGAGAATGTTCAGATGAATGGGGATACGCCCCATGATGGAGGTCACGGAGGAGGAGGACATGGGGATTGTGAAGAATTGCAGCGAACTGGACG

SEQ ID NO:778SLC4A4的外显子12

GTTCTGTGGTGGACTAATTAAAGACATAAAGAGGAAAGCGCCATTTTTTGCCAGTGATTTTTATGATGCTTTAAATATTCAAGCTCTTTCGGCAATTCTCTTCATTTATCTGGCAACTGTAACTAATGCTATCACTTTTGGAGGACTGCTTGGGGATGCCACTGACAACATGCAG

SEQ ID NO:779SLC4A4的外显子13

GGCGTGTTGGAGAGTTTCCTGGGCACTGCTGTCTCTGGAGCCATCTTTTGCCTTTTTGCTGGTCAACCACTCACTATTCTGAGCAGCACCGGACCTGTCCTAGTTTTTGAGAGGCTTCTATTTAATTTCAGCAA

SEQ ID NO:780SLC4A4的外显子14

GGACAATAATTTTGACTATTTGGAGTTTCGCCTTTGGATTGGCCTGTGGTCCGCCTTCCTATGTCTCATTTTGGTAGCCACTGATGCCAGCTTCTTGGTTCAATACTTCACACGTTTCACGGAGGAGGGCTTTTCCTCTCTGATTAGCTTCATCTTTATCTATGATGCTTTCAAGAAGATGATCAAGCTTGCAGATTACTACCCCATCAACTCCAACTTCAAAGTGGGCTACAACACTCTCTTTTCCTGTACCTGTGTGCCACCTGACCCAG

SEQ ID NO:781SLC4A4的外显子15

CTAATATCTCAATATCTAATGACACCACACTGGCCCCAGAGTATTTGCCAACTATGTCTTCTACTGACATG

SEQ ID NO:782SLC4A4的外显子16

TACCATAATACTACCTTTGACTGGGCATTTTTGTCGAAGAAGGAGTGTTCAAAATACGGAGGAAACCTCGTCGGGAACAACTGTAATTTTGTTCCTGATATCACACTCATGTCTTTTATCCTCTTCTTGGGAACCTACACCTCTTCCATGGCTCTGAAAAAATTCAAAACTAGTCCTTATTTTCCAACCACA

SEQ ID NO:783SLC4A4的外显子17

GCAAGAAAACTGATCAGTGATTTTGCCATTATCTTGTCCATTCTCATCTTTTGTGTAATAGATGCCCTAGTAGGCGTGGACACCCCAAAACTAATTGTGCCAAGTGAGTTCAAG

SEQ ID NO:784SLC4A4的外显子18

CCAACAAGTCCAAACCGAGGTTGGTTCGTTCCACCGTTTGGAGAAAACCCCTGGTGGGTGTGCCTTGCTGCTGCTATCCCGGCTTTGTTGGTCACTATACTGATTTTCATGGACCAACAAATTACAGCTGTGATTGTAAACAGGAAAGAACATAAACTCAAG

SEQ ID NO:785SLC4A4的外显子19

AAAGGAGCAGGGTATCACTTGGATCTCTTTTGGGTGGCCATCCTCATGGTTATATGCTCCCTCATGGCTCTTCCGTGGTATGTAGCTGCTACGGTCATCTCCATTGCTCACATCGACAGTTTGAAGATGGAGACAGAGACTTCTGCACCTGGAGAACAACCAAAGTTTCTAGGAGTGAG

SEQ ID NO:786SLC4A4的外显子20

GGAACAAAGAGTCACTGGAACCCTTGTGTTTATTCTGACTGGTCTGTCAGTCTTTATGGCTCCCATCTTGAAG

SEQ ID NO:787SLC4A4的外显子21

GTTTATACCCATGCCTGTACTCTATGGTGTGTTCCTGTATATGGGAGTAGCATCCCTTAATGGTGTGCAG

SEQ ID NO:788SLC4A4的外显子22

TTCATGGATCGTCTGAAGCTGCTTCTGATGCCTCTGAAGCATCAGCCTGACTTCATCTACCTGCGTCATGTTCCTCTGCGCAGAGTCCACCTGTTCACTTTCCTGCAGGTGTTGTGTCTGGCCCTGCTTTGGATCCTCAAGTCAACGGTGGCTGCTATCATTTTTCCAGTAATG

SEQ ID NO:789SLC4A4的外显子23

ATCTTGGCACTTGTAGCTGTCAGAAAAGGCATGGACTACCTCTTCTCCCAGCACGACCTCAGCTTCCTGGATGATGTCATTCCAGAAAAGGACAAGAAAAAGAAGGAGGATGAGAAGAAAAAGAAAAAGAAGAAGGGAAGTCTGGACAGTGACAATGATGAT

SEQ ID NO:790SLC4A4的外显子24

TCTGACTGCCCATACTCAGAAAAAGTTCCAAGTATTAAAATTCCAATGGACATCATGGAACAGCAACCTTTCCTAAGCGATAGCAAACCTTCTGACA

SEQ ID NO:791SLC4A4的外显子25

GAGAAAGATCACCAACATTCCTTGAACGCCACACATCATGCTGATAAAATTCCTTTCCTTCAGTCACTCGGTATGCCAAG

SEQ ID NO:792SLC4A4的外显子26

TCCTCCTAGAACTCCAGTAAAAGTTGTGCCTCAAATTAGAATAGAACTTGAACCTGAAGACAATGATTATTTCTGGAGGAGCAAGGGAACAGAAACTACATTGTAACCTGTTTGTCTTTCTTAAAACTGACATTTGTTGTTAATGTCATTTGTTTTTGTTTGGCTGTTTGTTTATTTTTTAACTTTTATTTCGTCTCAGTTTTTGGTCACAGGCCAAATAATACAGCGCTCTCTCTGCTTCTCTCTTGCATAGACACAATCAAGACAATAGTGCACCGTTCCTTAAAAACAGCATCTGAGGAATCCCCCTTTTGTTCTTAAACTTTCAGATGTGTCCTTTGATAACCAAATTCTGTCACTCAAGACACAGACACGCACAGACCCTGTCCTTTGCCTCTATTAAGCAGAGGATGGAAGTATTAAGGATTTTGTAACACCTTTTATGAAAATGTTGAAGGAACTTAAAACTTTAGCTTTGGAGCTGTGCTTACTGGCTTGTCTTTGTCTGGTAGAACAAACCTTGACCTCCAGACAGAGTCCCTTCTCACTTATAGAGCTCTCCAGGACTGGAAAAAGTGCTGCTATTTTAACTTGCTCTTGCTTGTAAATCCTAATCTTAGAGTTATCAAAAGAAGAAAAAACTGAAGGTACTTTACTCCCTATAGAGAAACCATTGCCATCATTGTAGCAAGTGCTGGAATGTCCCTTTTTTCCTATGCAACTTTTTTTAACCCTTTAATGAACTTATCTGTTGAGTACATTGAAGAATATTTTTCTTCCTAGATTTTGTTGTTTAAATTATGGGGCCTAACCTGCCACTTATTTTTTGTCAATTTTTAAAACTTTTTTTTAATTACTGTAAAGAAAATGAATTTTTTCCTGCAGCAGGAAACATAGTTTTGAGTAGTTCTACCTCTTATTTGTAGCTGCCAGGCTTTCTGTAAAAATTGTATTGTATATAATGTGATTTTTACACATACATACACACACAAATACACAATCTCTAGGGTAAGCCAGAAGGCAAGATCAGATTAAAAACACCATGTTTCTAAGCATCCATTTTTCCCTTTCTTTAAAAGAAACTTAACTGTTCTATGAAGGAGATTGAGGGAGAAGAGACAAACTCCTATGTCATGAGAATAACCGATGTTCTGATAATAGTAGCATCTAGGTACAGATGCTGGTTGTATTACCACGTCAATGTCCTATGCAGTATTGTTAGACATTTTCTCATTTTGAAATATTTGTGTGTTTGTGTATGTGCTCTGTGCCATGGCTGGTGTATATATGTGCAATGTTAGAAGGCAAAAGAGTGATGGTAGGCAGAGGGCAAAGTCATTGAATCTCTTATGCCAGTTTTCATAAAACCCAAACCACATATGAAAAAATCCATTAAGGGTCCAAGAAGTCTGTCCATATGAAAATGAGGGTAAATATAGTTTATTTCCCAGGTATCAGTCATTATAATTGATATAATAGCTCTAACATGCAATATAAAATTCATAGGAGTATTAATAGCCCATTTACACATCTATAAAATGTAATGGGATTGCAGAGCTGCAGAGTACAGTGTAACAGTACTCTCATGCAATTTTTTTCAGGATGCAAAGGCAATTATTCTTTGTAAGCGGGACATTTAGAATATATTTGTGTACATATTATATGTATGTATATTTCAAAGTACCACACTGAAAATTAGACATTTATTAACCAAATTTAACGTGGTATTTAAAGGTAATATTTTTAATATGATACATTACATATTGTGAATGTATACTAAAAAAACATTTTAAATGTTAAAATTATAATTTCAGATTCATATAACCACAACTGTGATATATCCTAACTATAACCAGTTGTTGAGGGGTATACTAGAAGCAGAATGAAACCACATTTTTTGGTTTGATAATATGCACTTATTGACTCCCACTCATTGTTATGTTAATTAAGTTATTATTCTGTCTCCTTGTAATTTTGATTACAAAAATTTTATTATCCTGAGTTAGCTGTTACTTTTACAGTACCTGATACTCCTAAAACTTTTAACTTATACAAATTAGTCAATAATGACCCCAATTTTTTCATTAAAATAATAGTGGTGAATTATATGTTATTGTGTTAAAACCTCACTTGCCAAATTCTGGCTTCACATTTGTATTTAGGGCTATCCTTAAAATGATGAGTCTATATTATCTAGCTTTCTATTACCCTAATATAAACTGGTATAAGAAGACTTTCCTTTTTTCTTTATGCATGGAAGCATCAATAAATTGTTTAAAAACCATGTATAGTAAATTCAGCTTAACCCGTGATCTTCTTAAGTTAAAGGTACTTTTGTTTTATAAAAGCTCTAGATAAAACTTTCTTTTCTGATCATGAATCAAGTATCTGTGGTTTCATGCCCCTCTCTATACCTTTCAAAGAACTCCTGAAGCAACTTAACTCATCATTTCAGCCTCTGAGTAGAGGTAAAACCTATGTGTACTTCTGTTTATGATCCATATTGATATTTATGACATGAACACAGAATAGTACCTTACATTTGCTAAACAGACAGTTAATATCAAATCCTTTCAATATTCTGGGAACCCAGGGAAGTTTTTAAAAATGTCATTACTTTCAAAGGAACAGAAGTAGTTAACCAAACTAACAAGCAAAACCTGAGGTTTACCTAGTGACACCAAATTATCGGTATTTTAACTGAATTTACCCATTGACTAAGAATGAACCAGATTTGGTGGTGGTTTTGTTTCTATGCAAACTGGACACAAATTACAACAGTAAATTTTTTTATAAGTGCTTCTCCCTTCTCCATGATGTGACTTCCGGAGATAAAGGATTCAAAAGATAAAGACAAAGTACGCTCAGAGTTGTTAACCAGAAAGTCCTGGCTGTGGTTGCAGAAACACTGTTGGAAGAAAAGAGATGACTAAGTCAAGTGTCTGCCTTATCAAAAGAGCAAAAATGCCTCTGGTTTTGTGTTTGGGAGAAAAGTATCTTGGACGCACTGTTTTCCTTGATAAAAGTCATCTTCTCTACTGTGTGAAATGAATACTTGGAATTCTAATTGTTTTGTGTGCCAGGGGCAGTAATGTCCCTGCCTCTTCTCCCAATCAAGGTTGAGGAGTGGGGCTGGGGAGAGGACTTAACTGACTTAAGAAGTAGGAAAACAAAAACCTCTCTCCTCAGCCTTCCACCTCCAAGAGAGGAGGAAAAACAGTTGTCTGCTGTCTGTAATTCAGTTTGCGTGTATTTTATGCTCATGCACCAACCCATACAGAGTAAATCTTTTATCAACTGTATACTGGTGTTTAATAGAGAATGATTGTCTTCCGAGTTTTTTGGTTCCTTTTTTAACTGTGTTAAAGTACTTGAAATGTATTGACTGCTGACTATATTTTAAAAACAAAATGAAATAATTTGAGTTGTATTACAGAGGTTGACATTGTTCAGGGATGGGACAAAGCCTTCTTCAATCCTTTTCATACTACTTAATGATTTTGGTGCAGGAACCTGAGATTTTCTGATTTATATTTCATGATATTTCACATTTGCTCTTCACAGCATGAGCATGAAGCCCAGTGGCACCAAATGGCTGGGTACAATCAAGTGATATTTTGTAGCACCTCACTATCTGAAAGGCCATGAGTTTTCAGATGATTTCATTGAGCTTCATTGCAGCCTGAAATTTTAAAAAAGTTGTGTAATACGCCAACCAGTCAAGTTGTGTTTTGGCCAGAGATTTAGATATGTCCAATTTCCTGGCTCATTTCATTGTGCTCTATGGGTACGTATAAAAAGCAAGAATTCTGTTTCCTAGGCAAACATTGCAACTCAGGGCTAAAGTCATCCAGTGAAACTTTTAGAGCCAGAAGTAACTTTGTCCCAGTCCTACAATGTGAAAAGAGTGAATAGTTGCCTCTTTTTAGCCATTTTCATGGCTGGTACATATTCGTACGCATTACTTTTCAGAATCAATACGCACTTTCAGATATTCTTATTTTTATTCTCTTAAGTCTTTATTAACTTTGGAGAGAGAAATGATGCATCTTTTTATTTTAAATGAAGTAGATCAACATGGTGGAACAAAATGATAAAGAACAGAAAACATTTCAATATATTACTAATAACTTTTTCCAATATAAATCCTAAAATTCCTATAACATAGTATTTTACAGTTTTATGAAGCTTTCTATTGTGACTTTTATGGAATTAAGAGATGAAGAAGATGAGATATTTTAGCATTTATATTTTTCAAAATTATATGTATACTTAAAAATAAAGTAACTTTATGCA

SEQ ID NO:793SLC4A4的全mRNA多核苷酸序列

GGCGGCGCGCCGGGCAGCGCTTCGGTGGCGGCGGCGGCCGCGGTGGCAGCGAAGGCGGCGGCGGCGGCGGCAGTGGCAGTGGCCGCTGCAGCCCCACACTCCGCCGCCAAACTGGAGGAGCGACGGAAGCCAGACCCCAGGAGGATGGAGGATGAAGCTGTCCTGGACAGAGGGGCTTCCTTCCTCAAGCATGTGTGTGATGAAGAAGAAGTAGAAGGCCACCATACCATTTACATCGGAGTCCATGTGCCGAAGAGTTACAGGAGAAGGAGACGTCACAAGAGAAAGACAGGGCACAAAGAAAAGAAGGAAAAGGAGAGAATCTCTGAGAACTACTCTGACAAATCAGATATTGAAAATGCTGATGAATCCAGCAGCAGCATCCTAAAACCTCTCATCTCTCCTGCTGCAGAACGCATCCGATTCATCTTGGGAGAGGAGGATGACAGCCCAGCTCCCCCTCAGCTCTTCACGGAACTGGATGAGCTGCTGGCCGTGGATGGGCAGGAGATGGAGTGGAAGGAAACAGCCAGGTGGATCAAGTTTGAAGAAAAAGTGGAACAGGGTGGGGAAAGATGGAGCAAGCCCCATGTGGCCACATTGTCCCTTCATAGTTTATTTGAGCTGAGGACATGTATGGAGAAAGGATCCATCATGCTTGATCGGGAGGCTTCTTCTCTCCCACAGTTGG

TGGAGATGATTGTTGACCATCAGATTGAGACAGGCCTATTGAAACCTGAACTTAAGGAT

AAGGTGACCTATACTTTGCTCCGGAAGCACCGGCATCAAACCAAGAAATCCAACCTTC

GGTCCCTGGCTGACATTGGGAAGACAGTCTCCAGTGCAAGTAGGATGTTTACCAACCC

TGATAATGGTAGCCCAGCCATGACCCATAGGAATCTGACTTCCTCCAGTCTGAATGACAT

TTCTGATAAACCGGAGAAGGACCAGCTGAAGAATAAGTTCATGAAAAAATTGCCACGT

GATGCAGAAGCTTCCAACGTGCTTGTTGGGGAGGTTGACTTTTTGGATACTCCTTTCAT

TGCCTTTGTTAGGCTACAGCAGGCTGTCATGCTGGGTGCCCTGACTGAAGTTCCTGTGC

CCACAAGGTTCTTGTTCATTCTCTTAGGTCCTAAGGGGAAAGCCAAGTCCTACCACGAG

ATTGGCAGAGCCATTGCCACCCTGATGTCTGATGAGGTGTTCCATGACATTGCTTATAAA

GCAAAAGACAGGCACGACCTGATTGCTGGTATTGATGAGTTCCTAGATGAAGTCATCGT

CCTTCCACCTGGGGAATGGGATCCAGCAATTAGGATAGAGCCTCCTAAGAGTCTTCCAT

CCTCTGACAAAAGAAAGAATATGTACTCAGGTGGAGAGAATGTTCAGATGAATGGGGA

TACGCCCCATGATGGAGGTCACGGAGGAGGAGGACATGGGGATTGTGAAGAATTGCAG

CGAACTGGACGGTTCTGTGGTGGACTAATTAAAGACATAAAGAGGAAAGCGCCATTTT

TTGCCAGTGATTTTTATGATGCTTTAAATATTCAAGCTCTTTCGGCAATTCTCTTCATTTAT

CTGGCAACTGTAACTAATGCTATCACTTTTGGAGGACTGCTTGGGGATGCCACTGACAA

CATGCAGGGCGTGTTGGAGAGTTTCCTGGGCACTGCTGTCTCTGGAGCCATCTTTTGCC

TTTTTGCTGGTCAACCACTCACTATTCTGAGCAGCACCGGACCTGTCCTAGTTTTTGAG

AGGCTTCTATTTAATTTCAGCAAGGACAATAATTTTGACTATTTGGAGTTTCGCCTTTGG

ATTGGCCTGTGGTCCGCCTTCCTATGTCTCATTTTGGTAGCCACTGATGCCAGCTTCTTG

GTTCAATACTTCACACGTTTCACGGAGGAGGGCTTTTCCTCTCTGATTAGCTTCATCTTT

ATCTATGATGCTTTCAAGAAGATGATCAAGCTTGCAGATTACTACCCCATCAACTCCAAC

TTCAAAGTGGGCTACAACACTCTCTTTTCCTGTACCTGTGTGCCACCTGACCCAGCTAA

TATCTCAATATCTAATGACACCACACTGGCCCCAGAGTATTTGCCAACTATGTCTTCTAC

TGACATGTACCATAATACTACCTTTGACTGGGCATTTTTGTCGAAGAAGGAGTGTTCAA

AATACGGAGGAAACCTCGTCGGGAACAACTGTAATTTTGTTCCTGATATCACACTCATG

TCTTTTATCCTCTTCTTGGGAACCTACACCTCTTCCATGGCTCTGAAAAAATTCAAAACT

AGTCCTTATTTTCCAACCACAGCAAGAAAACTGATCAGTGATTTTGCCATTATCTTGTCC

ATTCTCATCTTTTGTGTAATAGATGCCCTAGTAGGCGTGGACACCCCAAAACTAATTGTG

CCAAGTGAGTTCAAGCCAACAAGTCCAAACCGAGGTTGGTTCGTTCCACCGTTTGGAG

AAAACCCCTGGTGGGTGTGCCTTGCTGCTGCTATCCCGGCTTTGTTGGTCACTATACTG

ATTTTCATGGACCAACAAATTACAGCTGTGATTGTAAACAGGAAAGAACATAAACTCAA

GAAAGGAGCAGGGTATCACTTGGATCTCTTTTGGGTGGCCATCCTCATGGTTATATGCTC

CCTCATGGCTCTTCCGTGGTATGTAGCTGCTACGGTCATCTCCATTGCTCACATCGACAG

TTTGAAGATGGAGACAGAGACTTCTGCACCTGGAGAACAACCAAAGTTTCTAGGAGTG

AGGGAACAAAGAGTCACTGGAACCCTTGTGTTTATTCTGACTGGTCTGTCAGTCTTTAT

GGCTCCCATCTTGAAGTTTATACCCATGCCTGTACTCTATGGTGTGTTCCTGTATATGGGA

GTAGCATCCCTTAATGGTGTGCAGTTCATGGATCGTCTGAAGCTGCTTCTGATGCCTCTG

AAGCATCAGCCTGACTTCATCTACCTGCGTCATGTTCCTCTGCGCAGAGTCCACCTGTT

CACTTTCCTGCAGGTGTTGTGTCTGGCCCTGCTTTGGATCCTCAAGTCAACGGTGGCTG

CTATCATTTTTCCAGTAATGATCTTGGCACTTGTAGCTGTCAGAAAAGGCATGGACTACC

TCTTCTCCCAGCACGACCTCAGCTTCCTGGATGATGTCATTCCAGAAAAGGACAAGAA

AAAGAAGGAGGATGAGAAGAAAAAGAAAAAGAAGAAGGGAAGTCTGGACAGTGACA

ATGATGATTCTGACTGCCCATACTCAGAAAAAGTTCCAAGTATTAAAATTCCAATGGAC

ATCATGGAACAGCAACCTTTCCTAAGCGATAGCAAACCTTCTGACAGAGAAAGATCAC

CAACATTCCTTGAACGCCACACATCATGCTGATAAAATTCCTTTCCTTCAGTCACTCGGT

ATGCCAAGTCCTCCTAGAACTCCAGTAAAAGTTGTGCCTCAAATTAGAATAGAACTTGA

ACCTGAAGACAATGATTATTTCTGGAGGAGCAAGGGAACAGAAACTACATTGTAACCT

GTTTGTCTTTCTTAAAACTGACATTTGTTGTTAATGTCATTTGTTTTTGTTTGGCTGTTTG

TTTATTTTTTAACTTTTATTTCGTCTCAGTTTTTGGTCACAGGCCAAATAATACAGCGCTC

TCTCTGCTTCTCTCTTGCATAGACACAATCAAGACAATAGTGCACCGTTCCTTAAAAAC

AGCATCTGAGGAATCCCCCTTTTGTTCTTAAACTTTCAGATGTGTCCTTTGATAACCAAA

TTCTGTCACTCAAGACACAGACACGCACAGACCCTGTCCTTTGCCTCTATTAAGCAGAG

GATGGAAGTATTAAGGATTTTGTAACACCTTTTATGAAAATGTTGAAGGAACTTAAAAC

TTTAGCTTTGGAGCTGTGCTTACTGGCTTGTCTTTGTCTGGTAGAACAAACCTTGACCT

CCAGACAGAGTCCCTTCTCACTTATAGAGCTCTCCAGGACTGGAAAAAGTGCTGCTATT

TTAACTTGCTCTTGCTTGTAAATCCTAATCTTAGAGTTATCAAAAGAAGAAAAAACTGA

AGGTACTTTACTCCCTATAGAGAAACCATTGCCATCATTGTAGCAAGTGCTGGAATGTCC

CTTTTTTCCTATGCAACTTTTTTTAACCCTTTAATGAACTTATCTGTTGAGTACATTGAAG

AATATTTTTCTTCCTAGATTTTGTTGTTTAAATTATGGGGCCTAACCTGCCACTTATTTTTT

GTCAATTTTTAAAACTTTTTTTTAATTACTGTAAAGAAAATGAATTTTTTCCTGCAGCAG

GAAACATAGTTTTGAGTAGTTCTACCTCTTATTTGTAGCTGCCAGGCTTTCTGTAAAAAT

TGTATTGTATATAATGTGATTTTTACACATACATACACACACAAATACACAATCTCTAGGG

TAAGCCAGAAGGCAAGATCAGATTAAAAACACCATGTTTCTAAGCATCCATTTTTCCCT

TTCTTTAAAAGAAACTTAACTGTTCTATGAAGGAGATTGAGGGAGAAGAGACAAACTC

CTATGTCATGAGAATAACCGATGTTCTGATAATAGTAGCATCTAGGTACAGATGCTGGTT

GTATTACCACGTCAATGTCCTATGCAGTATTGTTAGACATTTTCTCATTTTGAAATATTTG

TGTGTTTGTGTATGTGCTCTGTGCCATGGCTGGTGTATATATGTGCAATGTTAGAAGGCA

AAAGAGTGATGGTAGGCAGAGGGCAAAGTCATTGAATCTCTTATGCCAGTTTTCATAAA

ACCCAAACCACATATGAAAAAATCCATTAAGGGTCCAAGAAGTCTGTCCATATGAAAAT

GAGGGTAAATATAGTTTATTTCCCAGGTATCAGTCATTATAATTGATATAATAGCTCTAAC

ATGCAATATAAAATTCATAGGAGTATTAATAGCCCATTTACACATCTATAAAATGTAATGG

GATTGCAGAGCTGCAGAGTACAGTGTAACAGTACTCTCATGCAATTTTTTTCAGGATGC

AAAGGCAATTATTCTTTGTAAGCGGGACATTTAGAATATATTTGTGTACATATTATATGTAT

GTATATTTCAAAGTACCACACTGAAAATTAGACATTTATTAACCAAATTTAACGTGGTAT

TTAAAGGTAATATTTTTAATATGATACATTACATATTGTGAATGTATACTAAAAAAACATTT

TAAATGTTAAAATTATAATTTCAGATTCATATAACCACAACTGTGATATATCCTAACTATAA

CCAGTTGTTGAGGGGTATACTAGAAGCAGAATGAAACCACATTTTTTGGTTTGATAATAT

GCACTTATTGACTCCCACTCATTGTTATGTTAATTAAGTTATTATTCTGTCTCCTTGTAATT

TTGATTACAAAAATTTTATTATCCTGAGTTAGCTGTTACTTTTACAGTACCTGATACTCCT

AAAACTTTTAACTTATACAAATTAGTCAATAATGACCCCAATTTTTTCATTAAAATAATAG

TGGTGAATTATATGTTATTGTGTTAAAACCTCACTTGCCAAATTCTGGCTTCACATTTGTA

TTTAGGGCTATCCTTAAAATGATGAGTCTATATTATCTAGCTTTCTATTACCCTAATATAAA

CTGGTATAAGAAGACTTTCCTTTTTTCTTTATGCATGGAAGCATCAATAAATTGTTTAAA

AACCATGTATAGTAAATTCAGCTTAACCCGTGATCTTCTTAAGTTAAAGGTACTTTTGTT

TTATAAAAGCTCTAGATAAAACTTTCTTTTCTGATCATGAATCAAGTATCTGTGGTTTCAT

GCCCCTCTCTATACCTTTCAAAGAACTCCTGAAGCAACTTAACTCATCATTTCAGCCTCT

GAGTAGAGGTAAAACCTATGTGTACTTCTGTTTATGATCCATATTGATATTTATGACATGA

ACACAGAATAGTACCTTACATTTGCTAAACAGACAGTTAATATCAAATCCTTTCAATATT

CTGGGAACCCAGGGAAGTTTTTAAAAATGTCATTACTTTCAAAGGAACAGAAGTAGTT

AACCAAACTAACAAGCAAAACCTGAGGTTTACCTAGTGACACCAAATTATCGGTATTTT

AACTGAATTTACCCATTGACTAAGAATGAACCAGATTTGGTGGTGGTTTTGTTTCTATGC

AAACTGGACACAAATTACAACAGTAAATTTTTTTATAAGTGCTTCTCCCTTCTCCATGAT

GTGACTTCCGGAGATAAAGGATTCAAAAGATAAAGACAAAGTACGCTCAGAGTTGTTA

ACCAGAAAGTCCTGGCTGTGGTTGCAGAAACACTGTTGGAAGAAAAGAGATGACTAA

GTCAAGTGTCTGCCTTATCAAAAGAGCAAAAATGCCTCTGGTTTTGTGTTTGGGAGAA

AAGTATCTTGGACGCACTGTTTTCCTTGATAAAAGTCATCTTCTCTACTGTGTGAAATGA

ATACTTGGAATTCTAATTGTTTTGTGTGCCAGGGGCAGTAATGTCCCTGCCTCTTCTCCC

AATCAAGGTTGAGGAGTGGGGCTGGGGAGAGGACTTAACTGACTTAAGAAGTAGGAA

AACAAAAACCTCTCTCCTCAGCCTTCCACCTCCAAGAGAGGAGGAAAAACAGTTGTCT

GCTGTCTGTAATTCAGTTTGCGTGTATTTTATGCTCATGCACCAACCCATACAGAGTAAA

TCTTTTATCAACTGTATACTGGTGTTTAATAGAGAATGATTGTCTTCCGAGTTTTTTGGTT

CCTTTTTTAACTGTGTTAAAGTACTTGAAATGTATTGACTGCTGACTATATTTTAAAAAC

AAAATGAAATAATTTGAGTTGTATTACAGAGGTTGACATTGTTCAGGGATGGGACAAAGCCTTCTTCAATCCTTTTCATACTACTTAATGATTTTGGTGCAGGAACCTGAGATTTTCTGATTTATATTTCATGATATTTCACATTTGCTCTTCACAGCATGAGCATGAAGCCCAGTGGCACCAAATGGCTGGGTACAATCAAGTGATATTTTGTAGCACCTCACTATCTGAAAGGCCATGAGTTTTCAGATGATTTCATTGAGCTTCATTGCAGCCTGAAATTTTAAAAAAGTTGTGTAATACGCCAACCAGTCAAGTTGTGTTTTGGCCAGAGATTTAGATATGTCCAATTTCCTGGCTCATTTCATTGTGCTCTATGGGTACGTATAAAAAGCAAGAATTCTGTTTCCTAGGCAAACATTGCAACTCAGGGCTAAAGTCATCCAGTGAAACTTTTAGAGCCAGAAGTAACTTTGTCCCAGTCCTACAATGTGAAAAGAGTGAATAGTTGCCTCTTTTTAGCCATTTTCATGGCTGGTACATATTCGTACGCATTACTTTTCAGAATCAATACGCACTTTCAGATATTCTTATTTTTATTCTCTTAAGTCTTTATTAACTTTGGAGAGAGAAATGATGCATCTTTTTATTTTAAATGAAGTAGATCAACATGGTGGAACAAAATGATAAAGAACAGAAAACATTTCAATATATTACTAATAACTTTTTCCAATATAAATCCTAAAATTCCTATAACATAGTATTTTACAGTTTTATGAAGCTTTCTATTGTGACTTTTATGGAATTAAGAGATGAAGAAGATGAGATATTTTAGCATTTATATTTTTCAAAATTATATGTATACTTAAAAATAAAGTAACTTTATGCA

SEQ ID NO:794SLC4A4的外显子2的翻译多肽序列

MEDEAVLDRGASFLKHVCDEEEVE

SEQ ID NO:795SLC4A4的外显子3的翻译多肽序列

HHTIYIGVHVPKSYRRRRRHKRKTGHKEKKEKERISENYSDKSDIENADESSSSILKPL

SEQ ID NO:796SLC4A4的外显子4的翻译多肽序列

SPAAERIRFILGEEDDSPAPPQLFTELDELLAVDGQEMEWKETA

SEQ ID NO:797SLC4A4的外显子5的翻译多肽序列

WIKFEEKVEQGGERWSKPHVATLSLHSLFELRTCMEKGSIMLDREASSLPQLV

SEQ ID NO:798SLC4A4的外显子6的翻译多肽序列

MIVDHQIETGLLKPELKDKVTYTLLRKHRHQTKKSNLRSLADIGKTVSSASRMFTNPDN

SEQ ID NO:799SLC4A4的外显子7的翻译多肽序列

SPAMTHRNLTSSSLNDISDKPEKDQ

SEQ ID NO:800SLC4A4的外显子8的翻译多肽序列

LKNKFMKKLPRDAEASNVLVGEVDFLDTPFIAFVRLQQAVMLGALTEVPVPT

SEQ ID NO:801SLC4A4的外显子9的翻译多肽序列

FLFILLGPKGKAKSYHEIGRAIATLMSDE

SEQ ID NO:802SLC4A4的外显子10的翻译多肽序列

VFHDIAYKAKDRHDLIAGIDEFLDEVIVLPPGEWDPAIRIEPPKSLPSSDK

SEQ ID NO:803SLC4A4的外显子11的翻译多肽序列

KNMYSGGENVQMNGDTPHDGGHGGGGHGDCEELQRTG

SEQ ID NO:804SLC4A4的外显子12的翻译多肽序列

FCGGLIKDIKRKAPFFASDFYDALNIQALSAILFIYLATVTNAITFGGLLGDATDNMQ

SEQ ID NO:805SLC4A4的外显子13的翻译多肽序列

GVLESFLGTAVSGAIFCLFAGQPLTILSSTGPVLVFERLLFNFS

SEQ ID NO:806SLC4A4的外显子14的翻译多肽序列

DNNFDYLEFRLWIGLWSAFLCLILVATDASFLVQYFTRFTEEGFSSLISFIFIYDAFKKMIKLADYYPINSNFKVGYNTLFSCTCVPPDP

SEQ ID NO:807SLC4A4的外显子15的翻译多肽序列

NISISNDTTLAPEYLPTMSSTDM

SEQ ID NO:808SLC4A4的外显子16的翻译多肽序列

YHNTTFDWAFLSKKECSKYGGNLVGNNCNFVPDITLMSFILFLGTYTSSMALKKFKTSPYFPTT

SEQ ID NO:809SLC4A4的外显子17的翻译多肽序列

ARKLISDFAIILSILIFCVIDALVGVDTPKLIVPSEFK

SEQ ID NO:810SLC4A4的外显子18的翻译多肽序列

PTSPNRGWFVPPFGENPWWVCLAAAIPALLVTILIFMDQQITAVIVNRKEHKLK

SEQ ID NO:811SLC4A4的外显子19的翻译多肽序列

KGAGYHLDLFWVAILMVICSLMALPWYVAATVISIAHIDSLKMETETSAPGEQPKFLGV

SEQ ID NO:812SLC4A4的外显子20的翻译多肽序列

EQRVTGTLVFILTGLSVFMAPILK

SEQ ID NO:813SLC4A4的外显子21的翻译多肽序列

FIPMPVLYGVFLYMGVASLNGVQ

SEQ ID NO:814SLC4A4的外显子22的翻译多肽序列

FMDRLKLLLMPLKHQPDFIYLRHVPLRRVHLFTFLQVLCLALLWILKSTVAAIIFPVM

SEQ ID NO:815SLC4A4的外显子23的翻译多肽序列

ILALVAVRKGMDYLFSQHDLSFLDDVIPEKDKKKKEDEKKKKKKKGSLDSDNDD

SEQ ID NO:816SLC4A4的外显子24的翻译多肽序列

SDCPYSEKVPSIKIPMDIMEQQPFLSDSKPSD

SEQ ID NO:817SLC4A4的外显子25的翻译多肽序列

ERSPTFLERHTSC

SEQ ID NO:819SLC4A4的全蛋白质序列

MEDEAVLDRGASFLKHVCDEEEVEGHHTIYIGVHVPKSYRRRRRHKRKTGHKEKKEKERISENYSDKSDIENADESSSSILKPLISPAAERIRFILGEEDDSPAPPQLFTELDELLAVDGQEMEWKETARWIKFEEKVEQGGERWSKPHVATLSLHSLFELRTCMEKGSIMLDREASSLPQLVEMIVDHQIETGLLKPELKDKVTYTLLRKHRHQTKKSNLRSLADIGKTVSSASRMFTNPDNGSPAMTHRNLTSSSLNDISDKPEKDQLKNKFMKKLPRDAEASNVLVGEVDFLDTPFIAFVRLQQAVMLGALTEVPVPTRFLFILLGPKGKAKSYHEIGRAIATLMSDEVFHDIAYKAKDRHDLIAGIDEFLDEVIVLPPGEWDPAIRIEPPKSLPSSDKRKNMYSGGENVQMNGDTPHDGGHGGGGHGDCEELQRTGRFCGGLIKDIKRKAPFFASDFYDALNIQALSAILFIYLATVTNAITFGGLLGDATDNMQGVLESFLGTAVSGAIFCLFAGQPLTILSSTGPVLVFERLLFNFSKDNNFDYLEFRLWIGLWSAFLCLILVATDASFLVQYFTRFTEEGFSSLISFIFIYDAFKKMIKLADYYPINSNFKVGYNTLFSCTCVPPDPANISISNDTTLAPEYLPTMSSTDMYHNTTFDWAFLSKKECSKYGGNLVGNNCNFVPDITLMSFILFLGTYTSSMALKKFKTSPYFPTTARKLISDFAIILSILIFCVIDALVGVDTPKLIVPSEFKPTSPNRGWFVPPFGENPWWVCLAAAIPALLVTILIFMDQQITAVIVNRKEHKLKKGAGYHLDLFWVAILMVICSLMALPWYVAATVISIAHIDSLKMETETSAPGEQPKFLGVREQRVTGTLVFILTGLSVFMAPILKFIPMPVLYGVFLYMGVASLNGVQFMDRLKLLLMPLKHQPDFIYLRHVPLRRVHLFTFLQVLCLALLWILKSTVAAIIFPVMILALVAVRKGMDYLFSQHDLSFLDDVIPEKDKKKKEDEKKKKKKKGSLDSDNDDSDCPYSEKVPSIKIPMDIMEQQPFLSDSKPSDRERSPTFLERHTSC

SEQ ID NO:820SLC4A4的全部外显子1-14按顺序排列的多核苷酸序列

SEQ ID NO:821SLC4A4的全部外显子1-14按顺序排列的翻译多肽序列

SDC4(2)序列信息

SEQ ID NO:822来自SDC4-NRG1融合物5’处的SDC4外显子4的序列

ATGTGTCCAACAAGGTGTCAATGTCCAGCACTGTGCAGGGCAGCAACATCTTTGAGAGAACGGAGGTCCTGGCAG

SEQ ID NO:823SDC4-NRG1融合物3’处的NRG1外显子2序列

CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA

SEQ ID NO:824SDC4-NRG1多核苷酸序列

ATGTGTCCAACAAGGTGTCAATGTCCAGCACTGTGCAGGGCAGCAACATCTTTGAGAGAACGGAGGTCCTGGCAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA

SEQ ID NO:825SDC4-NRG1多肽序列

VSNKVSMSSTVQGSNIFERTEVLAALPPRLKEMKSQESAAGSKLVLRCE

SEQ ID NO:940SDC4的全部外显子1-4按顺序排列的多核苷酸序列

SEQ ID NO:941SDC4的全部外显子1-4按顺序排列的翻译多肽序列

ZFAT序列信息

SEQ ID NO:826来自ZFAT-NRG1融合物5’处的ZFAT外显子12的序列

ACAGGAAGCACCCTAATGAGGAGTATGCCAACGTGGGCACCGGGGAGCTGGCAGCGGAGGTGCTCATCCAGCAAG

SEQ ID NO:827ZFAT-NRG1融合物3’处的NRG1外显子6序列

CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG

SEQ ID NO:828ZFAT-NRG1多核苷酸序列

ACAGGAAGCACCCTAATGAGGAGTATGCCAACGTGGGCACCGGGGAGCTGGCAGCGGAGGTGCTCATCCAGCAAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG

SEQ ID NO:829ZFAT-NRG1多肽序列

RKHPNEEYANVGTGELAAEVLIQQATSTSTTGTSHLVKCAEKEKTFCVN

SEQ ID NO:830ZFAT的外显子1

ATCCGCCATGTTGGATGCCGCAGATTCGCCATAACCTCGCCGGCTCTTTTCTTAAAAAAATAAAAATAAAAAGCGAAGCGTCAGCAGGGCGCCCCGCCCCCTCGGTCGGCACGGGAGGGGGCCCGGAAGAGCCCGAGGCTTTTTTTTCCTCCGCGGTGGGGCGTTGCCATGGAGACGCGGGCGGCAG

SEQ ID NO:831ZFAT的外显子2

AAAACACGGCCATCTTTATGTGTAAATGTTGTAACCTCTTCTCACCAAATCAGTCGGAACTCCTCTCCCACGTTTCAGAGAAGCACATGGAAGAAGGGGTTAATGTTGATGAGATTATTATTCCCCTTAGGCCTCTGAGTACACCTGAACCCCCCAACTCAAGCAAAACCGGAGATGSEQ ID NO:832ZFAT的外显子3

AGTTTTTGGTCATGAAGAGGAAGAGAGGCAGGCCTAAGGGGTCCACGAAGAAGTCCAGCACAGAAGAGGAGCTGGCAGAAAACATCGTGAGTCCGACTGAGGACAGCCCGCTGGCTCCGGAGGAAGGGAACAGCCTGCCTCCAAGCAGCTTGGAGTGTAGCAAGTGCTGTCGGAAGTTCTCCAACACGCGCCAGCTGCGGAAGCACATCTGCATTATCGTGCTGAATTTGGGTGAGGAGGAAGGAGAAGCAG

SEQ ID NO:833ZFAT的外显子4

GTAACGAGTCTGACCTTGAACTAGAAAAGAAGTGTAAGGAAGATGATCGGGAAAAAGCCTCGAAAAGACCACGGTCACAGAAAACAGAGAAAGTCCAGAAGATCTCAGGAAAGGAGGCCAGACAGCTTTCTGGGGCGAAGAAACCCATCATAAGTGTGGTTTTAACTGCACACGAAGCAATTCCAG

SEQ ID NO:834ZFAT的外显子5

GTGCTACCAAGATTGTGCCAGTGGAGGCTGGGCCCCCTGAAACAGGAGCTACAAATTCTGAGACCACTTCAGCAGACCTGGTGCCTCGGAGAGGCTACCAGGAATACGCCATTCAGCAGACACCTTATGAGCAACCAATGAAGTCAAGCAG

SEQ ID NO:835ZFAT的外显子6

GCTAGGTCCCACTCAGCTCAAAATCTTCACTTGTGAATACTGCAACAAGGTCTTCAAGTTCAAGCACTCGCTGCAGGCCCACCTGAGGATCCACACCAATGAAAAGCCATACAAGTGCCCCCAGTGCAGCTATGCCAGTGCCATCAAGGCCAACCTCAATGTGCACCTGCGCAAGCACACTGGAGAGAAGTTCGCCTGCGACTATTGCTCGTTCACCTGCCTGAGCAAGGGCCACCTCAAGGTGCACATCGAGCGAGTGCACAAGAAGATCAAGCAGCACTGCCGCTTCTGCAAGAAGAAGTACTCTGACGTCAAGAACCTCATCAAGCACATCCGAGACGCGCATGACCCACAGGACAAGAAGGTCAAAGAGGCCTTGGACGAGCTCTGCCTGATGACGAGGGAGGGCAAGCGGCAGCTGCTCTATGACTGCCACATCTGTGAGCGCAAGTTCAAGAACGAGCTGGACCGTGACCGCCATATGCTGGTCCACGGAGACAAGTGGCCTTTTGCCTGTGAGCTCTGTGGCCATGGGGCCACCAAGTACCAGGCGCTGGAACTGCATGTCAGGAAGCACCCCTTCGTGTACGTCTGTGCCGTCTGCCGCAAGAAGTTCGTCAGCTCCATCAGGCTGCGCACCCACATCAAAGAGGTGCACGGGGCTGCCCAGGAGGCCTTGGTCTTCACCAGTTCCATCAACCAGAGCTTCTGCCTCCTGGAACCTGGTGGGGACATCCAGCAAGAAGCTCTGGGGGACCAGCTACAGCTGGTGGAAGAGGAGTTTGCCCTCCAGGGCGTGAATGCACTCAAGGAAGAGGCCTGTCCTGGGGACACTCAGCTGGAGGAGGGCCGGAAGGAGCCGGAGGCCCCTGGGGAAATGCCTGCCCCAGCTGTGCACCTGGCCTCCCCGCAGGCCGAAAGCACAGCCCTGCCACCCTGTGAGCTGGAAACCACCGTGGTCTCCTCCTCAGACCTGCATTCTCAAGAGGTGGTTTCAGATGATTTTTTGTTGAAAAATGATACCTCCTCCGCAGAGGCTCATGCTGCTCCTGAGAAGCCCCCAGACATGCAGCACAGAAGCTCAGTCCAGACGCAAGGTGAAGTGATCACACTACTGCTGTCCAAGGCCCAGAGTGCTGGGTCAGATCAGGAAAGCCATGGCGCCCAGAGCCCCCTAGGGGAAGGGCAGAACATGGCTGTGCTTTCAGCTGGTGACCCAGATCCCAGCAGGTGTCTCAGGTCAAACCCAGCTGAGGCCTCAGACCTCCTCCCTCCAGTAGCTGGTGGTGGGGACACCATCACACATCAGCCTGACTCTTGCAAAGCTGCCCCTGAGCACCGGTCAGGCATCACCGCTTTCATGAAGGTCCTGAACAGTTTACAGAAGAAGCAAATGAACACCAGCTTGTGTGAGCGGATCCGGAAGGTTTATGGAGACCTGGAGTGTGAATACTGTG

SEQ ID NO:836ZFAT的外显子7

GCAAACTTTTTTGGTACCAAGTGCATTTTGATATGCATGTCCGCACCCACACCCGGGAACATCTGTATTATTGCTCTCAGTGTCATTATTCTTCCATCACCAAAAACTGCCTTAAACGCCACGTAATTCAGAAACACAGTAACATCTTGCTGAAGTGTCCCACCGATGGCTGTGACTACTCAACTCCAGATAAATATAAGCTACAGGCACATCTTAAAGTTCACACAGCACTG

SEQ ID NO:837ZFAT的外显子8

GACAAAAGGAGTTATTCTTGTCCTGTTTGTGAAAAGTCTTTTTCAGAGGATCGATTGATAAAGTCACATATCAAGACCAACCATCCTG

SEQ ID NO:838ZFAT的外显子9

AGGTCTCCATGAGCACCATTTCTGAGGTTCTCGGGAGGAGGGTTCAGCTGAAAGGGCTAATTGGAAAGAGAGCCATGAAATGCCCATATTGTGACTTTTATTTCATGAAGAATGGCTCAGACCTTCAGCGTCATATTTGGGCTCATGAAG

SEQ ID NO:839ZFAT的外显子10

GTGTGAAGCCCTTCAAGTGTTCTTTGTGTGAGTATGCAACTCGTAGCAAGAGTAACCTCAAGGCTCATATGAATCGTCACAGCACTGAGAAAACCCACCTATGTGACATGTGTGGCAAGAAATTCAAATCAAAAGGGACACTGAAAAGTCACAAACTCCTTCACACTGCAGATG

SEQ ID NO:840ZFAT的外显子11

GGAAGCAGTTTAAGTGCACGGTGTGTGACTACACAGCGGCCCAGAAGCCACAGCTGCTGCGGCACATGGAACAGCATGTCTCCTTCAAG

SEQ ID NO:841ZFAT的外显子12

CCTTTCCGCTGTGCCCATTGCCATTACTCCTGCAACATATCTGGCTCTCTGAAGCGGCACTACAACAGGAAGCACCCTAATGAGGAGTATGCCAACGTGGGCACCGGGGAGCTGGCAGCGGAGGTGCTCATCCAGCAAG

SEQ ID NO:842ZFAT的外显子13

GTGGTTTGAAGTGTCCTGTTTGCAGCTTTGTATATGGCACCAAATGGGAGTTCAATAGGCACTTGAAGAACAAACATGGCTTGAAGGTGGTGGAAATTGATGGAGACCCCAAGTGGGAG

SEQ ID NO:843ZFAT的外显子14

ACAGCAACAGAAGCTCCTGAGGAGCCCTCCACCCAGTATCTCCACATCACAGAGGCCGAAGAAGACGTTCAAGGGACACAGGCAGCGGTGGCCGCGCTCCAGGACCTGAGATACACCTCTGAGAGTG

SEQ ID NO:844ZFAT的外显子15

GCGACCGACTGGACCCCACGGCCGTGAACATCCTGCAGCAGATCATTGAGCTGGGCGCCGAGACCCATGACGCCACTGCCCTTGCCTCGGTGGTTGCCATGGCACCAGGGACGGTGACTGTGGTTAAGCAG

SEQ ID NO:845ZFAT的外显子16

GTCACCGAGGAGGAGCCCAGCTCCAACCACACGGTCATGATCCAGGAGACGGTCCAG

CAAGCGTCCGTGGAGCTTGCCGAGCAGCACCACCTGGTGGTGTCCTCCGACGACGTGG

AGGGCATTGAGACGGTGACTGTCTACACGCAGGGCGGGGAGGCCTCGGAGTTCATCGT

CTACGTGCAGGAGGCCATGCAGCCTGTGGAGGAGCAGGCTGTGGAGCAGCCGGCCCA

GGAACTCTAGAGGACATGTGGCATCGGATGGCCACAGGGCGGGGCTGCCAGGCTCTGC

AGGCACCCAGGGTGGGGAGGCCACCCTTCCTGCCCTACCCGCAGAATGGTGCTCTCCT

TTGCCCTCCCTGCCCAGCAGCCTGATAGGACTCTCCTAGTCCAACTTGGGGTGGGCAA

GGCAGTCAGCATCACCAGCAATACCACAGGACCCTCACCCCAGCATAGACACACACCC

CCTGACCCTTACCATCTGCTTCCTGAAAGACTTCAGTGTCAGCTCCCCTACACACACCC

CACACCTTCACCCCTTGCTTCAAGATTCAAACAGAGACTCCCAGTCCCCCTCAGCATCT

TCCCTGAATCACAGCCCCAGCTCCTTGACCCCCATCTAGGTGCCAAATGTTCATCTGCA

ACCGCTATGCAGTCTGGTGAGAGGGAGACAGCCATCACATAGAAAGTGACCGTACGGG

TTTTTAATCACTGCTGGGTGGGGTGGGGGTAGGGGGATTGTCCTGGCTTTGTCGACAAA

GTCCCACTTCCCCGAGTATTAAGGGCCCTTGGTATCAAGTGAGGTAAATTCACCCATCA

CAGGGTCTCGCCCTACCATCCTGGAATTATTTCACTTTTAAGATAAATGCACTATTTCACT

GTTCGCCTCCCATTCTAAGGAGGTGAGGTGGTTGGAATAAAAACAGTTCCTGTCTGAASEQ ID NO:846ZFAT的全mRNA多核苷酸序列

ATCCGCCATGTTGGATGCCGCAGATTCGCCATAACCTCGCCGGCTCTTTTCTTAAAAAA

ATAAAAATAAAAAGCGAAGCGTCAGCAGGGCGCCCCGCCCCCTCGGTCGGCACGGGA

GGGGGCCCGGAAGAGCCCGAGGCTTTTTTTTCCTCCGCGGTGGGGCGTTGCCATGGAG

ACGCGGGCGGCAGAAAACACGGCCATCTTTATGTGTAAATGTTGTAACCTCTTCTCACC

AAATCAGTCGGAACTCCTCTCCCACGTTTCAGAGAAGCACATGGAAGAAGGGGTTAAT

GTTGATGAGATTATTATTCCCCTTAGGCCTCTGAGTACACCTGAACCCCCCAACTCAAGC

AAAACCGGAGATGAGTTTTTGGTCATGAAGAGGAAGAGAGGCAGGCCTAAGGGGTCC

ACGAAGAAGTCCAGCACAGAAGAGGAGCTGGCAGAAAACATCGTGAGTCCGACTGAG

GACAGCCCGCTGGCTCCGGAGGAAGGGAACAGCCTGCCTCCAAGCAGCTTGGAGTGT

AGCAAGTGCTGTCGGAAGTTCTCCAACACGCGCCAGCTGCGGAAGCACATCTGCATTA

TCGTGCTGAATTTGGGTGAGGAGGAAGGAGAAGCAGGTAACGAGTCTGACCTTGAAC

TAGAAAAGAAGTGTAAGGAAGATGATCGGGAAAAAGCCTCGAAAAGACCACGGTCAC

AGAAAACAGAGAAAGTCCAGAAGATCTCAGGAAAGGAGGCCAGACAGCTTTCTGGGG

CGAAGAAACCCATCATAAGTGTGGTTTTAACTGCACACGAAGCAATTCCAGGTGCTACC

AAGATTGTGCCAGTGGAGGCTGGGCCCCCTGAAACAGGAGCTACAAATTCTGAGACCA

CTTCAGCAGACCTGGTGCCTCGGAGAGGCTACCAGGAATACGCCATTCAGCAGACACC

TTATGAGCAACCAATGAAGTCAAGCAGGCTAGGTCCCACTCAGCTCAAAATCTTCACTT

GTGAATACTGCAACAAGGTCTTCAAGTTCAAGCACTCGCTGCAGGCCCACCTGAGGAT

CCACACCAATGAAAAGCCATACAAGTGCCCCCAGTGCAGCTATGCCAGTGCCATCAAG

GCCAACCTCAATGTGCACCTGCGCAAGCACACTGGAGAGAAGTTCGCCTGCGACTATT

GCTCGTTCACCTGCCTGAGCAAGGGCCACCTCAAGGTGCACATCGAGCGAGTGCACAA

GAAGATCAAGCAGCACTGCCGCTTCTGCAAGAAGAAGTACTCTGACGTCAAGAACCTC

ATCAAGCACATCCGAGACGCGCATGACCCACAGGACAAGAAGGTCAAAGAGGCCTTG

GACGAGCTCTGCCTGATGACGAGGGAGGGCAAGCGGCAGCTGCTCTATGACTGCCACA

TCTGTGAGCGCAAGTTCAAGAACGAGCTGGACCGTGACCGCCATATGCTGGTCCACGG

AGACAAGTGGCCTTTTGCCTGTGAGCTCTGTGGCCATGGGGCCACCAAGTACCAGGCG

CTGGAACTGCATGTCAGGAAGCACCCCTTCGTGTACGTCTGTGCCGTCTGCCGCAAGA

AGTTCGTCAGCTCCATCAGGCTGCGCACCCACATCAAAGAGGTGCACGGGGCTGCCCA

GGAGGCCTTGGTCTTCACCAGTTCCATCAACCAGAGCTTCTGCCTCCTGGAACCTGGTG

GGGACATCCAGCAAGAAGCTCTGGGGGACCAGCTACAGCTGGTGGAAGAGGAGTTTG

CCCTCCAGGGCGTGAATGCACTCAAGGAAGAGGCCTGTCCTGGGGACACTCAGCTGG

AGGAGGGCCGGAAGGAGCCGGAGGCCCCTGGGGAAATGCCTGCCCCAGCTGTGCACC

TGGCCTCCCCGCAGGCCGAAAGCACAGCCCTGCCACCCTGTGAGCTGGAAACCACCGT

GGTCTCCTCCTCAGACCTGCATTCTCAAGAGGTGGTTTCAGATGATTTTTTGTTGAAAA

ATGATACCTCCTCCGCAGAGGCTCATGCTGCTCCTGAGAAGCCCCCAGACATGCAGCAC

AGAAGCTCAGTCCAGACGCAAGGTGAAGTGATCACACTACTGCTGTCCAAGGCCCAGAGTGCTGGGTCAGATCAGGAAAGCCATGGCGCCCAGAGCCCCCTAGGGGAAGGGCAGAACATGGCTGTGCTTTCAGCTGGTGACCCAGATCCCAGCAGGTGTCTCAGGTCAAACCCAGCTGAGGCCTCAGACCTCCTCCCTCCAGTAGCTGGTGGTGGGGACACCATCACACATCAGCCTGACTCTTGCAAAGCTGCCCCTGAGCACCGGTCAGGCATCACCGCTTTCATGAAGGTCCTGAACAGTTTACAGAAGAAGCAAATGAACACCAGCTTGTGTGAGCGGATCCGGAAGGTTTATGGAGACCTGGAGTGTGAATACTGTGGCAAACTTTTTTGGTACCAAGTGCATTTTGATATGCATGTCCGCACCCACACCCGGGAACATCTGTATTATTGCTCTCAGTGTCATTATTCTTCCATCACCAAAAACTGCCTTAAACGCCACGTAATTCAGAAACACAGTAACATCTTGCTGAAGTGTCCCACCGATGGCTGTGACTACTCAACTCCAGATAAATATAAGCTACAGGCACATCTTAAAGTTCACACAGCACTGGACAAAAGGAGTTATTCTTGTCCTGTTTGTGAAAAGTCTTTTTCAGAGGATCGATTGATAAAGTCACATATCAAGACCAACCATCCTGAGGTCTCCATGAGCACCATTTCTGAGGTTCTCGGGAGGAGGGTTCAGCTGAAAGGGCTAATTGGAAAGAGAGCCATGAAATGCCCATATTGTGACTTTTATTTCATGAAGAATGGCTCAGACCTTCAGCGTCATATTTGGGCTCATGAAGGTGTGAAGCCCTTCAAGTGTTCTTTGTGTGAGTATGCAACTCGTAGCAAGAGTAACCTCAAGGCTCATATGAATCGTCACAGCACTGAGAAAACCCACCTATGTGACATGTGTGGCAAGAAATTCAAATCAAAAGGGACACTGAAAAGTCACAAACTCCTTCACACTGCAGATGGGAAGCAGTTTAAGTGCACGGTGTGTGACTACACAGCGGCCCAGAAGCCACAGCTGCTGCGGCACATGGAACAGCATGTCTCCTTCAAGCCTTTCCGCTGTGCCCATTGCCATTACTCCTGCAACATATCTGGCTCTCTGAAGCGGCACTACAACAGGAAGCACCCTAATGAGGAGTATGCCAACGTGGGCACCGGGGAGCTGGCAGCGGAGGTGCTCATCCAGCAAGGTGGTTTGAAGTGTCCTGTTTGCAGCTTTGTATATGGCACCAAATGGGAGTTCAATAGGCACTTGAAGAACAAACATGGCTTGAAGGTGGTGGAAATTGATGGAGACCCCAAGTGGGAGACAGCAACAGAAGCTCCTGAGGAGCCCTCCACCCAGTATCTCCACATCACAGAGGCCGAAGAAGACGTTCAAGGGACACAGGCAGCGGTGGCCGCGCTCCAGGACCTGAGATACACCTCTGAGAGTGGCGACCGACTGGACCCCACGGCCGTGAACATCCTGCAGCAGATCATTGAGCTGGGCGCCGAGACCCATGACGCCACTGCCCTTGCCTCGGTGGTTGCCATGGCACCAGGGACGGTGACTGTGGTTAAGCAGGTCACCGAGGAGGAGCCCAGCTCCAACCACACGGTCATGATCCAGGAGACGGTCCAGCAAGCGTCCGTGGAGCTTGCCGAGCAGCACCACCTGGTGGTGTCCTCCGACGACGTGGAGGGCATTGAGACGGTGACTGTCTACACGCAGGGCGGGGAGGCCTCGGAGTTCATCGTCTACGTGCAGGAGGCCATGCAGCCTGTGGAGGAGCAGGCTGTGGAGCAGCCGGCCCAGGAACTCTAGAGGACATGTGGCATCGGATGGCCACAGGGCGGGGCTGCCAGGCTCTGCAGGCACCCAGGGTGGGGAGGCCACCCTTCCTGCCCTACCCGCAGAATGGTGCTCTCCTTTGCCCTCCCTGCCCAGCAGCCTGATAGGACTCTCCTAGTCCAACTTGGGGTGGGCAAGGCAGTCAGCATCACCAGCAATACCACAGGACCCTCACCCCAGCATAGACACACACCCCCTGACCCTTACCATCTGCTTCCTGAAAGACTTCAGTGTCAGCTCCCCTACACACACCCCACACCTTCACCCCTTGCTTCAAGATTCAAACAGAGACTCCCAGTCCCCCTCAGCATCTTCCCTGAATCACAGCCCCAGCTCCTTGACCCCCATCTAGGTGCCAAATGTTCATCTGCAACCGCTATGCAGTCTGGTGAGAGGGAGACAGCCATCACATAGAAAGTGACCGTACGGGTTTTTAATCACTGCTGGGTGGGGTGGGGGTAGGGGGATTGTCCTGGCTTTGTCGACAAAGTCCCACTTCCCCGAGTATTAAGGGCCCTTGGTATCAAGTGAGGTAAATTCACCCATCACAGGGTCTCGCCCTACCATCCTGGAATTATTTCACTTTTAAGATAAATGCACTATTTCACTGTTCGCCTCCCATTCTAAGGAGGTGAGGTGGTTGGAATAAAAACAGTTCCTGTCTGAA

SEQ ID NO:847ZFAT的外显子1的翻译多肽序列

METRA

SEQ ID NO:848ZFAT的外显子2的翻译多肽序列

NTAIFMCKCCNLFSPNQSELLSHVSEKHMEEGVNVDEIIIPLRPLSTPEPPNSSKTGD

SEQ ID NO:849ZFAT的外显子3的翻译多肽序列

FLVMKRKRGRPKGSTKKSSTEEELAENIVSPTEDSPLAPEEGNSLPPSSLECSKCCRKFSNTRQLRKHICIIVLNLGEEEGEA

SEQ ID NO:850ZFAT的外显子4的翻译多肽序列

NESDLELEKKCKEDDREKASKRPRSQKTEKVQKISGKEARQLSGAKKPIISVVLTAHEAIP

SEQ ID NO:851ZFAT的外显子5的翻译多肽序列

ATKIVPVEAGPPETGATNSETTSADLVPRRGYQEYAIQQTPYEQPMKSS

SEQ ID NO:852ZFAT的外显子6的翻译多肽序列

LGPTQLKIFTCEYCNKVFKFKHSLQAHLRIHTNEKPYKCPQCSYASAIKANLNVHLRKHTGEKFACDYCSFTCLSKGHLKVHIERVHKKIKQHCRFCKKKYSDVKNLIKHIRDAHDPQDKKVKEALDELCLMTREGKRQLLYDCHICERKFKNELDRDRHMLVHGDKWPFACELCGHGATKYQALELHVRKHPFVYVCAVCRKKFVSSIRLRTHIKEVHGAAQEALVFTSSINQSFCLLEPGGDIQQEALGDQLQLVEEEFALQGVNALKEEACPGDTQLEEGRKEPEAPGEMPAPAVHLASPQAESTALPPCELETTVVSSSDLHSQEVVSDDFLLKNDTSSAEAHAAPEKPPDMQHRSSVQTQGEVITLLLSKAQSAGSDQESHGAQSPLGEGQNMAVLSAGDPDPSRCLRSNPAEASDLLPPVAGGGDTITHQPDSCKAAPEHRSGITAFMKVLNSLQKKQMNTSLCERIRKVYGDLECEYC

SEQ ID NO:853ZFAT的外显子7的翻译多肽序列

KLFWYQVHFDMHVRTHTREHLYYCSQCHYSSITKNCLKRHVIQKHSNILLKCPTDGCDYSTPDKYKLQAHLKVHTAL

SEQ ID NO:854ZFAT的外显子8的翻译多肽序列

DKRSYSCPVCEKSFSEDRLIKSHIKTNHP

SEQ ID NO:855ZFAT的外显子9的翻译多肽序列

VSMSTISEVLGRRVQLKGLIGKRAMKCPYCDFYFMKNGSDLQRHIWAHE

SEQ ID NO:856ZFAT的外显子10的翻译多肽序列

VKPFKCSLCEYATRSKSNLKAHMNRHSTEKTHLCDMCGKKFKSKGTLKSHKLLHTAD

SEQ ID NO:857ZFAT的外显子11的翻译多肽序列

KQFKCTVCDYTAAQKPQLLRHMEQHVSFK

SEQ ID NO:858ZFAT的外显子12的翻译多肽序列

PFRCAHCHYSCNISGSLKRHYNRKHPNEEYANVGTGELAAEVLIQQ

SEQ ID NO:859ZFAT的外显子13的翻译多肽序列

GLKCPVCSFVYGTKWEFNRHLKNKHGLKVVEIDGDPKWE

SEQ ID NO:860ZFAT的外显子14的翻译多肽序列

TATEAPEEPSTQYLHITEAEEDVQGTQAAVAALQDLRYTSES

SEQ ID NO:861ZFAT的外显子15的翻译多肽序列

DRLDPTAVNILQQIIELGAETHDATALASVVAMAPGTVTVVKQ

SEQ ID NO:862ZFAT的外显子16的翻译多肽序列

VTEEEPSSNHTVMIQETVQQASVELAEQHHLVVSSDDVEGIETVTVYTQGGEASEFIVYVQEAMQPVEEQAVEQPAQEL

SEQ ID NO:863ZFAT的全蛋白质序列

METRAAENTAIFMCKCCNLFSPNQSELLSHVSEKHMEEGVNVDEIIIPLRPLSTPEPPNSSKTGDEFLVMKRKRGRPKGSTKKSSTEEELAENIVSPTEDSPLAPEEGNSLPPSSLECSKCCRKFSNTRQLRKHICIIVLNLGEEEGEAGNESDLELEKKCKEDDREKASKRPRSQKTEKVQKISGKEARQLSGAKKPIISVVLTAHEAIPGATKIVPVEAGPPETGATNSETTSADLVPRRGYQEYAIQQTPYEQPMKSSRLGPTQLKIFTCEYCNKVFKFKHSLQAHLRIHTNEKPYKCPQCSYASAIKANLNVHLRKHTGEKFACDYCSFTCLSKGHLKVHIERVHKKIKQHCRFCKKKYSDVKNLIKHIRDAHDPQDKKVKEALDELCLMTREGKRQLLYDCHICERKFKNELDRDRHMLVHGDKWPFACELCGHGATKYQALELHVRKHPFVYVCAVCRKKFVSSIRLRTHIKEVHGAAQEALVFTSSINQSFCLLEPGGDIQQEALGDQLQLVEEEFALQGVNALKEEACPGDTQLEEGRKEPEAPGEMPAPAVHLASPQAESTALPPCELETTVVSSSDLHSQEVVSDDFLLKNDTSSAEAHAAPEKPPDMQHRSSVQTQGEVITLLLSKAQSAGSDQESHGAQSPLGEGQNMAVLSAGDPDPSRCLRSNPAEASDLLPPVAGGGDTITHQPDSCKAAPEHRSGITAFMKVLNSLQKKQMNTSLCERIRKVYGDLECEYCGKLFWYQVHFDMHVRTHTREHLYYCSQCHYSSITKNCLKRHVIQKHSNILLKCPTDGCDYSTPDKYKLQAHLKVHTALDKRSYSCPVCEKSFSEDRLIKSHIKTNHPEVSMSTISEVLGRRVQLKGLIGKRAMKCPYCDFYFMKNGSDLQRHIWAHEGVKPFKCSLCEYATRSKSNLKAHMNRHSTEKTHLCDMCGKKFKSKGTLKSHKLLHTADGKQFKCTVCDYTAAQKPQLLRHMEQHVSFKPFRCAHCHYSCNISGSLKRHYNRKHPNEEYANVGTGELAAEVLIQQGGLKCPVCSFVYGTKWEFNRHLKNKHGLKVVEIDGDPKWETATEAPEEPSTQYLHITEAEEDVQGTQAAVAALQDLRYTSESGDRLDPTAVNILQQIIELGAETHDATALASVVAMAPGTVTVVKQVTEEEPSSNHTVMIQETVQQASVELAEQHHLVVSSDDVEGIETVTVYTQGGEASEFIVYVQEAMQPVEEQAVEQPAQEL

SEQ ID NO:864ZFAT的全部外显子1-12按顺序排列的多核苷酸序列

SEQ ID NO:865ZFAT的全部外显子1-12按顺序排列的翻译多肽序列

DSCAML1序列信息

SEQ ID NO:866来自DSCAML1-NRG1融合物5’处的DSCAML1外显子3的序列

GCCTCATCCCCTCTTCAGTGCAGGAATATGTTAGCGTTGTATCTTGGGAGAAAGACACAGTCTCCATCATCCCAG

SEQ ID NO:867DSCAML1-NRG1融合物3’处的NRG1外显子2序列

CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA

SEQ ID NO:868DSCAML1-NRG1多核苷酸序列

GCCTCATCCCCTCTTCAGTGCAGGAATATGTTAGCGTTGTATCTTGGGAGAAAGACACAGTCTCCATCATCCCAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA

SEQ ID NO:869DSCAML1-NRG1多肽序列

LIPSSVQEYVSVVSWEKDTVSIIPALPPRLKEMKSQESAAGSKLVLRCE

SEQ ID NO:870DSCAML1的外显子1

AGCCGAGCGCTGGGCTGAGGAGCAGAGAGAGCGGGGCGCCGAGTGCGGGCGGCTGGGAGCGCGCTGAGCGGGGGAGAGGCGCTGCCGCACGGCCGGCCACAGGACCACCTCCCCGGAGAATAGGGCCTCTTTATGGCATGTGGCTGGTAACTTTCCTCCTGCTCCTGGACTCTTTACACAAAG

SEQ ID NO:871DSCAML1的外显子2

CCCGCCCTGAAGATGTTGGCACCAGCCTCTACTTTGTAAATGACTCCTTGCAGCAGGTGACCTTTTCCAGCTCCGTGGGGGTGGTGGTGCCCTGCCCGGCCGCGGGCTCCCCCAGCGCGGCCCTTCGATGGTACCTGGCCACAGGGGACGACATCTACGACGTGCCGCACATCCGGCACGTCCACGCCAACGGGACGCTGCAGCTCTACCCCTTCTCCCCCTCCGCCTTCAATAGCTTTATCCACGACAATGACTACTTCTGCACCGCGGAGAACGCTGCCGGCAAGATCCGGAGCCCCAACATCCGCGTCAAAGCAG

SEQ ID NO:872DSCAML1的外显子3

TTTTCAGGGAACCCTACACCGTCCGGGTGGAGGATCAAAGGTCAATGCGTGGCAACGTGGCCGTCTTCAAGTGCCTCATCCCCTCTTCAGTGCAGGAATATGTTAGCGTTGTATCTTGGGAGAAAGACACAGTCTCCATCATCCCAG

SEQ ID NO:873DSCAML1的外显子4

AACACAGGTTTTTTATTACCTACCACGGCGGGCTGTACATCTCTGACGTACAGAAGGAGGACGCCCTCTCCACCTATCGCTGCATCACCAAGCACAAGTATAGCGGGGAGACCCGGCAGAGCAATGGGGCACGCCTCTCTGTGACAG

SEQ ID NO:874DSCAML1的外显子5

ACCCTGCTGAGTCGATCCCCACCATCCTGGATGGCTTCCACTCCCAGGAAGTGTGGGCCGGCCACACCGTGGAGCTGCCCTGCACCGCCTCGGGCTACCCTATCCCCGCCATCCGCTGGCTCAAGGATGGCCGGCCCCTCCCGGCTGACAGCCGCTGGACCAAGCGCATCACAGGGCTGACCATCAGCGACTTGCGGACCGAGGACAGCGGCACCTACATTTGTGAGGTCACCAACACCTTCGGTTCGGCAGAGGCCACAGGCATCCTCATGGTCATTG

SEQ ID NO:875DSCAML1的外显子6

ATCCCCTTCATGTGACCCTGACACCAAAGAAGCTGAAGACCGGCATTGGCAGCACGGTCATCCTCTCCTGTGCCCTGACGGGCTCCCCAGAGTTCACCATCCGCTGGTATCGCAACACGGAGCTGGTGCTGCCTGACGAGGCCATCTCCATCCGCGGGCTCAGCAACGAGACGCTGCTCATCACCTCGGCCCAGAAGAGCCATTCCGGGGCCTACCAGTGCTTCGCTACCCGCAAGGCCCAGACCGCCCAGGACTTTGCCATCATTGCACTTGAGG

SEQ ID NO:876DSCAML1的外显子7

ATGGCACGCCCCGCATCGTCTCGTCCTTCAGCGAGAAGGTGGTCAACCCCGGGGAGCAGTTCTCACTGATGTGTGCGGCCAAGGGCGCCCCGCCCCCCACGGTCACCTGGGCCCTCGACGATGAGCCCATCGTGCGGGATGGCAGCCACCGCACCAACCAGTACACCATGTCGGACGGCACCACCATCAGCCACATGAACGTCACAGGCCCCCAGATCCGCGACGGGGGCGTGTACCGGTGCACAGCGCGGAACTTGGTGGGCAGTGCTGAATATCAGGCGCGAATAAACGTAAGAG

SEQ ID NO:877DSCAML1的外显子8

GCCCACCCAGCATCCGGGCTATGCGGAACATCACAGCAGTCGCCGGGCGGGACACCCTTATCAACTGCAGGGTCATCGGCTATCCCTACTACTCCATCAAGTGGTACAAGGATGCCCTGCTGCTGCCAGACAACCACCGCCAGGTGGTGTTTGAGAATGGGACCCTCAAGCTGACTGACGTGCAGAAGGGCATGGATGAGGGGGAGTACCTGTGCAGTGTCCTCATCCAGCCCCAGCTCTCCATCAGCCAGAGCGTTCACGTAGCCGTCAAAG

SEQ ID NO:878DSCAML1的外显子9

TGCCCCCTCTGATCCAGCCCTTCGAATTCCCACCCGCCTCCATCGGCCAGCTGCTCTACATTCCCTGTGTGGTGTCCTCGGGGGACATGCCCATCCGTATCACCTGGAGGAAGGACGGACAGGTGATCATCTCAGGCTCGGGCGTGACCATCGAGAGCAAGGAATTCATGAGCTCCCTGCAGATCTCTAGCGTCTCCCTCAAGCACAACGGCAACTATACATGCATCGCCAGCAACGCAGCCGCCACCGTGAGCCGGGAGCGCCAGCTCATCGTGCGTG

SEQ ID NO:879DSCAML1的外显子10

TGCCCCCTCGATTTGTGGTGCAACCCAACAACCAGGATGGCATCTACGGCAAAGCTGGTGTGCTCAACTGCTCGGTGGACGGCTACCCCCCACCCAAGGTCATGTGGAAGCATGCCAAGG

SEQ ID NO:880DSCAML1的外显子11

GGAGCGGGAACCCCCAGCAGTACCACCCTGTGCCCCTCACTGGCCGCATCCAGATCCTGCCCAACAGCTCGCTGCTGATCCGCCACGTCCTAGAAGAGGACATCGGCTACTACCTCTGCCAGGCCAGCAACGGCGTAGGCACCGACATCAGCAAGTCCATGTTCCTCACAGTCAAGA

SEQ ID NO:881DSCAML1的外显子12

TCCCGGCCATGATCACTTCCCACCCCAACACCACCATCGCCATCAAGGGCCATGCGAAGGAGCTAAACTGCACGGCACGGGGTGAGCGGCCCATCATCATCCGCTGGGAGAAGGGGGACACAGTCATCGACCCTGACCGCGTCATGCGGTATGCCATCGCCACCAAGGACAACGGCGACGAGGTCGTCTCCACACTGAAG

SEQ ID NO:882DSCAML1的外显子13

CTCAAGCCCGCTGACCGTGGGGACTCTGTGTTCTTCAGCTGCCATGCCATCAACTCGTATGGGGAGGACCGGGGCTTGATCCAACTCACTGTGCAAG

SEQ ID NO:883DSCAML1的外显子14

AGCCCCCCGACCCCCCAGAGCTGGAGATCCGGGAGGTGAAGGCCCGGAGCATGAACCTGCGCTGGACCCAGCGATTCGACGGGAACAGCATCATCACGGGCTTCGACATTGAATACAAGAACAAATCAG

SEQ ID NO:884DSCAML1的外显子15

ATTCCTGGGACTTCAAGCAGTCCACACGCAACATCTCCCCCACCATCAACCAGGCCAACATTGTGGACTTGCACCCGGCATCTGTGTACAGCATCCGCATGTACTCTTTCAACAAGATTGGCCGCAGTGAACCAAGCAAGGAGCTCACCATCAGCACTGAGGAGGCCG

SEQ ID NO:885DSCAML1的外显子16

CTCCCGATGGGCCCCCCATGGATGTTACCTTGCAGCCAGTGACCTCACAGAGCATCCAGGTGACCTGGAAG

SEQ ID NO:886DSCAML1的外显子17

GCACCCAAGAAGGAGCTGCAGAACGGTGTCATCCGGGGCTACCAGATTGGCTACAGAGAGAACAGCCCCGGCAGCAACGGGCAGTACAGCATCGTGGAGATGAAGGCCACGGGGGACAGCGAGGTCTACACCCTGGACAACCTCAAGAAGTTCGCCCAGTATGGGGTGGTGGTCCAAGCCTTCAATCGGGCTGGCACGGGGCCCTCTTCCAGCGAGATCAATGCCACCACTCTGGAGGATG

SEQ ID NO:887DSCAML1的外显子18

TGCCCAGCCAGCCCCCTGAGAACGTCCGGGCCCTGTCCATCACTTCTGACGTGGCCGTCATCTCCTGGTCAGAGCCCCCGCGCAGCACCCTCAATGGCGTCCTCAAAGGCTATCGGGTCATCTTCTGGTCCCTCTATGTTGATGGGG

SEQ ID NO:888DSCAML1的外显子19

AGTGGGGCGAGATGCAGAACATCACCACCACGCGGGAGCGGGTGGAGCTGCGGGGCATGGAGAAGTTCACCAACTACAGCGTCCAGGTGCTGGCCTACACCCAGGCTGGGGACGGCGTACGCAGCAGTGTGCTCTACATCCAGACCAAGGAGGACG

SEQ ID NO:889DSCAML1的外显子20

TTCCAGGTCCCCCTGCTGGCATCAAAGCTGTCCCTTCATCAGCTAGCAGTGTGGTTGTGTCTTGGCTCCCCCCTACCAAGCCCAACGGGGTGATCCGCAAGTACACCATCTTCTGTTCCAGCCCCGGGTCTGGCCAGCCG

SEQ ID NO:890DSCAML1的外显子21

GCTCCCAGCGAGTACGAGACGAGTCCAGAGCAGCTCTTCTACCGGATCGCCCACCTAAACCGCGGTCAGCAGTATCTGCTGTGGGTGGCCGCCGTCACCTCTGCCGGCCGGGGCAACAGCAGCGAGAAGGTGACCATCGAGCCTGCTGGCAAGG

SEQ ID NO:891DSCAML1的外显子22

CCCCAGCAAAGATCATCTCCTTTGGGGGCACCGTGACAACACCTTGGATGAAAGATGTTCGGCTGCCTTGCAATTCAGTGGGAGATCCAGCCCCTGCTGTGAAGTGGACCAAGGACAG

SEQ ID NO:892DSCAML1的外显子23

TGAAGACTCGGCCATTCCAGTGTCCATGGATGGGCACCGGCTCATCCACACCAATGGCACACTGCTGCTGCGTGCAGTGAAGGCTGAGGACTCTGGCTACTACACGTGCACGGCCACCAACACTGGTGGCTTTGACACCATCATCGTCAACCTTCTGGTGCAAG

SEQ ID NO:893DSCAML1的外显子24

TTCCCCCGGACCAGCCCCGCCTCACTGTCTCCAAAACCTCAGCTTCGTCCATCACCCTGACCTGGATTCCAGGTGACAATGGGGGCAGCTCCATCCGAG

SEQ ID NO:894DSCAML1的外显子25

GCTTCGTGCTACAGTACTCGGTGGACAACAGCGAGGAGTGGAAGGATGTGTTCATCAGCTCCAGCGAGCGCTCCTTCAAGCTGGACAGCCTCAAGTGTGGCACGTGGTACAAGGTGAAGCTGGCAGCCAAGAACAGCGTGGGCTCTGGGCGCATCAGCGAGATCATCGAGGCCAAGACCCACGGGCGGG

SEQ ID NO:895DSCAML1的外显子26

AGCCCTCCTTCAGCAAAGACCAACACCTCTTCACCCACATCAACTCCACGCATGCTCGGCTTAACCTGCAGGGCTGGAACAATGGGGGCTGCCCTATCACAGCCATCGTTCTGGAGTACCGGCCCAAGGGGACCTGGGCCTGGCAGGGCCTCCGGGCCAACAGCTCCGGGGAGGTGTTTCTGACGGAACTGCGAGAGGCCACGTGGTACGAGCTGCGCATGAGGGCTTGCAACAGTGCGGGCTGCGGCAATGAAACAGCCCAGTTCGCCACCCTGGACTACGATGGCA

SEQ ID NO:896DSCAML1的外显子27

GCACCATTCCACCCATCAAGTCTGCTCAAGGTGAAGGGGATGATGTGAAGAAGCTGTTCACCATCGGCTGCCCTGTCATCCTGGCCACACTGGGGGTGGCACTGCTCTTCATCGTACGCAAGAAGAGGAAGGAGAAACGGCTGAAGCGACTCCGAG

SEQ ID NO:897DSCAML1的外显子28

ATGCAAAGAGTTTGGCAGAAATGTTGATAAG

SEQ ID NO:898DSCAML1的外显子29

CAAGAACAATAGAAGCTTTGACACCCCTGTGAAAGGGCCACCCCAGGGCCCACGGCTACACATTGACATCCCCAGGGTCCAGCTGCTCATCGAGGACAAAGAAGGCATCAAGCAACTGG

SEQ ID NO:899DSCAML1的外显子30

GAGATGACAAGGCCACCATCCCTGTGACAGATGCTGAGTTCAGCCAAGCTGTCAACCCACAGAGCTTCTGTACTGGCGTCTCCTTGCACCACCCAACCCTCATCCAGAGCACAGGACCCCTCATCGACATGTCTGACATCCGGCCAGGAACCA

SEQ ID NO:900DSCAML1的外显子31

ATCCAGTGTCCAGGAAGAATGTGAAGTCAGCCCACAGCACCCGGAACCGGTACTCAAGCCAGTGGACCCTGACCAAGTGCCAGGCCTCCACACCTGCCCGCACCCTCACCTCCGACTGGCGCACCGTGGGCTCCCAGCATGGTGTCACGGTCACTGAGAGTGACAGCTACAGTGCCAGCCTGTCCCAGGACACAG

SEQ ID NO:901DSCAML1的外显子32

ACAAAGGAAGGAACAGCATGGTGTCCACTGAGAGTGCCTCTTCCACCTACGAGGAGCTGGCCCGGGCCTATGAGCATGCCAAGCTGGAGGAGCAGCTGCAGCACGCCAAGTTTGAGATCACCGAGTGCTTCATCTCTGACAGTTCCTCTGACCAGATGACCACAGGCACCAACGAGAACGCCGACAGCATGACATCCATGAGCACACCCTCAGAGCCTGGCATCTGCCGCTTTACCGCCTCACCACCCAAGCCCCAGGATGCGGACCGGGGCAAAAACGTGGCTGTGCCCATCCCTCACCGGGCCAACAAGA

SEQ ID NO:902DSCAML1的外显子33

GTGACTACTGCAACCTGCCCCTGTATGCCAAGTCAGAGGCCTTCTTTCGAAAGGCAGATGGACGTGAGCCCTGCCCCGTGGTCCCACCCCGTGAGGCCTCCATCCGGAACCTGGCTCGAACCTACCACACCCAGGCTCGCCACCTGACCCTGGACCCTGCCAGCAAGTCCTTGGGCCTTCCCCACCCAGGGGCCCCCGCTGCCGCCTCCACAGCCACCTTACCTCAGAGGACTCTGGCCATGCCAGCCCCCCCAGCCGGCACAGCCCCCCCAGCCCCCGGCCCCACCCCTGCTGAGCCACCCACCGCCCCCAGCGCTGCCCCTCCGGCCCCCAGCACCGAGCCTCCACGAGCCGGGGGCCCACACACCAAAATGGGGGGCTCCAGGGACTCGCTTCTCGAGATGAGCACATCGGGGGTAGGGAGGTCTCAGAAGCAGGGGGCCGGGGCCTACTCCAAATCCTACACCCTGGTGTAGGGCCCGCAGGAAGAGCAGCCACGCCTGGACCGCGCCGCGCCGCAGCCCCACACGCCAGCTCGGCTGTTTTTCTGCATTATTTATATTCAACTGACAGACAAAAACCAACCAACGACAAAACAAAAACCCCCAATCATGAACGCCTGTACATAGAACTCTTTTGTACAAATGAAACTATTTTCTTCTTCTCCATGAAGCCAGGGCACAAAGAATTTGACAGTACAAGTCAAATCCCCCACCCCACAAAATATGTGTGGAGATATATATACATATATAGACAGACAGGAACGCGTCCACGAGCTATATATCTATATATTTCTCTCACCCTATTTTGAGACAGAGGCACAAAGACTCAGCAATTTTTTTCCCTCCTCCTCACCTTCCCCCCAGTCTAGGTGGTTTTGACAAAGACCAAAATCCCAACTCAGAGACACTGCATGCGATTTTACTGTTCCAAGAAAACCAGGAGTTGCTTCAATTTGCAGATGCTTATGTGTTAATACCTTTTTCTATGAAAAAAGACCCAGCGCCGTGTGCAATAAAGGTTATGTTTCTA

SEQ ID NO:903DSCAML1的全mRNA多核苷酸序列

AGCCGAGCGCTGGGCTGAGGAGCAGAGAGAGCGGGGCGCCGAGTGCGGGCGGCTGGGAGCGCGCTGAGCGGGGGAGAGGCGCTGCCGCACGGCCGGCCACAGGACCACCTCCCCGGAGAATAGGGCCTCTTTATGGCATGTGGCTGGTAACTTTCCTCCTGCTCCTGGACTCTTTACACAAAGCCCGCCCTGAAGATGTTGGCACCAGCCTCTACTTTGTAAATGACTCCTTGCAGCAGGTGACCTTTTCCAGCTCCGTGGGGGTGGTGGTGCCCTGCCCGGCCGCGGGCTCCCCCAGCGCGGCCCTTCGATGGTACCTGGCCACAGGGGACGACATCTACGACGTGCCGCACATCCGGCACGTCCACGCCAACGGGACGCTGCAGCTCTACCCCTTCTCCCCCTCCGCCTTCAATAGCTTTATCCACGACAATGACTACTTCTGCACCGCGGAGAACGCTGCCGGCAAGATCCGGAGCCCCAACATCCGCGTCAAAGCAGTTTTCAGGGAACCCTACACCGTCCGGGTGGAGGATCAAAGGTCAATGCGTGGCAACGTGGCCGTCTTCAAGTGCCTCATCCCCTCTTCAGTGCAGGAATATGTTAGCGTTGTATCTTGGGAGAAAGACACAGTCTCCATCATCCCAGAACACAGGTTTTTTATTACCTACCACGGCGGGCTGTACATCTCTGACGTACAGAAGGAGGACGCCCTCTCCACCTATCGCTGCATCACCAAGCACAAGTATAGCGGGGAGACCCGGCAGAGCAATGGGGCACGCCTCTCTGTGACAGACCCTGCTGAGTCGATCCCCACCATCCTGGATGGCTTCCACTCCCAGGAAGTGTGGGCCGGCCACACCGTGGAGCTGCCCTGCACCGCCTCGGGCTACCCTATCCCCGCCATCCGCTGGCTCAAGGATGGCCGGCCCC

TCCCGGCTGACAGCCGCTGGACCAAGCGCATCACAGGGCTGACCATCAGCGACTTGCG

GACCGAGGACAGCGGCACCTACATTTGTGAGGTCACCAACACCTTCGGTTCGGCAGAG

GCCACAGGCATCCTCATGGTCATTGATCCCCTTCATGTGACCCTGACACCAAAGAAGCT

GAAGACCGGCATTGGCAGCACGGTCATCCTCTCCTGTGCCCTGACGGGCTCCCCAGAG

TTCACCATCCGCTGGTATCGCAACACGGAGCTGGTGCTGCCTGACGAGGCCATCTCCAT

CCGCGGGCTCAGCAACGAGACGCTGCTCATCACCTCGGCCCAGAAGAGCCATTCCGGG

GCCTACCAGTGCTTCGCTACCCGCAAGGCCCAGACCGCCCAGGACTTTGCCATCATTGC

ACTTGAGGATGGCACGCCCCGCATCGTCTCGTCCTTCAGCGAGAAGGTGGTCAACCCC

GGGGAGCAGTTCTCACTGATGTGTGCGGCCAAGGGCGCCCCGCCCCCCACGGTCACCT

GGGCCCTCGACGATGAGCCCATCGTGCGGGATGGCAGCCACCGCACCAACCAGTACAC

CATGTCGGACGGCACCACCATCAGCCACATGAACGTCACAGGCCCCCAGATCCGCGAC

GGGGGCGTGTACCGGTGCACAGCGCGGAACTTGGTGGGCAGTGCTGAATATCAGGCGC

GAATAAACGTAAGAGGCCCACCCAGCATCCGGGCTATGCGGAACATCACAGCAGTCGC

CGGGCGGGACACCCTTATCAACTGCAGGGTCATCGGCTATCCCTACTACTCCATCAAGT

GGTACAAGGATGCCCTGCTGCTGCCAGACAACCACCGCCAGGTGGTGTTTGAGAATGG

GACCCTCAAGCTGACTGACGTGCAGAAGGGCATGGATGAGGGGGAGTACCTGTGCAG

TGTCCTCATCCAGCCCCAGCTCTCCATCAGCCAGAGCGTTCACGTAGCCGTCAAAGTGC

CCCCTCTGATCCAGCCCTTCGAATTCCCACCCGCCTCCATCGGCCAGCTGCTCTACATTC

CCTGTGTGGTGTCCTCGGGGGACATGCCCATCCGTATCACCTGGAGGAAGGACGGACA

GGTGATCATCTCAGGCTCGGGCGTGACCATCGAGAGCAAGGAATTCATGAGCTCCCTG

CAGATCTCTAGCGTCTCCCTCAAGCACAACGGCAACTATACATGCATCGCCAGCAACGC

AGCCGCCACCGTGAGCCGGGAGCGCCAGCTCATCGTGCGTGTGCCCCCTCGATTTGTG

GTGCAACCCAACAACCAGGATGGCATCTACGGCAAAGCTGGTGTGCTCAACTGCTCGG

TGGACGGCTACCCCCCACCCAAGGTCATGTGGAAGCATGCCAAGGGGAGCGGGAACC

CCCAGCAGTACCACCCTGTGCCCCTCACTGGCCGCATCCAGATCCTGCCCAACAGCTCG

CTGCTGATCCGCCACGTCCTAGAAGAGGACATCGGCTACTACCTCTGCCAGGCCAGCA

ACGGCGTAGGCACCGACATCAGCAAGTCCATGTTCCTCACAGTCAAGATCCCGGCCAT

GATCACTTCCCACCCCAACACCACCATCGCCATCAAGGGCCATGCGAAGGAGCTAAAC

TGCACGGCACGGGGTGAGCGGCCCATCATCATCCGCTGGGAGAAGGGGGACACAGTC

ATCGACCCTGACCGCGTCATGCGGTATGCCATCGCCACCAAGGACAACGGCGACGAGG

TCGTCTCCACACTGAAGCTCAAGCCCGCTGACCGTGGGGACTCTGTGTTCTTCAGCTG

CCATGCCATCAACTCGTATGGGGAGGACCGGGGCTTGATCCAACTCACTGTGCAAGAG

CCCCCCGACCCCCCAGAGCTGGAGATCCGGGAGGTGAAGGCCCGGAGCATGAACCTG

CGCTGGACCCAGCGATTCGACGGGAACAGCATCATCACGGGCTTCGACATTGAATACA

AGAACAAATCAGATTCCTGGGACTTCAAGCAGTCCACACGCAACATCTCCCCCACCAT

CAACCAGGCCAACATTGTGGACTTGCACCCGGCATCTGTGTACAGCATCCGCATGTACT

CTTTCAACAAGATTGGCCGCAGTGAACCAAGCAAGGAGCTCACCATCAGCACTGAGGA

GGCCGCTCCCGATGGGCCCCCCATGGATGTTACCTTGCAGCCAGTGACCTCACAGAGC

ATCCAGGTGACCTGGAAGGCACCCAAGAAGGAGCTGCAGAACGGTGTCATCCGGGGC

TACCAGATTGGCTACAGAGAGAACAGCCCCGGCAGCAACGGGCAGTACAGCATCGTGG

AGATGAAGGCCACGGGGGACAGCGAGGTCTACACCCTGGACAACCTCAAGAAGTTCG

CCCAGTATGGGGTGGTGGTCCAAGCCTTCAATCGGGCTGGCACGGGGCCCTCTTCCAG

CGAGATCAATGCCACCACTCTGGAGGATGTGCCCAGCCAGCCCCCTGAGAACGTCCGG

GCCCTGTCCATCACTTCTGACGTGGCCGTCATCTCCTGGTCAGAGCCCCCGCGCAGCAC

CCTCAATGGCGTCCTCAAAGGCTATCGGGTCATCTTCTGGTCCCTCTATGTTGATGGGGA

GTGGGGCGAGATGCAGAACATCACCACCACGCGGGAGCGGGTGGAGCTGCGGGGCAT

GGAGAAGTTCACCAACTACAGCGTCCAGGTGCTGGCCTACACCCAGGCTGGGGACGG

CGTACGCAGCAGTGTGCTCTACATCCAGACCAAGGAGGACGTTCCAGGTCCCCCTGCT

GGCATCAAAGCTGTCCCTTCATCAGCTAGCAGTGTGGTTGTGTCTTGGCTCCCCCCTAC

CAAGCCCAACGGGGTGATCCGCAAGTACACCATCTTCTGTTCCAGCCCCGGGTCTGGC

CAGCCGGCTCCCAGCGAGTACGAGACGAGTCCAGAGCAGCTCTTCTACCGGATCGCCC

ACCTAAACCGCGGTCAGCAGTATCTGCTGTGGGTGGCCGCCGTCACCTCTGCCGGCCGGGGCAACAGCAGCGAGAAGGTGACCATCGAGCCTGCTGGCAAGGCCCCAGCAAAGATCATCTCCTTTGGGGGCACCGTGACAACACCTTGGATGAAAGATGTTCGGCTGCCTTGCAATTCAGTGGGAGATCCAGCCCCTGCTGTGAAGTGGACCAAGGACAGTGAAGACTCGGCCATTCCAGTGTCCATGGATGGGCACCGGCTCATCCACACCAATGGCACACTGCTGCTGCGTGCAGTGAAGGCTGAGGACTCTGGCTACTACACGTGCACGGCCACCAACACTGGTGGCTTTGACACCATCATCGTCAACCTTCTGGTGCAAGTTCCCCCGGACCAGCCCCGCCTCACTGTCTCCAAAACCTCAGCTTCGTCCATCACCCTGACCTGGATTCCAGGTGACAATGGGGGCAGCTCCATCCGAGGCTTCGTGCTACAGTACTCGGTGGACAACAGCGAGGAGTGGAAGGATGTGTTCATCAGCTCCAGCGAGCGCTCCTTCAAGCTGGACAGCCTCAAGTGTGGCACGTGGTACAAGGTGAAGCTGGCAGCCAAGAACAGCGTGGGCTCTGGGCGCATCAGCGAGATCATCGAGGCCAAGACCCACGGGCGGGAGCCCTCCTTCAGCAAAGACCAACACCTCTTCACCCACATCAACTCCACGCATGCTCGGCTTAACCTGCAGGGCTGGAACAATGGGGGCTGCCCTATCACAGCCATCGTTCTGGAGTACCGGCCCAAGGGGACCTGGGCCTGGCAGGGCCTCCGGGCCAACAGCTCCGGGGAGGTGTTTCTGACGGAACTGCGAGAGGCCACGTGGTACGAGCTGCGCATGAGGGCTTGCAACAGTGCGGGCTGCGGCAATGAAACAGCCCAGTTCGCCACCCTGGACTACGATGGCAGCACCATTCCACCCATCAAGTCTGCTCAAGGTGAAGGGGATGATGTGAAGAAGCTGTTCACCATCGGCTGCCCTGTCATCCTGGCCACACTGGGGGTGGCACTGCTCTTCATCGTACGCAAGAAGAGGAAGGAGAAACGGCTGAAGCGACTCCGAGATGCAAAGAGTTTGGCAGAAATGTTGATAAGCAAGAACAATAGAAGCTTTGACACCCCTGTGAAAGGGCCACCCCAGGGCCCACGGCTACACATTGACATCCCCAGGGTCCAGCTGCTCATCGAGGACAAAGAAGGCATCAAGCAACTGGGAGATGACAAGGCCACCATCCCTGTGACAGATGCTGAGTTCAGCCAAGCTGTCAACCCACAGAGCTTCTGTACTGGCGTCTCCTTGCACCACCCAACCCTCATCCAGAGCACAGGACCCCTCATCGACATGTCTGACATCCGGCCAGGAACCAATCCAGTGTCCAGGAAGAATGTGAAGTCAGCCCACAGCACCCGGAACCGGTACTCAAGCCAGTGGACCCTGACCAAGTGCCAGGCCTCCACACCTGCCCGCACCCTCACCTCCGACTGGCGCACCGTGGGCTCCCAGCATGGTGTCACGGTCACTGAGAGTGACAGCTACAGTGCCAGCCTGTCCCAGGACACAGACAAAGGAAGGAACAGCATGGTGTCCACTGAGAGTGCCTCTTCCACCTACGAGGAGCTGGCCCGGGCCTATGAGCATGCCAAGCTGGAGGAGCAGCTGCAGCACGCCAAGTTTGAGATCACCGAGTGCTTCATCTCTGACAGTTCCTCTGACCAGATGACCACAGGCACCAACGAGAACGCCGACAGCATGACATCCATGAGCACACCCTCAGAGCCTGGCATCTGCCGCTTTACCGCCTCACCACCCAAGCCCCAGGATGCGGACCGGGGCAAAAACGTGGCTGTGCCCATCCCTCACCGGGCCAACAAGAGTGACTACTGCAACCTGCCCCTGTATGCCAAGTCAGAGGCCTTCTTTCGAAAGGCAGATGGACGTGAGCCCTGCCCCGTGGTCCCACCCCGTGAGGCCTCCATCCGGAACCTGGCTCGAACCTACCACACCCAGGCTCGCCACCTGACCCTGGACCCTGCCAGCAAGTCCTTGGGCCTTCCCCACCCAGGGGCCCCCGCTGCCGCCTCCACAGCCACCTTACCTCAGAGGACTCTGGCCATGCCAGCCCCCCCAGCCGGCACAGCCCCCCCAGCCCCCGGCCCCACCCCTGCTGAGCCACCCACCGCCCCCAGCGCTGCCCCTCCGGCCCCCAGCACCGAGCCTCCACGAGCCGGGGGCCCACACACCAAAATGGGGGGCTCCAGGGACTCGCTTCTCGAGATGAGCACATCGGGGGTAGGGAGGTCTCAGAAGCAGGGGGCCGGGGCCTACTCCAAATCCTACACCCTGGTGTAGGGCCCGCAGGAAGAGCAGCCACGCCTGGACCGCGCCGCGCCGCAGCCCCACACGCCAGCTCGGCTGTTTTTCTGCATTATTTATATTCAACTGACAGACAAAAACCAACCAACGACAAAACAAAAACCCCCAATCATGAACGCCTGTACATAGAACTCTTTTGTACAAATGAAACTATTTTCTTCTTCTCCATGAAGCCAGGGCACAAAGAATTTGACAGTACAAGTCAAATCCCCCACCCCACAAAATATGTGTGGAGATATATATACATATATAGACAGACAGGAACGCGTCCACGAGCTATATATCTATATATTTCTCTCACCCTATTTTGAGACAGAGGCACAAAGACTCAGCAATTTTTTTCCCTCCTCCTCACCTTCCCCCCAGTCTAGGTGGTTTTGACAAAGACCAAAATCCCAACTCAGAGACACTGCATGCGATTTTACTGTTCCAAGAAAACCAGGAGTTGCTTCAATTTGCAGATGCTTATGTGTTAATACCTTTTTCTATGAAAAAAGACCCAGCGCCGTGTGCAATAAAGGTTATGTTTCTA

SEQ ID NO:904DSCAML1的外显子1的翻译多肽序列

MWLVTFLLLLDSLHK

SEQ ID NO:905DSCAML1的外显子2的翻译多肽序列

RPEDVGTSLYFVNDSLQQVTFSSSVGVVVPCPAAGSPSAALRWYLATGDDIYDVPHIRHVHANGTLQLYPFSPSAFNSFIHDNDYFCTAENAAGKIRSPNIRVKA

SEQ ID NO:906DSCAML1的外显子3的翻译多肽序列

FREPYTVRVEDQRSMRGNVAVFKCLIPSSVQEYVSVVSWEKDTVSIIP

SEQ ID NO:907DSCAML1的外显子4的翻译多肽序列

HRFFITYHGGLYISDVQKEDALSTYRCITKHKYSGETRQSNGARLSVT

SEQ ID NO:908DSCAML1的外显子5的翻译多肽序列

PAESIPTILDGFHSQEVWAGHTVELPCTASGYPIPAIRWLKDGRPLPADSRWTKRITGLTISDLRTEDSGTYICEVTNTFGSAEATGILMVI

SEQ ID NO:909DSCAML1的外显子6的翻译多肽序列

PLHVTLTPKKLKTGIGSTVILSCALTGSPEFTIRWYRNTELVLPDEAISIRGLSNETLLITSAQKSHSGAYQCFATRKAQTAQDFAIIALE

SEQ ID NO:910DSCAML1的外显子7的翻译多肽序列

GTPRIVSSFSEKVVNPGEQFSLMCAAKGAPPPTVTWALDDEPIVRDGSHRTNQYTMSDGTTISHMNVTGPQIRDGGVYRCTARNLVGSAEYQARINVR

SEQ ID NO:911DSCAML1的外显子8的翻译多肽序列

PPSIRAMRNITAVAGRDTLINCRVIGYPYYSIKWYKDALLLPDNHRQVVFENGTLKLTDVQKGMDEGEYLCSVLIQPQLSISQSVHVAVK

SEQ ID NO:912DSCAML1的外显子9的翻译多肽序列

PPLIQPFEFPPASIGQLLYIPCVVSSGDMPIRITWRKDGQVIISGSGVTIESKEFMSSLQISSVSLKHNGNYTCIASNAAATVSRERQLIVR

SEQ ID NO:913DSCAML1的外显子10的翻译多肽序列

PPRFVVQPNNQDGIYGKAGVLNCSVDGYPPPKVMWKHAK

SEQ ID NO:914DSCAML1的外显子11的翻译多肽序列

SGNPQQYHPVPLTGRIQILPNSSLLIRHVLEEDIGYYLCQASNGVGTDISKSMFLTVK

SEQ ID NO:915DSCAML1的外显子12的翻译多肽序列

PAMITSHPNTTIAIKGHAKELNCTARGERPIIIRWEKGDTVIDPDRVMRYAIATKDNGDEVVSTLK

SEQ ID NO:916DSCAML1的外显子13的翻译多肽序列

LKPADRGDSVFFSCHAINSYGEDRGLIQLTVQ

SEQ ID NO:917DSCAML1的外显子14的翻译多肽序列

PPDPPELEIREVKARSMNLRWTQRFDGNSIITGFDIEYKNKS

SEQ ID NO:918DSCAML1的外显子15的翻译多肽序列

SWDFKQSTRNISPTINQANIVDLHPASVYSIRMYSFNKIGRSEPSKELTISTEEA

SEQ ID NO:919DSCAML1的外显子16的翻译多肽序列

PDGPPMDVTLQPVTSQSIQVTWK

SEQ ID NO:920DSCAML1的外显子17的翻译多肽序列

APKKELQNGVIRGYQIGYRENSPGSNGQYSIVEMKATGDSEVYTLDNLKKFAQYGVVVQAFNRAGTGPSSSEINATTLED

SEQ ID NO:921DSCAML1的外显子18的翻译多肽序列

PSQPPENVRALSITSDVAVISWSEPPRSTLNGVLKGYRVIFWSLYVDG

SEQ ID NO:922DSCAML1的外显子19的翻译多肽序列

WGEMQNITTTRERVELRGMEKFTNYSVQVLAYTQAGDGVRSSVLYIQTKED

SEQ ID NO:923DSCAML1的外显子20的翻译多肽序列

PGPPAGIKAVPSSASSVVVSWLPPTKPNGVIRKYTIFCSSPGSGQP

SEQ ID NO:924DSCAML1的外显子21的翻译多肽序列

APSEYETSPEQLFYRIAHLNRGQQYLLWVAAVTSAGRGNSSEKVTIEPAGK

SEQ ID NO:925DSCAML1的外显子22的翻译多肽序列

PAKIISFGGTVTTPWMKDVRLPCNSVGDPAPAVKWTKD

SEQ ID NO:926DSCAML1的外显子23的翻译多肽序列

EDSAIPVSMDGHRLIHTNGTLLLRAVKAEDSGYYTCTATNTGGFDTIIVNLLVQ

SEQ ID NO:927DSCAML1的外显子24的翻译多肽序列

PPDQPRLTVSKTSASSITLTWIPGDNGGSSIR

SEQ ID NO:928DSCAML1的外显子25的翻译多肽序列

FVLQYSVDNSEEWKDVFISSSERSFKLDSLKCGTWYKVKLAAKNSVGSGRISEIIEAKTHGR

SEQ ID NO:929DSCAML1的外显子26的翻译多肽序列

PSFSKDQHLFTHINSTHARLNLQGWNNGGCPITAIVLEYRPKGTWAWQGLRANSSGEVFLTELREATWYELRMRACNSAGCGNETAQFATLDYDG

SEQ ID NO:930DSCAML1的外显子27的翻译多肽序列

TIPPIKSAQGEGDDVKKLFTIGCPVILATLGVALLFIVRKKRKEKRLKRLR

SEQ ID NO:931DSCAML1的外显子28的翻译多肽序列

AKSLAEMLI

SEQ ID NO:932DSCAML1的外显子29的翻译多肽序列

KNNRSFDTPVKGPPQGPRLHIDIPRVQLLIEDKEGIKQL

SEQ ID NO:933DSCAML1的外显子30的翻译多肽序列

DDKATIPVTDAEFSQAVNPQSFCTGVSLHHPTLIQSTGPLIDMSDIRPGT

SEQ ID NO:934DSCAML1的外显子31的翻译多肽序列

PVSRKNVKSAHSTRNRYSSQWTLTKCQASTPARTLTSDWRTVGSQHGVTVTESDSYSASLSQDT

SEQ ID NO:935DSCAML1的外显子32的翻译多肽序列

KGRNSMVSTESASSTYEELARAYEHAKLEEQLQHAKFEITECFISDSSSDQMTTGTNENADSMTSMSTPSEPGICRFTASPPKPQDADRGKNVAVPIPHRANK

SEQ ID NO:936DSCAML1的外显子33的翻译多肽序列

DYCNLPLYAKSEAFFRKADGREPCPVVPPREASIRNLARTYHTQARHLTLDPASKSLGLPHPGAPAAASTATLPQRTLAMPAPPAGTAPPAPGPTPAEPPTAPSAAPPAPSTEPPRAGGPHTKMGGSRDSLLEMSTSGVGRSQKQGAGAYSKSYTLV

SEQ ID NO:937DSCAML1的全蛋白质序列

MWLVTFLLLLDSLHKARPEDVGTSLYFVNDSLQQVTFSSSVGVVVPCPAAGSPSAALRWYLATGDDIYDVPHIRHVHANGTLQLYPFSPSAFNSFIHDNDYFCTAENAAGKIRSPNIRVKAVFREPYTVRVEDQRSMRGNVAVFKCLIPSSVQEYVSVVSWEKDTVSIIPEHRFFITYHGGLYISDVQKEDALSTYRCITKHKYSGETRQSNGARLSVTDPAESIPTILDGFHSQEVWAGHTVELPCTASGYPIPAIRWLKDGRPLPADSRWTKRITGLTISDLRTEDSGTYICEVTNTFGSAEATGILMVIDPLHVTLTPKKLKTGIGSTVILSCALTGSPEFTIRWYRNTELVLPDEAISIRGLSNETLLITSAQKSHSGAYQCFATRKAQTAQDFAIIALEDGTPRIVSSFSEKVVNPGEQFSLMCAAKGAPPPTVTWALDDEPIVRDGSHRTNQYTMSDGTTISHMNVTGPQIRDGGVYRCTARNLVGSAEYQARINVRGPPSIRAMRNITAVAGRDTLINCRVIGYPYYSIKWYKDALLLPDNHRQVVFENGTLKLTDVQKGMDEGEYLCSVLIQPQLSISQSVHVAVKVPPLIQPFEFPPASIGQLLYIPCVVSSGDMPIRITWRKDGQVIISGSGVTIESKEFMSSLQISSVSLKHNGNYTCIASNAAATVSRERQLIVRVPPRFVVQPNNQDGIYGKAGVLNCSVDGYPPPKVMWKHAKGSGNPQQYHPVPLTGRIQILPNSSLLIRHVLEEDIGYYLCQASNGVGTDISKSMFLTVKIPAMITSHPNTTIAIKGHAKELNCTARGERPIIIRWEKGDTVIDPDRVMRYAIATKDNGDEVVSTLKLKPADRGDSVFFSCHAINSYGEDRGLIQLTVQEPPDPPELEIREVKARSMNLRWTQRFDGNSIITGFDIEYKNKSDSWDFKQSTRNISPTINQANIVDLHPASVYSIRMYSFNKIGRSEPSKELTISTEEAAPDGPPMDVTLQPVTSQSIQVTWKAPKKELQNGVIRGYQIGYRENSPGSNGQYSIVEMKATGDSEVYTLDNLKKFAQYGVVVQAFNRAGTGPSSSEINATTLEDVPSQPPENVRALSITSDVAVISWSEPPRSTLNGVLKGYRVIFWSLYVDGEWGEMQNITTTRERVELRGMEKFTNYSVQVLAYTQAGDGVRSSVLYIQTKEDVPGPPAGIKAVPSSASSVVVSWLPPTKPNGVIRKYTIFCSSPGSGQPAPSEYETSPEQLFYRIAHLNRGQQYLLWVAAVTSAGRGNSSEKVTIEPAGKAPAKIISFGGTVTTPWMKDVRLPCNSVGDPAPAVKWTKDSEDSAIPVSMDGHRLIHTNGTLLLRAVKAEDS

GYYTCTATNTGGFDTIIVNLLVQVPPDQPRLTVSKTSASSITLTWIPGDNGGSSIRGFVLQYS

VDNSEEWKDVFISSSERSFKLDSLKCGTWYKVKLAAKNSVGSGRISEIIEAKTHGREPSFSK

DQHLFTHINSTHARLNLQGWNNGGCPITAIVLEYRPKGTWAWQGLRANSSGEVFLTELRE

ATWYELRMRACNSAGCGNETAQFATLDYDGSTIPPIKSAQGEGDDVKKLFTIGCPVILATL

GVALLFIVRKKRKEKRLKRLRDAKSLAEMLISKNNRSFDTPVKGPPQGPRLHIDIPRVQLLI

EDKEGIKQLGDDKATIPVTDAEFSQAVNPQSFCTGVSLHHPTLIQSTGPLIDMSDIRPGTNPV

SRKNVKSAHSTRNRYSSQWTLTKCQASTPARTLTSDWRTVGSQHGVTVTESDSYSASLSQ

DTDKGRNSMVSTESASSTYEELARAYEHAKLEEQLQHAKFEITECFISDSSSDQMTTGTNE

NADSMTSMSTPSEPGICRFTASPPKPQDADRGKNVAVPIPHRANKSDYCNLPLYAKSEAFFR

KADGREPCPVVPPREASIRNLARTYHTQARHLTLDPASKSLGLPHPGAPAAASTATLPQRTL

AMPAPPAGTAPPAPGPTPAEPPTAPSAAPPAPSTEPPRAGGPHTKMGGSRDSLLEMSTSGVG

RSQKQGAGAYSKSYTLV

SEQ ID NO:938DSCAML1的全部外显子1-3按顺序排列的多核苷酸序列

SEQ ID NO:939DSCAML1的全部外显子1-3按顺序排列的翻译多肽序列。

Claims

1.一种多核苷酸，包含：

-PVALB核酸序列或所述PVALB序列的等位基因变体，其与NRG1核酸序列或所述NRG1序列的等位基因变体融合，或

-ASPH核酸序列或所述ASPH序列的等位基因变体，其与NRG1核酸序列或所述NRG1序列的等位基因变体融合，或

-DAAM1核酸序列或所述DAAM1序列的等位基因变体，其与NRG1核酸序列或该NRG1序列的等位基因变体融合，或

-ZFAT核酸序列或所述ZFAT序列的等位基因变体，其与NRG1核酸序列或该NRG1序列的等位基因变体融合，或

-DACAML1核酸序列或所述DSCAML1序列的等位基因变体，其与NRG1核酸序列或该NRG1序列的等位基因变体融合。

2.根据权利要求1所述的多核苷酸，其中

-所述PVALB核酸序列包含SEQ ID NO:439-444中的任一者或由其组成，或包含SEQ IDNO:439-444中的任一者的等位基因变体或由其组成，并且所述NRG1核酸序列包含SEQ IDNO:125-138中的任一者或由其组成；

-所述DAAM1核酸序列包含SEQ ID NO:606-631中的任一者或由其组成，或包含SEQ IDNO:606-631中的任一者的等位基因变体或由其组成，并且所述NRG1核酸序列包含SEQ IDNO:125-138中的任一者或由其组成；

-所述ZFAT核酸序列包含SEQ ID NO:830-846中的任一者或由其组成，或包含SEQ IDNO:830-846中的任一者的等位基因变体或由其组成，并且所述NRG1核酸序列包含SEQ IDNO:125-138中的任一者或由其组成；或

-所述DSCAML1核酸序列包含SEQ ID NO:870-903中的任一者或由其组成，或包含SEQID NO:870-903中的任一者的等位基因变体或由其组成，并且所述NRG1核酸序列包含SEQID NO:125-138中的任一者或由其组成。

3.根据权利要求1或2所述的多核苷酸，其中所述PVALB、DAAM1、ZFAT或DSCAML1核酸序列(或其等位基因变体)位于NRG1核酸序列(或其等位基因变体)的5’端。

4.根据权利要求1至3中任一项所述的多核苷酸，其中

-所述PVALB核酸序列的等位基因变体与SEQ ID NO:439-444中的任一者有至少85％的一致性，优选地至少90％的一致性，更优选地至少95％的序列一致性；并且所述NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85％的一致性，优选地至少90％的一致性，更优选地至少95％的序列一致性；

-所述DAAM1核酸序列的等位基因变体与SEQ ID NO:606-631中的任一者有至少85％的一致性，优选地至少90％的一致性，更优选地至少95％的序列一致性；并且所述NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85％的一致性，优选地至少90％的一致性，更优选地至少95％的序列一致性；

-所述ZFAT核酸序列的等位基因变体与SEQ ID NO:830-846中的任一者有至少85％的一致性，优选地至少90％的一致性，更优选地至少95％的序列一致性；并且所述NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85％的一致性，优选地至少90％的一致性，更优选地至少95％的序列一致性；或

-所述DSCAML1核酸序列的等位基因变体与SEQ ID NO:870-903中的任一者有至少85％的一致性，优选地至少90％的一致性，更优选地至少95％的序列一致性；并且所述NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85％的一致性，优选地至少90％的一致性，更优选地至少95％的序列一致性。

5.根据权利要求1至4中任一项所述的多核苷酸，其中

-所述PVALB核酸与所述NRG1核酸的融合物包含来自SEQ ID NO:437的2至约40个连续核酸，优选地包括位置102和103处的核酸；

-所述DAAM1核酸与所述NRG1核酸的融合物包含来自SEQ ID NO:605的2至约40个连续核酸，优选地包括位置75和76处的核酸；

-所述ZFAT核酸与所述NRG1核酸的融合物包含来自SEQ ID NO:828的2至约40个连续核酸，优选地包括位置75和76处的核酸；或

-所述DSCAML1核酸与所述NRG1核酸的融合物包含来自SEQ ID NO:868的2至约40个连续核酸，优选地包括位置75和76处的核酸。

6.根据权利要求1至5中任一项所述的多核苷酸，其中所述编码NRG1蛋白序列(或其等位基因变体)的核酸包含或编码NRG1的EGF样结构域，优选为根据SEQ ID NO:163的EGF样结构域。

7.一种多核苷酸，包含：

-CADM1的外显子7或外显子7的等位基因变体的一部分，其与NRG1的外显子6或外显子6的等位基因变体的一部分；

-CD44的外显子5或外显子5的等位基因变体的一部分，其与NRG1的外显子2或外显子2的等位基因变体的一部分；

-SLC3A2的转录本6的外显子1或外显子1的等位基因变体的一部分，其与NRG1的外显子5或外显子5的等位基因变体的一部分；

-VTCN1的外显子2或外显子2的等位基因变体的一部分，其与NRG1的外显子2或外显子2的等位基因变体的一部分；

-CDH1的外显子11或外显子11的等位基因变体的一部分，其与NRG1的外显子2或外显子2的等位基因变体的一部分；

-CXADR的外显子1或外显子1的等位基因变体的一部分，其与NRG1的外显子2或外显子2的等位基因变体的一部分；

-GTF2E2的外显子2或外显子1的等位基因变体的一部分，其与NRG1的外显子2或外显子2的等位基因变体的一部分；

-CSMD1的外显子23或外显子23的等位基因变体的一部分，其与NRG1的外显子6或外显子6的等位基因变体的一部分；

-PTN的外显子4或外显子4的等位基因变体的一部分，其与NRG1的外显子2或外显子2的等位基因变体的一部分；

-ST14的外显子11或外显子11的等位基因变体的一部分，其与NRG1的外显子6或外显子6的等位基因变体的一部分；

-THBS1的外显子9或外显子9的等位基因变体的一部分，其与NRG1的外显子6或外显子6的等位基因变体的一部分；

-AGRN的外显子12或外显子12的等位基因变体的一部分，其与NRG1的外显子6或外显子6的等位基因变体的一部分；

-PVALB的外显子4或外显子4的等位基因变体的一部分，其与NRG1的外显子6或外显子6的等位基因变体的一部分；

-SLC3A2的转录本3的外显子2或外显子2的等位基因变体的一部分，其与NRG1的外显子6或外显子6的等位基因变体的一部分；

-APP的外显子14或外显子14的等位基因变体的一部分，其与NRG1的外显子6或外显子6的等位基因变体的一部分；

-WRN的外显子33或外显子33的等位基因变体的一部分，其与NRG1的外显子6或外显子6的等位基因变体的一部分；

-DAAM1的外显子1或外显子1的等位基因变体的一部分，其与NRG1的外显子1或外显子1的等位基因变体的一部分；

-ASPH的外显子22或外显子22的等位基因变体的一部分，其与NRG1的外显子2或外显子2的等位基因变体的一部分；

-NOTCH2的外显子6或外显子6的等位基因变体的一部分，其与NRG1的外显子6或外显子6的等位基因变体的一部分；

-CD74的外显子2或外显子2的等位基因变体的一部分，其与NRG1的外显子2或外显子2的等位基因变体的一部分；

-SDC4的外显子2或外显子2的等位基因变体的一部分，其与NRG1的外显子2或外显子2的等位基因变体的一部分；

-CD44的外显子5或外显子5的等位基因变体的一部分，其与NRG1的外显子6或外显子6的等位基因变体的一部分；

-SLC4A4的外显子14或外显子14的等位基因变体的一部分，其与NRG1的外显子6或外显子6的等位基因变体的一部分；

-SDC4的外显子4或外显子4的等位基因变体的一部分，其与NRG1的外显子2或外显子2的等位基因变体的一部分；

-ZFAT的外显子12或外显子12的等位基因变体的一部分，其与NRG1的外显子6或外显子6的等位基因变体的一部分；或

-DSCAML1的外显子3或外显子3的等位基因变体的一部分，其与NRG1的外显子2或外显子2的等位基因变体的一部分。

8.根据权利要求7所述的多核苷酸，其中VAPB的外显子1为SEQ ID NO:17的外显子；CADM1的外显子7为SEQ ID NO:39的外显子；CD44的外显子5为SEQ ID NO:65的外显子；SLC3A2的外显子1为SEQ ID NO:103的外显子；VTCN1的外显子2为SEQ ID NO:169的外显子；CDH1的外显子11为SEQ ID NO:198的外显子；CXADR的外显子1为SEQ ID NO:219的外显子；GTF2E2的外显子2为SEQ ID NO:236的外显子；CSMD1的外显子23为SEQ ID NO:279的外显子；PTN的外显子4为SEQ ID NO:318的外显子；ST14的外显子11为SEQ ID NO:342的外显子；THBS1的外显子9为SEQ ID NO:386的外显子；AGRN的外显子12为SEQ ID NO:416的外显子；PVALB的外显子4为SEQ ID NO:442的外显子；SLC3A2的外显子2为SEQ ID NO:457的外显子；APP的外显子14为SEQ ID NO:501的外显子；WRN的外显子33为SEQ ID NO:562的外显子；DAAM1的外显子1为SEQ ID NO:606的外显子；ASPH的外显子22为SEQ ID NO:658的外显子；NOTCH2的外显子6为SEQ ID NO:700的外显子；CD74的外显子2为SEQ ID NO:720的外显子；SDC4的外显子2为SEQ ID NO:746的外显子；CD44的外显子5为SEQ ID NO:65的外显子；SLC4A4的外显子14为SEQ ID NO:780的外显子；SDC4的外显子4为SEQ ID NO:748的外显子；ZFAT的外显子12为SEQ ID NO:841的外显子；DSCAML1的外显子3为SEQ ID NO:872的外显子，并且NRG1的外显子1、2、5和6分别为SEQ ID NO:125、126、129和130的外显子。

9.根据权利要求7或8中任一项所述的多核苷酸，其中：

-所述VAPB的外显子1或其等位基因变体的一部分位于所述NRG1的外显子2或其等位基因变体的一部分的5’端；

-所述CADM1的外显子7或其等位基因变体的一部分位于所述NRG1的外显子6或其等位基因变体的一部分的5’端；

-所述CD44的外显子5或其等位基因变体的一部分位于所述NRG1的外显子2或其等位基因变体的一部分的5’端；

-所述SLC3A2的外显子1或其等位基因变体的一部分位于所述NRG1的外显子5或其等位基因变体的一部分的5’端；

-所述VTCN1的外显子2或其等位基因变体的一部分位于所述NRG1的外显子2或其等位基因变体的一部分的5’端；

-所述CDH1的外显子11或其等位基因变体的一部分位于所述NRG1的外显子2或其等位基因变体的一部分的5’端；

-所述CXADR的外显子1或其等位基因变体的一部分位于所述NRG1的外显子2或其等位基因变体的一部分的5’端；

-所述GTF2E2的外显子2或其等位基因变体的一部分位于所述NRG1的外显子2或其等位基因变体的一部分的5’端；

-所述CSMD1的外显子23或其等位基因变体的一部分位于所述NRG1的外显子6或其等位基因变体的一部分的5’端；

-所述PTN的外显子4或其等位基因变体的一部分位于所述NRG1的外显子2或其等位基因变体的一部分的5’端；

-所述ST14的外显子11或其等位基因变体的一部分位于所述NRG1的外显子6或其等位基因变体的一部分的5’端；

-所述THBS1的外显子9或其等位基因变体的一部分位于所述NRG1的外显子6或其等位基因变体的一部分的5’端；

-所述AGRN的外显子12或其等位基因变体的一部分位于所述NRG1的外显子6或其等位基因变体的一部分的5’端；

-所述PVALB的外显子4或其等位基因变体的一部分位于所述NRG1的外显子6或其等位基因变体的一部分的5’端；

-所述SCL3A2的外显子2或其等位基因变体的一部分位于所述NRG1的外显子6或其等位基因变体的一部分的5’端；

-所述APP的外显子14或其等位基因变体的一部分位于所述NRG1的外显子6或外显子6的等位基因变体部分的5’端；

-所述WRN的外显子33或其等位基因变体的一部分位于所述NRG1的外显子6或外显子6的等位基因变体部分的5’端；

-所述DAAM1的外显子1或其等位基因变体的一部分位于所述NRG1的外显子1或外显子1的等位基因变体部分的5’端；

-所述ASPH的外显子22或其等位基因变体的一部分位于所述NRG1的外显子2或外显子2的等位基因变体部分的5’端；

-所述NOTCH2的外显子6或其等位基因变体的一部分位于所述NRG1的外显子6或外显子6的等位基因变体部分的5’端；

-所述CD74的外显子2或其等位基因变体的一部分位于所述NRG1的外显子2或外显子2的等位基因变体部分的5’端；

-所述SDC4的外显子2或其等位基因变体的一部分位于所述NRG1的外显子2或外显子2的等位基因变体部分的5’端；

-所述CD44的外显子5或其等位基因变体的一部分位于所述NRG1的外显子6或外显子6的等位基因变体部分的5’端；

-所述SLC4A4的外显子14或其等位基因变体的一部分位于所述NRG1的外显子6或外显子6的等位基因变体部分的5’端；

-所述SDC4的外显子4或其等位基因变体的一部分位于所述NRG1的外显子2或外显子2的等位基因变体部分的5’端；

-所述ZFAT的外显子12或其等位基因变体的一部分位于该NRG1的外显子6或外显子6的等位基因变体部分的5’端；以及

-所述DSCAML1的外显子3或其等位基因变体的一部分位于该NRG1的外显子2或外显子2的等位基因变体部分的5’端。

10.根据权利要求7至9中任一项所述的多核苷酸，其中：

-所述VAPB的外显子1的等位基因变体与SEQ ID NO:17有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述CADM1的外显子7的等位基因变体与SEQ ID NO:39有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述CD44的外显子5的等位基因变体与SEQ ID NO:65有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述SLC3A2的外显子1的等位基因变体与SEQ ID NO:103有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述VTCN1的外显子2的等位基因变体与SEQ ID NO:169有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述CDH1的外显子11的等位基因变体与SEQ ID NO:198有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述NRG1的外显子2的等位基因变体与SEQ ID NO:126有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述NRG1的外显子5的等位基因变体与SEQ ID NO:129有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述NRG1的外显子6的等位基因变体与SEQ ID NO:130有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述CXADR的外显子1的等位基因变体与SEQ ID NO:219有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述GTF2E2的外显子2的等位基因变体与SEQ ID NO:236有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述CSMD1的外显子23的等位基因变体与SEQ ID NO:279有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述PTN的外显子4的等位基因变体与SEQ ID NO:318有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述ST14的外显子11的等位基因变体与SEQ ID NO:342有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述THBS1的外显子9的等位基因变体与SEQ ID NO:386有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述AGRN的外显子12的等位基因变体与SEQ ID NO:416有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述PVALB的外显子4的等位基因变体与SEQ ID NO:442有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述SCL3A2的外显子2的等位基因变体与SEQ ID NO:457有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述APP的外显子14的等位基因变体与SEQ ID NO:501有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述WRN的外显子33的等位基因变体与SEQ ID NO:562有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述DAAM1的外显子1的等位基因变体与SEQ ID NO:606有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述NRG1的外显子1的等位基因变体与SEQ ID NO:125有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述ASPH的外显子22的等位基因变体与SEQ ID NO:658有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述NOTCH2的外显子6的等位基因变体与SEQ ID NO:700有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述CD74的外显子2的等位基因变体与SEQ ID NO:720有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述SDC4的外显子2的等位基因变体与SEQ ID NO:746有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述SLC4A4的外显子14的等位基因变体与SEQ ID NO:780有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述SDC4的外显子4的等位基因变体与SEQ ID NO:748有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；

-所述ZFAT的外显子12的等位基因变体与SEQ ID NO:841有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性；以及

-所述DSCAML1的外显子3的等位基因变体与SEQ ID NO:872有至少85％的一致性，优选地与其有至少90％、92％、94％、96％或甚至98％的一致性。

11.根据权利要求7至10中任一项所述的多核苷酸，其中：

-所述VAPB与NRG1的融合物包含来自SEQ ID NO:3的2至约40个连续核酸，包括位置43和44处的核酸；

-所述CADM1与NRG1的融合物包含来自SEQ ID NO:7的2至约40个连续核酸，包括位置53和54处的核酸；

-所述CD44与NRG1的融合物包含来自SEQ ID NO:11的2至约40个连续核酸，包括位置52和53处的核酸；

-所述SLC3A2与NRG1的融合物包含来自SEQ ID NO:15的2至约40个连续核酸，包括位置53和54处的核酸；

-所述VTCN1与NRG1的融合物包含来自SEQ ID NO:166的2至约40个连续核酸，包括位置65和66处的核酸；

-所述CDH1与NRG1的融合物包含来自SEQ ID NO:186的2至约40个连续核酸，包括位置119和120处的核酸；

-所述CXADR与NRG1的融合物包含来自SEQ ID NO:217的2至约40个连续核酸，包括位置43和44处的核酸；

-所述GTF2E2与NRG1的融合物包含来自SEQ ID NO:233的2至约40个连续核酸，包括位置141和142处的核酸；

-所述CSMD1与NRG1的融合物包含来自SEQ ID NO:255的2至约40个连续核酸，包括位置88和89处的核酸；

-所述PTN与NRG1的融合物包含来自SEQ ID NO:313的2至约40个连续核酸，包括位置102和103处的核酸；

-所述ST14与NRG1的融合物包含来自SEQ ID NO:330的2至约40个连续核酸，包括位置95和96处的核酸；

-所述THBS1与NRG1的融合物包含来自SEQ ID NO:376的2至约40个连续核酸，包括位置56和57处的核酸；

-所述AGRN与NRG1的融合物包含来自SEQ ID NO:403的2至约40个连续核酸，包括位置106和107处的核酸；

-所述PVALB与NRG1的融合物包含来自SEQ ID NO:437的2至约40个连续核酸，包括位置102和103处的核酸；

-所述SLC3A2与NRG1的融合物包含来自SEQ ID NO:454的2至约40个连续核酸，包括位置93和94处的核酸；

-所述APP与NRG1的融合物包含来自SEQ ID NO:486的2至约40个连续核酸，包括位置54和55处的核酸；

-所述WRN与NRG1的融合物包含来自SEQ ID NO:528的2至约40个连续核酸，包括位置96和97处的核酸；

-所述DAAM1与NRG1的融合物包含来自SEQ ID NO:605的2至约40个连续核酸，包括位置75和76处的核酸；

-所述ASPH与NRG1的融合物包含来自SEQ ID NO:635的2至约40个连续核酸，包括位置75和76处的核酸；

-所述NOTCH2与NRG1的融合物包含来自SEQ ID NO:693的2至约40个连续核酸，包括位置75和76处的核酸；

-所述CD74与NRG1的融合物包含来自SEQ ID NO:717的2至约40个连续核酸，包括位置75和76处的核酸；

-所述SDC4与NRG1的融合物包含来自SEQ ID NO:743的2至约40个连续核酸，包括位置75和76处的核酸；

-所述CD44与NRG1的融合物包含来自SEQ ID NO:761的2至约40个连续核酸，包括位置75和76处的核酸；

-所述SLC4A4与NRG1的融合物包含来自SEQ ID NO:765的2至约40个连续核酸，包括位置75和76处的核酸；

-所述SDC4与NRG1的融合物包含来自SEQ ID NO:824的2至约40个连续核酸，包括位置75和76处的核酸；

-所述ZFAT与NRG1的融合物包含来自SEQ ID NO:828的2至约40个连续核酸，包括位置75和76处的核酸；以及

-所述DSCAML1与NRG1的融合物包含来自SEQ ID NO:868的2至约40个连续核酸，包括位置75和76处的核酸。

12.根据权利要求7至11中任一项所述的多核苷酸，其中：

-所述VAPB与NRG1的融合物包含SEQ ID NO:3或其等位基因变体；

-所述CAD1与NRG1的融合物包含SEQ ID NO:7或其等位基因变体；

-所述CD44与NRG1的融合物包含SEQ ID NO:11或其等位基因变体；

-所述SLC3A2与NRG1的融合物包含SEQ ID NO:15或其等位基因变体；

-所述VTCN1与NRG1的融合物包含SEQ ID NO:166或其等位基因变体；

-所述CDH1与NRG1的融合物包含SEQ ID NO:186或其等位基因变体；

-所述CXADR与NRG1的融合物包含SEQ ID NO:217或其等位基因变体；

-所述GTF2E2与NRG1的融合物包含SEQ ID NO:233或其等位基因变体；

-所述CSMD1与NRG1的融合物包含SEQ ID NO:255或其等位基因变体；

-所述PTN与NRG1的融合物包含SEQ ID NO:313或其等位基因变体；

-所述ST14与NRG1的融合物包含SEQ ID NO:330或其等位基因变体；

-所述THBS1与NRG1的融合物包含SEQ ID NO:376或其等位基因变体；

-所述AGRN与NRG1的融合物包含SEQ ID NO:403或其等位基因变体；

-所述PVALB与NRG1的融合物包含SEQ ID NO:437或其等位基因变体；

-所述SLC3A2与NRG1的融合物包含SEQ ID NO:454或其等位基因变体；

-所述APP与NRG1的融合物包含SEQ ID NO:486或其等位基因变体；

-所述WRN与NRG1的融合物包含SEQ ID NO:528或其等位基因变体；

-所述DAAM1与NRG1的融合物包含SEQ ID NO:605或其等位基因变体；

-所述ASPH与NRG1的融合物包含SEQ ID NO:635或其等位基因变体；

-所述NOTCH2与NRG1的融合物包含SEQ ID NO:693或其等位基因变体；

-所述CD74与NRG1的融合物包含SEQ ID NO:717或其等位基因变体；

-所述SDC4与NRG1的融合物包含SEQ ID NO:743或其等位基因变体；

-所述CD44与NRG1的融合物包含SEQ ID NO:761或其等位基因变体；

-所述SLC4A4与NRG1的融合物包含SEQ ID NO:765或其等位基因变体；

-所述SDC4与NRG1的融合物包含SEQ ID NO:824或其等位基因变体；

-所述ZFAT与NRG1的融合物包含SEQ ID NO:828或其等位基因变体；以及

-所述DSCAML1与NRG1的融合物包含SEQ ID NO:868或其等位基因变体。

13.根据权利要求7至12中任一项所述的多核苷酸，其中：

-所述VAPB的外显子1的一部分是或包含SEQ ID NO:1或SEQ ID NO:1的等位基因变体；

-所述CADM1的外显子7的一部分是或包含SEQ ID NO:5或SEQ ID NO:5的等位基因变体；

-所述CD44的外显子5的一部分是或包含SEQ ID NO:9或SEQ ID NO:9的等位基因变体；

-所述SLC3A2的外显子1的一部分是或包含SEQ ID NO:13或SEQ ID NO:13的等位基因变体；

-所述VTCN1的外显子2的一部分是或包含SEQ ID NO:164或SEQ ID NO:164的等位基因变体；

-所述CDH1的外显子11的一部分是或包含SEQ ID NO:184或SEQ ID NO:184的等位基因变体；

-所述CXADR的外显子1的一部分是或包含SEQ ID NO:215或SEQ ID NO:215的等位基因变体；

-所述GTF2E2的外显子2的一部分是或包含SEQ ID NO:231或SEQ ID NO:231的等位基因变体；

-所述CSMD1的外显子23的一部分是或包含SEQ ID NO:253或SEQ ID NO:253的等位基因变体；

-所述PTN的外显子4的一部分是或包含SEQ ID NO:311或SEQ ID NO:311的等位基因变体；

-所述ST14的外显子11的一部分是或包含SEQ ID NO:328或SEQ ID NO:328的等位基因变体；

-所述THBS1的外显子9的一部分是或包含SEQ ID NO:374或SEQ ID NO:374的等位基因变体；

-所述AGRN的外显子12的一部分是或包含SEQ ID NO:401或SEQ ID NO:401的等位基因变体；

-所述PVALB的外显子4的一部分是或包含SEQ ID NO:435或SEQ ID NO:435的等位基因变体；

-所述SLC3A2的外显子2的一部分是或包含SEQ ID NO:452或SEQ ID NO:452的等位基因变体；

-所述NRG1的外显子2的一部分是或包含SEQ ID NO:165或SEQ ID NO:165的等位基因变体；

-所述NRG1的外显子5的一部分是或包含SEQ ID NO:14或SEQ ID NO:14的等位基因变体；

-所述NRG1的外显子6的一部分是或包含SEQ ID NO:6或其等位基因变体；

-所述APP的外显子14的一部分是或包含SEQ ID NO:484或其等位基因变体；

-所述WRN的外显子33的一部分是或包含SEQ ID NO:526或其等位基因变体；

-所述DAAM1的外显子1的一部分是或包含SEQ ID NO:603或其等位基因变体；

-所述ASPH的外显子22的一部分是或包含SEQ ID NO:633或其等位基因变体；

-所述NOTCH2的外显子6的一部分是或包含SEQ ID NO:691或其等位基因变体；

-所述CD74的外显子2的一部分是或包含SEQ ID NO:715或其等位基因变体；

-所述SDC4的外显子2的一部分是或包含SEQ ID NO:741或其等位基因变体；

-所述CD44的外显子5的一部分是或包含SEQ ID NO:759或其等位基因变体；

-所述SLC4A4的外显子14的一部分是或包含SEQ ID NO:763或其等位基因变体；

-所述SDC4的外显子4的一部分是或包含SEQ ID NO:822或其等位基因变体；

-所述ZFAT的外显子12的一部分是或包含SEQ ID NO:826或其等位基因变体；

-所述DSCAML1的外显子3的一部分是或包含SEQ ID NO:866或其等位基因变体；以及

-所述NRG1的外显子1的一部分是或包含SEQ ID NO:604或其等位基因变体。

14.根据权利要求7至12中任一项所述的多核苷酸，其中：

-所述VAPB与NRG1的融合物在VAPB的外显子1与NRG1的外显子2之间包含融合接点，优选为SEQ ID NO:3的VAPB位置43的核酸与NRG1位置44的核酸之间的接点；

-所述CADM1与NRG1的融合物在CADM1的外显子7与NRG1的外显子6之间包含融合接点，优选为SEQ ID NO:7的CADM1位置53的核酸与NRG1位置54的核酸之间的接点；

-所述CD44与NRG1的融合物在CD44的外显子5与NRG1的外显子2之间包含融合接点，优选为SEQ ID NO:11的CD44位置52的核酸与NRG1位置53的核酸之间的接点；

-所述SLC3A2与NRG1的融合物在SLC3A2的外显子1与NRG1的外显子5之间包含融合接点，优选为SEQ ID NO:15的SLC3A2位置53的核酸与NRG1位置54的核酸之间的接点；

-所述VTCN1与NRG1的融合物在VTCN1的外显子2与NRG1的外显子2之间包含融合接点，优选为SEQ ID NO:166的VTCN1位置65的核酸与NRG1位置66的核酸之间的接点；

-所述CDH1与NRG1的融合物在CDH1的外显子11与NRG1的外显子2之间包含融合接点，优选为SEQ ID NO:186的CDH1位置119的核酸与NRG1位置120的核酸之间的接点；

-所述CXADR与NRG1的融合物在CXADR的外显子1与NRG1的外显子2之间包含融合接点，优选为SEQ ID NO:217的CXADR位置43的核酸与NRG1位置44的核酸之间的接点；

-所述GTF2E2与NRG1的融合物在GTF2E2的外显子2与NRG1的外显子2之间包含融合接点，优选为SEQ ID NO:233的GTF2E2位置141的核酸与NRG1位置142的核酸之间的接点；

-所述CSMD1与NRG1的融合物在CSMD1的外显子23与NRG1的外显子6之间包含融合接点，优选为SEQ ID NO:255的CSMD1位置88的核酸与NRG1位置89的核酸之间的接点；

-所述PTN与NRG1的融合物在PTN的外显子4与NRG1的外显子2之间包含融合接点，优选为SEQ ID NO:313的PTN位置102的核酸与NRG1位置103的核酸之间的接点；

-所述ST14与NRG1的融合物在ST14的外显子11与NRG1的外显子6之间包含融合接点，优选为SEQ ID NO:330的ST14位置95的核酸与NRG1位置96的核酸之间的接点；

-所述THBS1与NRG1的融合物在THBS1的外显子9与NRG1的外显子6之间包含融合接点，优选为SEQ ID NO:376的THBS1位置56的核酸与NRG1位置57的核酸之间的接点；

-所述AGRN与NRG1的融合物在AGRN的外显子12与NRG1的外显子6之间包含融合接点，优选为SEQ ID NO:403的AGRN位置106的核酸与NRG1位置107的核酸之间的接点；

-所述PVALB与NRG1的融合物在PVALB的外显子4与NRG1的外显子6之间包含融合接点，优选为SEQ ID NO:437的PVALB位置102的核酸与NRG1位置103的核酸之间的接点；

-所述SLC3A2与NRG1的融合物在SLC3A2的外显子2与NRG1的外显子6之间包含融合接点，优选为SEQ ID NO:454的SLC3A2位置93的核酸与NRG1位置94的核酸之间的接点；

-所述APP与NRG1的融合物在APP的外显子14与NRG1的外显子6之间包含融合接点，优选为SEQ ID NO:486的APP位置54的核酸与NRG1位置55的核酸之间的接点；

-所述WRN与NRG1的融合物在WRN的外显子33与NRG1的外显子6之间包含融合接点，优选为SEQ ID NO:528的WRN位置96的核酸与NRG1位置97的核酸之间的接点；

-所述DAAM1与NRG1的融合物在DAAM1的外显子1与NRG1的外显子1之间包含融合接点，优选为SEQ ID NO:605的DAAM1位置75的核酸与NRG1位置的核酸76之间的接点；

-所述ASPH与NRG1的融合物在ASPH的外显子22与NRG1的外显子2之间包含融合接点，优选为SEQ ID NO:635的ASPH位置75的核酸与NRG1位置76的核酸之间的接点；

-所述NOTCH2与NRG1的融合物在NOTCH2的外显子6与NRG1的外显子6之间包含融合接点，优选为SEQ ID NO:693的NOTCH2位置75的核酸与NRG1位置76的核酸之间的接点；

-所述CD74与NRG1的融合物在CD74的外显子2与NRG1的外显子2之间包含融合接点，优选为SEQ ID NO:717的CD74位置75的核酸与NRG1位置76的核酸之间的接点；

-所述SDC4与NRG1的融合物在SDC4的外显子2与NRG1的外显子2之间包含融合接点，优选为SEQ ID NO:743的SDC4位置75的核酸与NRG1位置76的核酸之间的接点；

-所述CD44与NRG1的融合物在CD44的外显子5与NRG1的外显子6之间包含融合接点，优选为SEQ ID NO:761的VAPB位置75的核酸与NRG1位置76的核酸之间的接点；

-所述SLC4A4与NRG1的融合物在SLC4A4的外显子14与NRG1的外显子6之间包含融合接点，优选为SEQ ID NO:765的SLC4A4位置75的核酸与NRG1位置76的核酸之间的接点；

-所述SDC4与NRG1的融合物在SDC4的外显子4与NRG1的外显子2之间包含融合接点，优选为SEQ ID NO:824的SDC4位置75的核酸与NRG1位置76的核酸之间的接点；

-所述ZFAT与NRG1的融合物在ZFAT的外显子12与NRG1的外显子6之间包含融合接点，优选为SEQ ID NO:828的ZFAT位置75的核酸与NRG1位置76的核酸之间的接点；及

-所述DSCAML1与NRG1的融合物在DSCAML1的外显子3与NRG1的外显子2之间包含融合接点，优选为SEQ ID NO:868的DSCAML1位置75的核酸与NRG1位置76的核酸之间的接点。

15.根据前述权利要求中任一项所述的多核苷酸，其中所述多核苷酸被分离或纯化。

16.根据前述权利要求中任一项所述的多核苷酸，其中所述融合物中的任一者为框内融合物。

17.根据前述权利要求中任一项所述的多核苷酸，其中所述多核苷酸为哺乳动物多核苷酸，优选为人类多核苷酸。

18.一种多肽融合物，其通过根据前述权利要求中任一项所述的多核苷酸编码。

19.一种载体，其包含根据权利要求1至17中任一项所述的多核苷酸。

20.一种重组宿主细胞，其包含根据权利要求1至17中任一项所述的多核苷酸或根据权利要求19所述的载体。

21.一种制造根据权利要求18所述的多肽融合物的方法，其包括将根据权利要求20所述的宿主细胞维持在适合所述宿主细胞所包含的多核苷酸表达的条件下，从而表达所述多核苷酸且产生多肽融合物，随后分离或纯化所述多肽融合物。

22.一种制造重组宿主细胞的方法，其包括将根据权利要求19所述的载体导入宿主细胞内。

23.一种检测测定法，其包含用于检测根据权利要求1至17中任一项所述的多核苷酸融合物的存在的核酸探针、引物或引物对。

24.一种用于检测根据权利要求1至17中任一项所述的多核苷酸融合物的核酸探针、引物或引物对。

25.根据权利要求24所述的核酸探针、引物或引物对，其长度为10至40个核苷酸。

26.根据权利要求24或25所述的核酸探针、引物或引物对，其中所检测到的融合物包含：

-所述VAPB与NRG1的融合物，其包含SEQ ID NO:3或由其组成，且优选地包括位置43或44的核酸；

-所述CADM1与NRG1的融合物，其包含SEQ ID NO:7或由其组成，且优选地包括位置53或54的核酸；

-所述CD44与NRG1的融合物，其包含SEQ ID NO:11或由其组成，且优选地包括位置52或53的核酸；

-所述SLC3A2与NRG1的融合物，其包含SEQ ID NO:15或由其组成，且优选地包括位置53或54的核酸；

-所述VTCN1与NRG1的融合物，其包含SEQ ID NO:166或由其组成，且优选地包括位置65或66的核酸；

-所述CDH1与NRG1的融合物，其包含SEQ ID NO:186或由其组成，且优选地包括位置119或120的核酸；

-所述CXADR与NRG1的融合物，其包含SEQ ID NO:217或由其组成，且优选地包括位置43或44的核酸；

-所述GTF2E2与NRG1的融合物，其包含SEQ ID NO:233或由其组成，且优选地包括位置141或142的核酸；

-所述CSMD1与NRG1的融合物，其包含SEQ ID NO:255或由其组成，且优选地包括位置88或89的核酸；

-所述PTN与NRG1的融合物，其包含SEQ ID NO:313或由其组成，且优选地包括位置102或103的核酸；

-所述ST14与NRG1的融合物，其包含SEQ ID NO:330或由其组成，且优选地包括位置95或96的核酸；

-所述THBS1与NRG1的融合物，其包含SEQ ID NO:376或由其组成，且优选地包括位置56或57的核酸；

-所述AGRN与NRG1的融合物，其包含SEQ ID NO:403或由其组成，且优选地包括位置106或107的核酸；

-所述PVALB与NRG1的融合物，其包含SEQ ID NO:437或由其组成，且优选地包括位置102或103的核酸；

-所述SLC3A2与NRG1的融合物，其包含SEQ ID NO:454或由其组成，且优选地包括位置93或94的核酸；

-所述APP与NRG1的融合物，其包含SEQ ID NO:486或由其组成，且优选地包括位置54或55的核酸；

-所述WRN与NRG1的融合物，其包含SEQ ID NO:528或由其组成，且优选地包括位置96或97的核酸；

-所述DAAM1与NRG1的融合物，其包含SEQ ID NO:605或由其组成，且优选地包括位置75或76的核酸；

-所述ASPH与NRG1的融合物，其包含SEQ ID NO:635或由其组成，且优选地包括位置75或76的核酸；

-所述NOTCH2与NRG1的融合物，其包含SEQ ID NO:693或由其组成，且优选地包括位置75或76的核酸；

-所述CD74与NRG1的融合物，其包含SEQ ID NO:717或由其组成，且优选地包括位置75或76的核酸；

-所述SDC4与NRG1的融合物，其包含SEQ ID NO:743或由其组成，且优选地包括位置75或76的核酸；

-所述CD44与NRG1的融合物，其包含SEQ ID NO:761或由其组成，且优选地包括位置75或76的核酸；

-所述SLC4A4与NRG1的融合物，其包含SEQ ID NO:765或由其组成，且优选地包括位置75或76的核酸；

-所述SDC4与NRG1的融合物，其包含SEQ ID NO:824或由其组成，且优选地包括位置75或76的核酸；

-所述ZFAT与NRG1的融合物，其包含SEQ ID NO:828或由其组成，且优选地包括位置75或76的核酸；以及

-所述DSCAML1与NRG1的融合物，其包含SEQ ID NO:868或由其组成，且优选地包括位置75或76的核酸。

27.根据权利要求24至26中任一项所述的核酸探针、引物或引物对，其中：

-用于检测所述VAPB与NRG1的融合物的探针、引物或引物对特异性地与由VAPB的外显子1所组成的序列或位于外显子1的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述CADM1与NRG1的融合物的探针、引物或引物对特异性地与由CADM1的外显子7所组成的序列或位于外显子7的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述CD44与NRG1的融合物的探针、引物或引物对特异性地与由CD44的外显子5所组成的序列或位于外显子5的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述SLC3A2的转录本6与NRG1的融合物的探针、引物或引物对特异性地与由SLC3A2的外显子1所组成的序列或位于外显子1的5’处的序列杂交，和/或特异性地与由NRG1的外显子5所组成的序列或位于外显子5的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述VTCN1与NRG1的融合物的探针、引物或引物对特异性地与由VTCN1的外显子2所组成的序列或位于外显子2的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述CDH1与NRG1的融合物的探针、引物或引物对特异性地与由CDH1的外显子11所组成的序列或位于外显子11的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述CXADR与NRG1的融合物的探针、引物或引物对特异性地与由CXADR的外显子1所组成的序列或位于外显子1的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述GTF2E2与NRG1的融合物的探针、引物或引物对特异性地与由GTF2E2的外显子2所组成的序列或位于外显子2的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述CSMD1与NRG1的融合物的探针、引物或引物对特异性地与由CSMD1的外显子23所组成的序列或位于外显子23的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述PTN与NRG1的融合物的探针、引物或引物对特异性地与由PTN的外显子4所组成的序列或位于外显子4的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述ST14与NRG1的融合物的探针、引物或引物对特异性地与由ST14的外显子11所组成的序列或位于外显子11的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述THBS1与NRG1的融合物的探针、引物或引物对特异性地与由THBS1的外显子9所组成的序列或位于外显子9的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述AGRN与NRG1的融合物的探针、引物或引物对特异性地与由AGRN的外显子12所组成的序列或位于外显子12的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述PVALB与NRG1的融合物的探针、引物或引物对特异性地与由PVALB的外显子4所组成的序列或位于外显子4的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述SLC3A2的转录本3与NRG1的融合物的探针、引物或引物对特异性地与由SLC3A2的外显子2所组成的序列或位于外显子2的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述APP与NRG1的融合物的探针、引物或引物对特异性地与由APP的外显子14所组成的序列或位于外显子14的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述WRN与NRG1的融合物的探针、引物或引物对特异性地与由WRN的外显子33所组成的序列或位于外显子33的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述DAAM1与NRG1的融合物的探针、引物或引物对特异性地与由DAAM1的外显子1所组成的序列或位于外显子1的5’处的序列杂交，和/或特异性地与由NRG1的外显子1所组成的序列或位于外显子1的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述ASPH与NRG1的融合物的探针、引物或引物对特异性地与由ASPH的外显子22所组成的序列或位于外显子22的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述NOTCH2与NRG1的融合物的探针、引物或引物对特异性地与由NOTCH2的外显子6所组成的序列或位于外显子6的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述CD74与NRG1的融合物的探针、引物或引物对特异性地与由CD74的外显子2所组成的序列或位于外显子2的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述SDC4与NRG1的融合物的探针、引物或引物对特异性地与由SDC4的外显子2所组成的序列或位于外显子2的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述CD44与NRG1的融合物的探针、引物或引物对特异性地与由CD44的外显子5所组成的序列或位于外显子5的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述SLC4A4与NRG1的融合物的探针、引物或引物对特异性地与由SLC4A4的外显子14所组成的序列或位于外显子14的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述SDC4与NRG1的融合物的探针、引物或引物对特异性地与由SDC4的外显子4所组成的序列或位于外显子4的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述ZFAT与NRG1的融合物的探针、引物或引物对特异性地与由ZFAT的外显子12所组成的序列或位于外显子12的5’处的序列杂交，和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性；或

-用于检测所述DSCAML1与NRG1的融合物的探针、引物或引物对特异性地与由DSCAML1的外显子3所组成的序列或位于外显子3的5’处的序列杂交，和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交，或是与其具有95％或更高的互补序列一致性。

28.根据权利要求27所述的核酸探针、引物或引物对，其中：

-来自NRG1的外显子1、2、5和6分别包含SEQ ID NO:125、126、129和130或其等位基因变体，或是由其组成。

29.根据权利要求27所述的核酸探针、引物或引物对，其中：

-用于检测所述VAPB与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:17所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述CADM1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:57所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述CD44与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:99所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述SLC3A2与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:103所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:157所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述VTCN1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:181所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述CDH1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:213所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述CXADR与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:219所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述GTF2E2与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:252所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述CSMD1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:309所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述PTN与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:326所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述ST14与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:372所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述THBS1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:399所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述AGRN与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:433所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述PVALB与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:450所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述SLC3A2与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:482所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述APP与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:524所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述WRN与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:601所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述DAAM1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:606所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:138所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述ASPH与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:689所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述NOTCH2与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:713所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述CD74与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:739所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述SDC4与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:757所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述CD44与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:99所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述SLC4A4与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:820所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述SDC4与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:940所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；

-用于检测所述ZFAT与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:864所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:155所组成的序列杂交，或是与其具有95％或更高的互补序列一致性；以及

-用于检测所述DSCAML1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:938所组成的序列杂交或其等位基因变体杂交，和/或特异性地与由SEQ ID NO:153所组成的序列杂交，或是与其具有95％或更高的互补序列一致性。

30.一种用于原位杂交测定法以检测根据权利要求1至17中任一项所述的多核苷酸融合物的第一核酸探针和第二核酸探针，

-其中所述第一探针特异性地与位于SEQ ID NO:3的位置43的核酸5’处的VAPB序列杂交，且所述第二探针特异性地与位于SEQ ID NO:3的位置44的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:7的位置53的核酸5’处的CADM1序列杂交，且所述第二探针特异性地与位于SEQ ID NO:7的位置54的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:11的位置52的核酸5’处的CD44序列杂交，且所述第二探针特异性地与位于SEQ ID NO:11的位置53的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:15的位置53的核酸5’处的SLC3A2序列杂交，且所述第二探针特异性地与位于SEQ ID NO:15的位置54的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:166的位置65的核酸5’处的VTCN1序列杂交，且所述第二探针特异性地与位于SEQ ID NO:166的位置66的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:186的位置119的核酸5’处的CDH1序列杂交，且所述第二探针特异性地与位于SEQ ID NO:186的位置120的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:217的位置43的核酸5’处的CXADR序列杂交，且所述第二探针特异性地与位于SEQ ID NO:217的位置44的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:233的位置141的核酸5’处的GTF2E2序列杂交，且所述第二探针特异性地与位于SEQ ID NO:233的位置142的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:255的位置88的核酸5’处的CSMD1序列杂交，且所述第二探针特异性地与位于SEQ ID NO:255的位置89的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:313的位置102的核酸5’处的PTN序列杂交，且所述第二探针特异性地与位于SEQ ID NO:313的位置103的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:330的位置95的核酸5’处的ST14序列杂交，且所述第二探针特异性地与位于SEQ ID NO:330的位置96的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:376的位置56的核酸5’处的THBS1序列杂交，且所述第二探针特异性地与位于SEQ ID NO:376的位置57的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:403的位置106的核酸5’处的AGRN序列杂交，且所述第二探针特异性地与位于SEQ ID NO:403的位置107的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:437的位置102的核酸5’处的PVALB序列杂交，且所述第二探针特异性地与位于SEQ ID NO:437的位置103的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:454的位置93的核酸5’处的SLC3A2序列杂交，且所述第二探针特异性地与位于SEQ ID NO:454的位置94的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:486的位置54的核酸5’处的APP序列杂交，且所述第二探针特异性地与位于SEQ ID NO:486的位置55的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:528的位置96的核酸5’处的WRN序列杂交，且所述第二探针特异性地与位于SEQ ID NO:528的位置97的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:605的位置75的核酸5’处的DAAM1序列杂交，且所述第二探针特异性地与位于SEQ ID NO:605的位置76的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:635的位置75的核酸5’处的ASPH序列杂交，且所述第二探针特异性地与位于SEQ ID NO:635的位置76的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:693的位置75的核酸5’处的NOTCH2序列杂交，且所述第二探针特异性地与位于SEQ ID NO:693的位置76的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:717的位置75的核酸5’处的CD74序列杂交，且所述第二探针特异性地与位于SEQ ID NO:717的位置76的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:743的位置75的核酸5’处的SDC4序列杂交，且所述第二探针特异性地与位于SEQ ID NO:743的位置76的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:761的位置75的核酸5’处的CD44序列杂交，且所述第二探针特异性地与位于SEQ ID NO:761的位置76的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:765的位置75的核酸5’处的SLC4A4序列杂交，且所述第二探针特异性地与位于SEQ ID NO:765的位置76的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:824的位置75的核酸5’处的SDC4序列杂交，且所述第二探针特异性地与位于SEQ ID NO:824的位置76的核酸3’处的NRG1序列杂交；

-其中所述第一探针特异性地与位于SEQ ID NO:828的位置75的核酸5’处的ZFAT序列杂交，且所述第二探针特异性地与位于SEQ ID NO:828的位置76的核酸3’处的NRG1序列杂交；或

-其中该所述第一探针特异性地与位于SEQ ID NO:868的位置75的核酸5’处的DSCAML1序列杂交，且所述第二探针特异性地与位于SEQ ID NO:868的位置76的核酸3’处的NRG1序列杂交。

31.一种用于检测根据权利要求1至17中任一项所述的多核苷酸融合物所编码的多肽的第一抗体或第一与第二抗体组。

32.一种包含用于检测根据权利要求1至17中任一项所述的多核苷酸融合物所编码的多肽的存在的第一抗体或第一与第二抗体组的检测测定法，其中所述第一抗体或第一与第二抗体组优选为根据权利要求31所述的第一抗体或第一与第二抗体组。

33.根据权利要求31所述的第一抗体或第一与第二抗体组，或根据权利要求32所述的检测测定法，其中所述第一抗体结合选自VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1或DSCAML1-NRG1的多肽融合物，并且所述第一与第二抗体组分别结合VAPB与NRG1、或CADM1与NRG1、或CD44与NRG1、SLC3A2与NRG1、VTCN1与NRG1、CDH1与NRG1、CXADR与NRG1、GTF2E2与NRG1、CSMD1与NRG1、PTN与NRG1、ST14与NRG1、THBS1与NRG1、AGRN与NRG1、PVALB与NRG1、APP与NRG1、WRN与NRG1、ASPH与NRG1、NOTCH2与NRG1、CD74与NRG1、SDC4与NRG1、SLC4A4与NRG1、ZFAT与NRG1、或DSCAML1与NRG1。

34.一种用于在样本中鉴定根据权利要求1至17中任一项所述的多核苷酸融合物、或由其所编码的多肽的方法，所述方法包括检验获自受试者的样本以检测所述样本中所述融合物的存在。

35.一种用于在样本中检测根据权利要求1至17中任一项所述的多核苷酸融合物、或由其所编码的多肽是否存在的方法，所述方法包括检验获自受试者的样本以检测所述样本中所述融合物的存在。

36.一种用于确定来自受试者的异常细胞是否包含根据权利要求1至17中任一项所述的多核苷酸融合物、或由其所编码的多肽的方法，所述方法包括针对样本中所述融合物的存在，检验获自所述受试者的异常细胞的多核苷酸或多肽内容物。

37.一种用于鉴定受试者携带根据权利要求1至17中任一项所述的多核苷酸融合物、或由其所编码的多肽的方法，所述方法包括检验获自受试者的样本以检测所述样本中所述融合物的存在。

38.根据权利要求34至37中任一项所述的方法，其中所述检验包括利用特异性地结合所述多核苷酸的结合剂，诸如根据权利要求24至29中任一项所述的核酸探针、引物或引物对以检测所述融合物、或由其所编码的多肽，或是利用结合包含所述多核苷酸融合物的多核苷酸的结合剂进行检测。

39.根据权利要求34至38中任一项所述的方法，其中所述检验包括扩增或检测能区分所述多核苷酸融合物或由其所编码的多肽存在或不存在的序列。

40.根据权利要求34至39中任一项所述的方法，其中所述多核苷酸融合物获自表达包含NRG1的EGF样结构域的多核苷酸融合物的异常细胞。

41.根据权利要求34至40中任一项所述的方法，其中所述方法包括从受试者获得样本的步骤，随后为从所述样本中分离所述多核苷酸或由其所编码的多肽的步骤。

42.根据权利要求34至41中任一项所述的方法，其中所述方法包括从所述样本纯化或分离所述多核苷酸的步骤。

43.根据权利要求34至42中任一项所述的方法，其中所述结合剂是或包含引物、引物对、探针或抗体。

44.根据权利要求34至43中任一项所述的方法，其中所述检验为离体方法，优选为体外方法。

45.根据权利要求34至44中任一项所述的方法，其中所述结合剂包含可检测标记或与其相关联。

46.根据权利要求34至45中任一项所述的方法，其中所述样本为液态活检样本或固态样本，诸如经福尔马林固定的石蜡包埋组织(FFPE)样本。

47.根据权利要求34至46中任一项所述的方法，其中所述样本包含血液、血清、血浆、胸水、尿液、精液、羊水或腹水。

48.根据权利要求34至47中任一项所述的方法，其中所述样本包含变异细胞，诸如肿瘤细胞或癌细胞，或其多核苷酸或多肽内容物。

49.一种治疗患有包含多核苷酸融合物和/或表达由其所编码的融合多肽的ErbB-2和/或ErbB-3阳性癌症或肿瘤的受试者的方法，所述方法包括向所述受试者施用有效量的ErbB-2和/或ErbB-3靶向剂，其中所述融合物为根据权利要求1至17中任一项所述的融合物。

50.一种用于抑制患有包含多核苷酸融合物和/或表达由其所编码的融合多肽的ErbB-2和ErbB-3阳性癌症或肿瘤的受试者进程的方法，所述方法包括向所述受试者施用有效量的ErbB-2和/或ErbB-3靶向剂，其中所述融合物为根据权利要求1至17中任一项所述的融合物。

51.一种用于治疗患有包含多核苷酸融合物和/或表达由其所编码的融合多肽的ErbB-2和ErbB-3阳性癌症或肿瘤的受试者的ErbB-2和/或ErbB-3靶向剂，所述治疗包括向所述受试者施用有效量的ErbB-2和/或ErbB-3靶向剂，其中所述融合物为根据权利要求1至17中任一项所述的融合物。

52.一种用于诊断受试者是否有包含根据权利要求1至17中任一项所述的多核苷酸融合物或由其所编码的多肽的异常细胞的方法，所述方法包括检验获自受试者的样本以检测所述样本中所述融合物的存在。

53.根据权利要求52所述的方法，其中所述检验包括利用特异性地结合所述多核苷酸的结合剂，诸如根据权利要求24至29中任一项所述的核酸探针、引物或引物对以检测所述融合物、或由其所编码的多肽，或是利用结合包含所述多核苷酸融合物的多核苷酸的结合剂进行检测。

54.一种用于评估受试者是否罹患癌症或肿瘤或是易于罹患癌症或肿瘤的方法，所述方法包括检验获自受试者的样本以检测所述样本中根据权利要求1至17中任一项所述的多核苷酸融合物或由其所编码的多肽的存在，并且通过鉴定所述多核苷酸或多肽融合物的存在来评估所述受试者罹患所述癌症或肿瘤或是易于罹患所述癌症或肿瘤。

55.根据权利要求49至51中任一项所述的方法或用途，其中所述ErbB-2和/或ErbB-3靶向剂选自由以下组成的组：包含结合ErbB-2的胞外部分的第一抗原结合位点和结合ErbB-3的胞外部分的第二抗原结合位点的多特异性抗体、ErbB-2的酪氨酸激酶抑制剂、包含结合ErbB-2的胞外部分的抗原结合位点的单特异性二价抗体、包含结合ErbB-3的胞外部分的抗原结合位点的单特异性二价抗体、或其任何组合。

56.根据权利要求49至51或55中任一项所述的方法或用途，其中所述ErbB-2和/或ErbB-3靶向剂为泽妥珠单抗(zenocutuzumab)。

57.根据权利要求35至56中任一项所述的方法或用途，其中所述异常细胞、癌细胞、肿瘤细胞或样本包含根据权利要求1至17所述的多核苷酸融合物或由其编码的多肽，并且其中所述细胞或样本所包含的多核苷酸融合物进一步包含编码NRG1的EGF样结构域的编码序列的框内融合物。

58.根据权利要求35至57中任一项所述的方法或用途，其中所述异常细胞来自癌症，特别是所述癌症为腺癌，更特别是黏液腺癌、胰脏癌，更特别是胰脏腺癌，更特别是胰脏导管腺癌、肾细胞癌、肉瘤、膀胱癌、大肠癌、直肠癌、大肠直肠癌、胆囊癌、头颈癌、前列腺癌、子宫癌、乳癌、卵巢癌、肝癌、子宫内膜癌、肺癌，优选为非小细胞肺癌，优选地、更优选地为浸润性黏液腺癌、或是原发性癌或转移性癌。

59.一种包含根据权利要求1至17中任一项所述的多核苷酸融合物和/或表达由其所编码的多肽融合物的体内动物模型，其中由所述动物模型所包含的多核苷酸融合物或多肽融合物优选地是由存在于所述动物模型中的移植异常细胞所包含，或是由所述动物模型的基因组所包含。

60.一种用Erb2和/或Erb3靶向剂治疗根据权利要求59所述的体内动物模型的方法，所述靶向剂选自由以下所组成的组：包含结合ErbB-2的胞外部分的第一抗原结合位点和结合ErbB-3的胞外部分的第二抗原结合位点的多特异性抗体、ErbB-2的酪氨酸激酶抑制剂、包含结合ErbB-2的胞外部分的抗原结合位点的单特异性二价抗体、包含结合ErbB-3的胞外部分的抗原结合位点的单特异性二价抗体、或其任何组合，所述方法包括向所述动物施用所述Erb2和/或Erb3靶向剂。

61.一种用于原位杂交测定法以检测VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的基因重排的第一核酸探针和第二核酸探针，其中：

-用于检测VAPB的基因重排的所述第一探针特异性地与SEQ ID NO:1的位置43的核酸5’处的VAPB序列杂交，且所述第二探针特异性地与位于SEQ ID NO:1的位置43的核酸3’处的VAPB序列杂交；

-用于检测CADM1的基因重排的所述第一探针特异性地与SEQ ID NO:5的位置53的核酸5’处的CADM1序列杂交，且所述第二探针特异性地与位于SEQ ID NO:5的位置53的核酸3’处的CADM1序列杂交；

-用于检测CD44的基因重排的所述第一探针特异性地与SEQ ID NO:9的位置52的核酸5’处的CD44序列杂交，且所述第二探针特异性地与位于SEQ ID NO:9的位置52的核酸3’处的CD44序列杂交；

-用于检测SLC3A2的基因重排的所述第一探针特异性地与SEQ ID NO:13的位置53的核酸5’处的SLC3A2序列杂交，且所述第二探针特异性地与位于SEQ ID NO:13的位置53的核酸3’处的SLC3A2序列杂交；

-用于检测VTCN1的基因重排的所述第一探针特异性地与SEQ ID NO:164的位置65的核酸5’处的VTCN1序列杂交，且所述第二探针特异性地与位于SEQ ID NO:164的位置65的核酸3’处的VTCN1序列杂交；

-用于检测CDH1的基因重排的所述第一探针特异性地与SEQ ID NO:184的位置119的核酸5’处的CDH1序列杂交，且所述第二探针特异性地与位于SEQ ID NO:184的位置119的核酸3’处的CDH1序列杂交；

-用于检测CXADR的基因重排的所述第一探针特异性地与SEQ ID NO:215的位置43的核酸5’处的CXADR序列杂交，且所述第二探针特异性地与位于SEQ ID NO:215的位置43的核酸3’处的CXADR序列杂交；

-用于检测GTF2E2的基因重排的所述第一探针特异性地与SEQ ID NO:231的位置141的核酸5’处的GTF2E2序列杂交，且所述第二探针特异性地与位于SEQ ID NO:231的位置141的核酸3’处的GTF2E2序列杂交；

-用于检测CSMD1的基因重排的所述第一探针特异性地与SEQ ID NO:253的位置88的核酸5’处的CSMD1序列杂交，且所述第二探针特异性地与位于SEQ ID NO:253的位置88的核酸3’处的CSMD1序列杂交；

-用于检测PTN的基因重排的所述第一探针特异性地与SEQ ID NO:311的位置102的核酸5’处的PTN序列杂交，且所述第二探针特异性地与位于SEQ ID NO:311的位置102的核酸3’处的PTN序列杂交；

-用于检测ST14的基因重排的所述第一探针特异性地与SEQ ID NO:328的位置95的核酸5’处的ST14序列杂交，且所述第二探针特异性地与位于SEQ ID NO:328的位置95的核酸3’处的ST14序列杂交；

-用于检测AGRN的基因重排的所述第一探针特异性地与SEQ ID NO:401的位置106的核酸5’处的AGRN序列杂交，且所述第二探针特异性地与位于SEQ ID NO:401的位置106的核酸3’处的AGRN序列杂交；

-用于检测THBS1的基因重排的所述第一探针特异性地与SEQ ID NO:374的位置56的核酸5’处的THBS1序列杂交，且所述第二探针特异性地与位于SEQ ID NO:374的位置56的核酸3’处的THBS1序列杂交；

-用于检测PVALB的基因重排的所述第一探针特异性地与SEQ ID NO:435的位置102的核酸5’处的PVALB序列杂交，且所述第二探针特异性地与位于SEQ ID NO:435的位置102的核酸3’处的PVALB序列杂交；

-用于检测SLC3A2的基因重排的所述第一探针特异性地与SEQ ID NO:452的位置93的核酸5’处的SLC3A2序列杂交，且所述第二探针特异性地与位于SEQ ID NO:452的位置93的核酸3’处的SLC3A2序列杂交；

-用于检测APP的基因重排的所述第一探针特异性地与SEQ ID NO:484的位置54的核酸5’处的APP序列杂交，且所述第二探针特异性地与位于SEQ ID NO:484的位置54的核酸3’处的APP序列杂交；

-用于检测WRN的基因重排的所述第一探针特异性地与SEQ ID NO:526的位置96的核酸5’处的WRN序列杂交，且所述第二探针特异性地与位于SEQ ID NO:526的位置96的核酸3’处的WRN序列杂交；

-用于检测DAAM1的基因重排的所述第一探针特异性地与SEQ ID NO:603的位置75的核酸5’处的DAAM1序列杂交，且所述第二探针特异性地与位于SEQ ID NO:603的位置75的核酸3’处的DAAM1序列杂交；

-用于检测ASPH的基因重排的所述第一探针特异性地与SEQ ID NO:633的位置75的核酸5’处的ASPH序列杂交，且所述第二探针特异性地与位于SEQ ID NO:633的位置75的核酸3’处的ASPH序列杂交；

-用于检测NOTCH2的基因重排的所述第一探针特异性地与SEQ ID NO:691的位置75的核酸5’处的NOTCH2序列杂交，且所述第二探针特异性地与位于SEQ ID NO:691的位置75的核酸3’处的NOTCH2序列杂交；

-用于检测CD74的基因重排的所述第一探针特异性地与SEQ ID NO:715的位置75的核酸5’处的CD74序列杂交，且所述第二探针特异性地与位于SEQ ID NO:715的位置75的核酸3’处的CD74序列杂交；

-用于检测SDC4的基因重排的所述第一探针特异性地与SEQ ID NO:741的位置75的核酸5’处的SDC4序列杂交，且所述第二探针特异性地与位于SEQ ID NO:741的位置75的核酸3’处的SDC4序列杂交；

-用于检测CD44的基因重排的所述第一探针特异性地与SEQ ID NO:759的位置75的核酸5’处的CD44序列杂交，且所述第二探针特异性地与位于SEQ ID NO:759的位置75的核酸3’处的CD44序列杂交；

-用于检测SLC4A4的基因重排的所述第一探针特异性地与SEQ ID NO:763的位置75的核酸5’处的SLC4A4序列杂交，且所述第二探针特异性地与位于SEQ ID NO:763的位置75的核酸3’处的SLC4A4序列杂交；

-用于检测SDC4的基因重排的所述第一探针特异性地与SEQ ID NO:822的位置75的核酸5’处的SDC4序列杂交，且所述第二探针特异性地与位于SEQ ID NO:822的位置75的核酸3’处的SDC4序列杂交；

-用于检测ZFAT的基因重排的所述第一探针特异性地与SEQ ID NO:826的位置75的核酸5’处的ZFAT序列杂交，且所述第二探针特异性地与位于SEQ ID NO:826的位置75的核酸3’处的ZFAT序列杂交；或

-用于检测DSCAML1的基因重排的所述第一探针特异性地与SEQ ID NO:866的位置75的核酸5’处的DSCAML1序列杂交，且所述第二探针特异性地与位于SEQ ID NO:866的位置75的核酸3’处的DSCAML1序列杂交。