CN117460844A - 新nrg1融合物、融合接点以及检测它们的方法 - Google Patents
新nrg1融合物、融合接点以及检测它们的方法 Download PDFInfo
- Publication number
- CN117460844A CN117460844A CN202280040112.2A CN202280040112A CN117460844A CN 117460844 A CN117460844 A CN 117460844A CN 202280040112 A CN202280040112 A CN 202280040112A CN 117460844 A CN117460844 A CN 117460844A
- Authority
- CN
- China
- Prior art keywords
- exon
- seq
- nrg1
- sequence
- allelic variant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000048238 Neuregulin-1 Human genes 0.000 title claims abstract description 739
- 108090000556 Neuregulin-1 Proteins 0.000 title claims abstract description 739
- 230000004927 fusion Effects 0.000 title claims abstract description 563
- 238000000034 method Methods 0.000 title claims abstract description 72
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 59
- 230000002159 abnormal effect Effects 0.000 claims abstract description 35
- 101710100969 Receptor tyrosine-protein kinase erbB-3 Proteins 0.000 claims abstract description 31
- 101150029707 ERBB2 gene Proteins 0.000 claims abstract description 26
- 150000007523 nucleic acids Chemical group 0.000 claims description 608
- 102000039446 nucleic acids Human genes 0.000 claims description 526
- 108020004707 nucleic acids Proteins 0.000 claims description 526
- 102000040430 polynucleotide Human genes 0.000 claims description 276
- 108091033319 polynucleotide Proteins 0.000 claims description 276
- 239000002157 polynucleotide Substances 0.000 claims description 276
- 239000000523 sample Substances 0.000 claims description 198
- 102100032912 CD44 antigen Human genes 0.000 claims description 123
- 108090000623 proteins and genes Proteins 0.000 claims description 120
- 102100033400 4F2 cell-surface antigen heavy chain Human genes 0.000 claims description 116
- 101000868273 Homo sapiens CD44 antigen Proteins 0.000 claims description 113
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 112
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 111
- 229920001184 polypeptide Polymers 0.000 claims description 110
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 107
- 108091006313 SLC3A2 Proteins 0.000 claims description 103
- 102000012545 EGF-like domains Human genes 0.000 claims description 91
- 108050002150 EGF-like domains Proteins 0.000 claims description 91
- 102100032026 Vesicle-associated membrane protein-associated protein B/C Human genes 0.000 claims description 73
- 101000775932 Homo sapiens Vesicle-associated membrane protein-associated protein B/C Proteins 0.000 claims description 72
- 108010072135 Cell Adhesion Molecule-1 Proteins 0.000 claims description 71
- 102100038929 V-set domain-containing T-cell activation inhibitor 1 Human genes 0.000 claims description 66
- 101000955999 Homo sapiens V-set domain-containing T-cell activation inhibitor 1 Proteins 0.000 claims description 61
- 108091007854 Cdh1/Fizzy-related Proteins 0.000 claims description 57
- 102100025278 Coxsackievirus and adenovirus receptor Human genes 0.000 claims description 57
- 210000004027 cell Anatomy 0.000 claims description 57
- 101000858031 Homo sapiens Coxsackievirus and adenovirus receptor Proteins 0.000 claims description 56
- 102100037220 Syndecan-4 Human genes 0.000 claims description 53
- 101000740519 Homo sapiens Syndecan-4 Proteins 0.000 claims description 52
- 102100022108 Aspartyl/asparaginyl beta-hydroxylase Human genes 0.000 claims description 45
- 102100036606 Zinc finger protein ZFAT Human genes 0.000 claims description 45
- 101000782089 Homo sapiens Zinc finger protein ZFAT Proteins 0.000 claims description 44
- 101000901030 Homo sapiens Aspartyl/asparaginyl beta-hydroxylase Proteins 0.000 claims description 43
- 101000635854 Homo sapiens Myoglobin Proteins 0.000 claims description 43
- 101000706121 Homo sapiens Parvalbumin alpha Proteins 0.000 claims description 43
- 102100030856 Myoglobin Human genes 0.000 claims description 43
- 102000006633 Sodium-Bicarbonate Symporters Human genes 0.000 claims description 43
- 102100037712 Down syndrome cell adhesion molecule-like protein 1 Human genes 0.000 claims description 40
- 101000880951 Homo sapiens Down syndrome cell adhesion molecule-like protein 1 Proteins 0.000 claims description 39
- 102100028555 Disheveled-associated activator of morphogenesis 1 Human genes 0.000 claims description 38
- 101000915413 Homo sapiens Disheveled-associated activator of morphogenesis 1 Proteins 0.000 claims description 38
- 102100035336 Werner syndrome ATP-dependent helicase Human genes 0.000 claims description 38
- 101001082627 Homo sapiens HLA class II histocompatibility antigen gamma chain Proteins 0.000 claims description 37
- 102100040026 Agrin Human genes 0.000 claims description 36
- 102100024649 Cell adhesion molecule 1 Human genes 0.000 claims description 36
- 102100030595 HLA class II histocompatibility antigen gamma chain Human genes 0.000 claims description 36
- 101000661807 Homo sapiens Suppressor of tumorigenicity 14 protein Proteins 0.000 claims description 34
- 101000804798 Homo sapiens Werner syndrome ATP-dependent helicase Proteins 0.000 claims description 34
- 102100025246 Neurogenic locus notch homolog protein 2 Human genes 0.000 claims description 34
- 102100037942 Suppressor of tumorigenicity 14 protein Human genes 0.000 claims description 34
- 108090000368 Fibroblast growth factor 8 Proteins 0.000 claims description 33
- 101000959594 Homo sapiens Agrin Proteins 0.000 claims description 33
- 101000658563 Homo sapiens Transcription initiation factor IIE subunit beta Proteins 0.000 claims description 33
- 102100036034 Thrombospondin-1 Human genes 0.000 claims description 33
- 102100034904 Transcription initiation factor IIE subunit beta Human genes 0.000 claims description 33
- 101000659879 Homo sapiens Thrombospondin-1 Proteins 0.000 claims description 32
- 108091006262 SLC4A4 Proteins 0.000 claims description 31
- 108010029751 Notch2 Receptor Proteins 0.000 claims description 30
- 230000008707 rearrangement Effects 0.000 claims description 30
- 108091026890 Coding region Proteins 0.000 claims description 28
- 201000011510 cancer Diseases 0.000 claims description 25
- 238000001514 detection method Methods 0.000 claims description 23
- 239000002773 nucleotide Substances 0.000 claims description 22
- 125000003729 nucleotide group Chemical group 0.000 claims description 22
- 239000003795 chemical substances by application Substances 0.000 claims description 19
- 230000008685 targeting Effects 0.000 claims description 18
- 108020004711 Nucleic Acid Probes Proteins 0.000 claims description 16
- 238000003556 assay Methods 0.000 claims description 16
- 239000002853 nucleic acid probe Substances 0.000 claims description 16
- 239000000427 antigen Substances 0.000 claims description 14
- 108091007433 antigens Proteins 0.000 claims description 14
- 102000036639 antigens Human genes 0.000 claims description 14
- 108700024394 Exon Proteins 0.000 claims description 8
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 8
- 230000014509 gene expression Effects 0.000 claims description 8
- 238000011282 treatment Methods 0.000 claims description 8
- 238000010171 animal model Methods 0.000 claims description 7
- 210000004369 blood Anatomy 0.000 claims description 5
- 239000008280 blood Substances 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 5
- 206010061902 Pancreatic neoplasm Diseases 0.000 claims description 4
- 201000010879 mucinous adenocarcinoma Diseases 0.000 claims description 4
- 210000001519 tissue Anatomy 0.000 claims description 4
- 206010052747 Adenocarcinoma pancreas Diseases 0.000 claims description 3
- 206010009944 Colon cancer Diseases 0.000 claims description 3
- 208000009956 adenocarcinoma Diseases 0.000 claims description 3
- 238000001727 in vivo Methods 0.000 claims description 3
- 230000002401 inhibitory effect Effects 0.000 claims description 3
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 claims description 3
- 208000002154 non-small cell lung carcinoma Diseases 0.000 claims description 3
- 201000002094 pancreatic adenocarcinoma Diseases 0.000 claims description 3
- 201000002528 pancreatic cancer Diseases 0.000 claims description 3
- 208000008443 pancreatic carcinoma Diseases 0.000 claims description 3
- 201000008129 pancreatic ductal adenocarcinoma Diseases 0.000 claims description 3
- 210000004881 tumor cell Anatomy 0.000 claims description 3
- 206010005003 Bladder cancer Diseases 0.000 claims description 2
- 206010006187 Breast cancer Diseases 0.000 claims description 2
- 208000026310 Breast neoplasm Diseases 0.000 claims description 2
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims description 2
- 206010014733 Endometrial cancer Diseases 0.000 claims description 2
- 206010014759 Endometrial neoplasm Diseases 0.000 claims description 2
- 206010033128 Ovarian cancer Diseases 0.000 claims description 2
- 206010060862 Prostate cancer Diseases 0.000 claims description 2
- 208000006265 Renal cell carcinoma Diseases 0.000 claims description 2
- 206010039491 Sarcoma Diseases 0.000 claims description 2
- 201000010175 gallbladder cancer Diseases 0.000 claims description 2
- 230000002068 genetic effect Effects 0.000 claims description 2
- 238000002955 isolation Methods 0.000 claims description 2
- 206010061289 metastatic neoplasm Diseases 0.000 claims description 2
- 238000000746 purification Methods 0.000 claims description 2
- 239000007787 solid Substances 0.000 claims description 2
- 206010046766 uterine cancer Diseases 0.000 claims description 2
- 230000000295 complement effect Effects 0.000 claims 54
- 102100040750 CUB and sushi domain-containing protein 1 Human genes 0.000 claims 21
- 102000038594 Cdh1/Fizzy-related Human genes 0.000 claims 21
- 101000892017 Homo sapiens CUB and sushi domain-containing protein 1 Proteins 0.000 claims 21
- 102100039277 Pleiotrophin Human genes 0.000 claims 18
- 239000011230 binding agent Substances 0.000 claims 6
- 201000010989 colorectal carcinoma Diseases 0.000 claims 2
- 238000012296 in situ hybridization assay Methods 0.000 claims 2
- 229940121358 tyrosine kinase inhibitor Drugs 0.000 claims 2
- 239000005483 tyrosine kinase inhibitor Substances 0.000 claims 2
- 150000004917 tyrosine kinase inhibitor derivatives Chemical class 0.000 claims 2
- 101100438168 Arabidopsis thaliana CAD9 gene Proteins 0.000 claims 1
- 206010003445 Ascites Diseases 0.000 claims 1
- 208000010667 Carcinoma of liver and intrahepatic biliary tract Diseases 0.000 claims 1
- 101100494469 Dictyostelium discoideum cadA gene Proteins 0.000 claims 1
- 206010073069 Hepatic cancer Diseases 0.000 claims 1
- 206010048612 Hydrothorax Diseases 0.000 claims 1
- 101100178218 Schizosaccharomyces pombe (strain 972 / ATCC 24843) hmt2 gene Proteins 0.000 claims 1
- 210000004381 amniotic fluid Anatomy 0.000 claims 1
- 201000001531 bladder carcinoma Diseases 0.000 claims 1
- 201000008275 breast carcinoma Diseases 0.000 claims 1
- 101150018983 cad1 gene Proteins 0.000 claims 1
- 201000003914 endometrial carcinoma Diseases 0.000 claims 1
- 201000007487 gallbladder carcinoma Diseases 0.000 claims 1
- 201000003911 head and neck carcinoma Diseases 0.000 claims 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 claims 1
- 238000000338 in vitro Methods 0.000 claims 1
- 238000011528 liquid biopsy Methods 0.000 claims 1
- 201000002250 liver carcinoma Diseases 0.000 claims 1
- 201000005296 lung carcinoma Diseases 0.000 claims 1
- 208000011645 metastatic carcinoma Diseases 0.000 claims 1
- 239000012188 paraffin wax Substances 0.000 claims 1
- 210000002381 plasma Anatomy 0.000 claims 1
- 201000001514 prostate carcinoma Diseases 0.000 claims 1
- 206010038038 rectal cancer Diseases 0.000 claims 1
- 208000020615 rectal carcinoma Diseases 0.000 claims 1
- 210000000582 semen Anatomy 0.000 claims 1
- 210000002966 serum Anatomy 0.000 claims 1
- 208000010570 urinary bladder carcinoma Diseases 0.000 claims 1
- 210000002700 urine Anatomy 0.000 claims 1
- 208000012991 uterine carcinoma Diseases 0.000 claims 1
- 230000001225 therapeutic effect Effects 0.000 abstract description 5
- 150000001875 compounds Chemical class 0.000 abstract description 2
- 102000014413 Neuregulin Human genes 0.000 description 88
- 108050003475 Neuregulin Proteins 0.000 description 88
- 235000018102 proteins Nutrition 0.000 description 60
- 102000004169 proteins and genes Human genes 0.000 description 60
- 102000006818 Cell Adhesion Molecule-1 Human genes 0.000 description 45
- 102100025805 Cadherin-1 Human genes 0.000 description 41
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 25
- 239000002299 complementary DNA Substances 0.000 description 25
- 108020004999 messenger RNA Proteins 0.000 description 25
- 239000000047 product Substances 0.000 description 18
- 102000005162 pleiotrophin Human genes 0.000 description 15
- 108010029485 Protein Isoforms Proteins 0.000 description 13
- 102000001708 Protein Isoforms Human genes 0.000 description 13
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 13
- 101000800023 Homo sapiens 4F2 cell-surface antigen heavy chain Proteins 0.000 description 12
- 201000010099 disease Diseases 0.000 description 11
- 208000010507 Adenocarcinoma of Lung Diseases 0.000 description 10
- 102100022704 Amyloid-beta precursor protein Human genes 0.000 description 10
- DZHSAHHDTRWUTF-SIQRNXPUSA-N amyloid-beta polypeptide 42 Chemical compound C([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O)[C@@H](C)CC)C(C)C)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O)C(C)C)C(C)C)C1=CC=CC=C1 DZHSAHHDTRWUTF-SIQRNXPUSA-N 0.000 description 10
- 238000003745 diagnosis Methods 0.000 description 10
- 108700028369 Alleles Proteins 0.000 description 9
- 108091016585 CD44 antigen Proteins 0.000 description 9
- 101150038921 NRG1 gene Proteins 0.000 description 9
- 108091005461 Nucleic proteins Proteins 0.000 description 9
- 102100022661 Pro-neuregulin-1, membrane-bound isoform Human genes 0.000 description 9
- 231100000590 oncogenic Toxicity 0.000 description 9
- 230000002246 oncogenic effect Effects 0.000 description 9
- 230000037361 pathway Effects 0.000 description 9
- 230000035755 proliferation Effects 0.000 description 9
- 230000004083 survival effect Effects 0.000 description 9
- 102000000905 Cadherin Human genes 0.000 description 8
- 108050007957 Cadherin Proteins 0.000 description 8
- 101000760620 Homo sapiens Cell adhesion molecule 1 Proteins 0.000 description 8
- 108010055215 Syndecan-4 Proteins 0.000 description 8
- 108020001507 fusion proteins Proteins 0.000 description 8
- 102000037865 fusion proteins Human genes 0.000 description 8
- 239000003446 ligand Substances 0.000 description 8
- 230000012743 protein tagging Effects 0.000 description 8
- 102000000011 Syndecan-4 Human genes 0.000 description 7
- 201000005202 lung cancer Diseases 0.000 description 7
- 208000020816 lung neoplasm Diseases 0.000 description 7
- 102000005962 receptors Human genes 0.000 description 7
- 108020003175 receptors Proteins 0.000 description 7
- 208000011580 syndromic disease Diseases 0.000 description 7
- 102400000058 Neuregulin-1 Human genes 0.000 description 6
- 108091005804 Peptidases Proteins 0.000 description 6
- 102000035195 Peptidases Human genes 0.000 description 6
- 108010087132 Sodium-Bicarbonate Symporters Proteins 0.000 description 6
- 210000002919 epithelial cell Anatomy 0.000 description 6
- 210000000981 epithelium Anatomy 0.000 description 6
- -1 CSMD1 Proteins 0.000 description 5
- 102100021474 Electrogenic sodium bicarbonate cotransporter 1 Human genes 0.000 description 5
- 101100405240 Homo sapiens NRG1 gene Proteins 0.000 description 5
- 108091006315 Na+/HCO3 − co-transport proteins Proteins 0.000 description 5
- 102000005917 R-SNARE Proteins Human genes 0.000 description 5
- 108010005730 R-SNARE Proteins Proteins 0.000 description 5
- 108010079206 V-Set Domain-Containing T-Cell Activation Inhibitor 1 Proteins 0.000 description 5
- 239000012190 activator Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 108010028930 invariant chain Proteins 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 210000004379 membrane Anatomy 0.000 description 5
- 101710151993 Amyloid-beta precursor protein Proteins 0.000 description 4
- 101000823051 Homo sapiens Amyloid-beta precursor protein Proteins 0.000 description 4
- 101000984015 Homo sapiens Cadherin-1 Proteins 0.000 description 4
- 101000821968 Homo sapiens Electrogenic sodium bicarbonate cotransporter 1 Proteins 0.000 description 4
- 101001109800 Homo sapiens Pro-neuregulin-1, membrane-bound isoform Proteins 0.000 description 4
- 101800002648 Neuregulin-1 Proteins 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- 150000004676 glycans Chemical class 0.000 description 4
- 229920001282 polysaccharide Polymers 0.000 description 4
- 239000005017 polysaccharide Substances 0.000 description 4
- 108010014677 transcription factor TFIIE Proteins 0.000 description 4
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 4
- 101150079978 AGRN gene Proteins 0.000 description 3
- 102100027447 ATP-dependent DNA helicase Q1 Human genes 0.000 description 3
- 108700019743 Agrin Proteins 0.000 description 3
- 208000024827 Alzheimer disease Diseases 0.000 description 3
- 101710137189 Amyloid-beta A4 protein Proteins 0.000 description 3
- 102000001301 EGF receptor Human genes 0.000 description 3
- 101800003838 Epidermal growth factor Proteins 0.000 description 3
- 101000577199 Homo sapiens Neurogenic locus notch homolog protein 2 Proteins 0.000 description 3
- 108060003951 Immunoglobulin Proteins 0.000 description 3
- 108091054455 MAP kinase family Proteins 0.000 description 3
- 102000043136 MAP kinase family Human genes 0.000 description 3
- 102100033237 Pro-epidermal growth factor Human genes 0.000 description 3
- 101710100963 Receptor tyrosine-protein kinase erbB-4 Proteins 0.000 description 3
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 3
- 230000001594 aberrant effect Effects 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 229940116977 epidermal growth factor Drugs 0.000 description 3
- 239000003102 growth factor Substances 0.000 description 3
- 102000018358 immunoglobulin Human genes 0.000 description 3
- 235000019419 proteases Nutrition 0.000 description 3
- 239000011701 zinc Substances 0.000 description 3
- 229910052725 zinc Inorganic materials 0.000 description 3
- 108010079054 Amyloid beta-Protein Precursor Proteins 0.000 description 2
- BHPQYMZQTOCNFJ-UHFFFAOYSA-N Calcium cation Chemical compound [Ca+2] BHPQYMZQTOCNFJ-UHFFFAOYSA-N 0.000 description 2
- 208000005623 Carcinogenesis Diseases 0.000 description 2
- 102000016289 Cell Adhesion Molecules Human genes 0.000 description 2
- 108010067225 Cell Adhesion Molecules Proteins 0.000 description 2
- 108010059480 Chondroitin Sulfate Proteoglycans Proteins 0.000 description 2
- 102000005598 Chondroitin Sulfate Proteoglycans Human genes 0.000 description 2
- 206010010356 Congenital anomaly Diseases 0.000 description 2
- 108060006698 EGF receptor Proteins 0.000 description 2
- 102000056372 ErbB-3 Receptor Human genes 0.000 description 2
- 102100027618 Heme transporter HRG1 Human genes 0.000 description 2
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 2
- 101000580659 Homo sapiens ATP-dependent DNA helicase Q1 Proteins 0.000 description 2
- 101001081412 Homo sapiens Heme transporter HRG1 Proteins 0.000 description 2
- 101001050318 Homo sapiens Junctional adhesion molecule-like Proteins 0.000 description 2
- 102100023437 Junctional adhesion molecule-like Human genes 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- 102000007547 Laminin Human genes 0.000 description 2
- 108010085895 Laminin Proteins 0.000 description 2
- 206010028372 Muscular weakness Diseases 0.000 description 2
- 102000005650 Notch Receptors Human genes 0.000 description 2
- 108010070047 Notch Receptors Proteins 0.000 description 2
- 102000004022 Protein-Tyrosine Kinases Human genes 0.000 description 2
- 108090000412 Protein-Tyrosine Kinases Proteins 0.000 description 2
- 102000009572 RNA Polymerase II Human genes 0.000 description 2
- 108010009460 RNA Polymerase II Proteins 0.000 description 2
- 101001081402 Rattus norvegicus Histidine-rich glycoprotein Proteins 0.000 description 2
- 101710117522 Vesicle-associated membrane protein-associated protein B Proteins 0.000 description 2
- 108010007135 Werner Syndrome Helicase Proteins 0.000 description 2
- 101710151672 Zinc finger protein ZFAT Proteins 0.000 description 2
- 239000000853 adhesive Substances 0.000 description 2
- 230000001070 adhesive effect Effects 0.000 description 2
- 230000033115 angiogenesis Effects 0.000 description 2
- 230000005775 apoptotic pathway Effects 0.000 description 2
- 230000006907 apoptotic process Effects 0.000 description 2
- 101150031224 app gene Proteins 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 229910001424 calcium ion Inorganic materials 0.000 description 2
- 230000036952 cancer formation Effects 0.000 description 2
- 231100000504 carcinogenesis Toxicity 0.000 description 2
- 208000006990 cholangiocarcinoma Diseases 0.000 description 2
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 2
- 238000006471 dimerization reaction Methods 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 210000004475 gamma-delta t lymphocyte Anatomy 0.000 description 2
- 229920000669 heparin Polymers 0.000 description 2
- 229960002897 heparin Drugs 0.000 description 2
- 239000000833 heterodimer Substances 0.000 description 2
- 238000005734 heterodimerization reaction Methods 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 201000005249 lung adenocarcinoma Diseases 0.000 description 2
- 239000003226 mitogen Substances 0.000 description 2
- 210000002161 motor neuron Anatomy 0.000 description 2
- 235000019833 protease Nutrition 0.000 description 2
- 230000001953 sensory effect Effects 0.000 description 2
- 210000001044 sensory neuron Anatomy 0.000 description 2
- 210000001258 synovial membrane Anatomy 0.000 description 2
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 2
- FIXDIFPJOFIIEC-RITPCOANSA-N (3r)-3-hydroxy-n-[(3s)-2-oxooxolan-3-yl]butanamide Chemical compound C[C@@H](O)CC(=O)N[C@H]1CCOC1=O FIXDIFPJOFIIEC-RITPCOANSA-N 0.000 description 1
- PFBJLTUOBQDXKF-UHFFFAOYSA-N (4-nitrophenyl)methyl n-[2-chloroethyl(methylsulfonyl)amino]-n-methylsulfonylcarbamate Chemical compound ClCCN(S(=O)(=O)C)N(S(C)(=O)=O)C(=O)OCC1=CC=C([N+]([O-])=O)C=C1 PFBJLTUOBQDXKF-UHFFFAOYSA-N 0.000 description 1
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 1
- 108010090849 Amyloid beta-Peptides Proteins 0.000 description 1
- 102000013455 Amyloid beta-Peptides Human genes 0.000 description 1
- 101100127672 Arabidopsis thaliana LAZY2 gene Proteins 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 101710140787 Aspartyl/asparaginyl beta-hydroxylase Proteins 0.000 description 1
- 101150109753 Asph gene Proteins 0.000 description 1
- 206010003805 Autism Diseases 0.000 description 1
- 208000020706 Autistic disease Diseases 0.000 description 1
- 102100035631 Bloom syndrome protein Human genes 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- CIUUIPMOFZIWIZ-UHFFFAOYSA-N Bropirimine Chemical compound NC1=NC(O)=C(Br)C(C=2C=CC=CC=2)=N1 CIUUIPMOFZIWIZ-UHFFFAOYSA-N 0.000 description 1
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 1
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 1
- 101150017002 CD44 gene Proteins 0.000 description 1
- 101100537937 Caenorhabditis elegans arc-1 gene Proteins 0.000 description 1
- 101100314454 Caenorhabditis elegans tra-1 gene Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 102100024646 Cell adhesion molecule 2 Human genes 0.000 description 1
- 101710197434 Cell adhesion molecule 2 Proteins 0.000 description 1
- 102000012432 Collagen Type V Human genes 0.000 description 1
- 108010022514 Collagen Type V Proteins 0.000 description 1
- 208000004117 Congenital Myasthenic Syndromes Diseases 0.000 description 1
- 102000010970 Connexin Human genes 0.000 description 1
- 108050001175 Connexin Proteins 0.000 description 1
- 241000709687 Coxsackievirus Species 0.000 description 1
- 101710176411 Coxsackievirus and adenovirus receptor Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 108090000133 DNA helicases Proteins 0.000 description 1
- 101100516503 Danio rerio neurog1 gene Proteins 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 102100037713 Down syndrome cell adhesion molecule Human genes 0.000 description 1
- 101100224659 Drosophila melanogaster Dscam2 gene Proteins 0.000 description 1
- 101150083953 Dscaml1 gene Proteins 0.000 description 1
- 101710150629 Dynein light chain Tctex-type 1 Proteins 0.000 description 1
- 206010013886 Dysaesthesia Diseases 0.000 description 1
- 101150039808 Egfr gene Proteins 0.000 description 1
- 101710139512 Electrogenic sodium bicarbonate cotransporter 1 Proteins 0.000 description 1
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 1
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 1
- 102000008946 Fibrinogen Human genes 0.000 description 1
- 108010049003 Fibrinogen Proteins 0.000 description 1
- 102000016359 Fibronectins Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 206010016845 Foetal alcohol syndrome Diseases 0.000 description 1
- 206010016946 Food allergy Diseases 0.000 description 1
- 102000004130 Fusion Regulatory Protein-1 Human genes 0.000 description 1
- 108010057784 Fusion Regulatory Protein-1 Proteins 0.000 description 1
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 1
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 1
- 208000022072 Gallbladder Neoplasms Diseases 0.000 description 1
- 102100032863 General transcription factor IIH subunit 3 Human genes 0.000 description 1
- 102100033299 Glia-derived nexin Human genes 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 229920002683 Glycosaminoglycan Polymers 0.000 description 1
- 102000006354 HLA-DR Antigens Human genes 0.000 description 1
- 108010058597 HLA-DR Antigens Proteins 0.000 description 1
- 208000006342 Hajdu-Cheney syndrome Diseases 0.000 description 1
- 108090000100 Hepatocyte Growth Factor Proteins 0.000 description 1
- 102100021866 Hepatocyte growth factor Human genes 0.000 description 1
- 241000405147 Hermes Species 0.000 description 1
- 108010027412 Histocompatibility Antigens Class II Proteins 0.000 description 1
- 102000018713 Histocompatibility Antigens Class II Human genes 0.000 description 1
- 101000803270 Homo sapiens Bloom syndrome protein Proteins 0.000 description 1
- 101100219375 Homo sapiens CADM1 gene Proteins 0.000 description 1
- 101100382253 Homo sapiens CDH1 gene Proteins 0.000 description 1
- 101100169494 Homo sapiens DAAM1 gene Proteins 0.000 description 1
- 101100224657 Homo sapiens DSCAML1 gene Proteins 0.000 description 1
- 101000880945 Homo sapiens Down syndrome cell adhesion molecule Proteins 0.000 description 1
- 101500025419 Homo sapiens Epidermal growth factor Proteins 0.000 description 1
- 101000851181 Homo sapiens Epidermal growth factor receptor Proteins 0.000 description 1
- 101000666405 Homo sapiens General transcription factor IIH subunit 1 Proteins 0.000 description 1
- 101000655398 Homo sapiens General transcription factor IIH subunit 2 Proteins 0.000 description 1
- 101000655391 Homo sapiens General transcription factor IIH subunit 3 Proteins 0.000 description 1
- 101000655406 Homo sapiens General transcription factor IIH subunit 4 Proteins 0.000 description 1
- 101000655402 Homo sapiens General transcription factor IIH subunit 5 Proteins 0.000 description 1
- 101000997803 Homo sapiens Glia-derived nexin Proteins 0.000 description 1
- 101000605020 Homo sapiens Large neutral amino acids transporter small subunit 1 Proteins 0.000 description 1
- 101001054921 Homo sapiens Lymphatic vessel endothelial hyaluronic acid receptor 1 Proteins 0.000 description 1
- 101000800133 Homo sapiens Thyroglobulin Proteins 0.000 description 1
- 101100321437 Homo sapiens ZFAT gene Proteins 0.000 description 1
- 241000725303 Human immunodeficiency virus Species 0.000 description 1
- 206010021118 Hypotonia Diseases 0.000 description 1
- 108010042653 IgA receptor Proteins 0.000 description 1
- 102100022337 Integrin alpha-V Human genes 0.000 description 1
- 101710123022 Integrin alpha-V Proteins 0.000 description 1
- 102000012355 Integrin beta1 Human genes 0.000 description 1
- 108010022222 Integrin beta1 Proteins 0.000 description 1
- 102100031607 Kunitz-type protease inhibitor 1 Human genes 0.000 description 1
- 101710165137 Kunitz-type protease inhibitor 1 Proteins 0.000 description 1
- 108010092694 L-Selectin Proteins 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- 102100033467 L-selectin Human genes 0.000 description 1
- 102100026849 Lymphatic vessel endothelial hyaluronic acid receptor 1 Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 101100219376 Mus musculus Cadm1 gene Proteins 0.000 description 1
- 101100364400 Mus musculus Rtn4r gene Proteins 0.000 description 1
- 208000010428 Muscle Weakness Diseases 0.000 description 1
- 208000009525 Myocarditis Diseases 0.000 description 1
- 101150017173 NOTCH2 gene Proteins 0.000 description 1
- 108700037064 Neurogenic locus notch homolog protein 2 Proteins 0.000 description 1
- 102100023206 Neuromodulin Human genes 0.000 description 1
- 101710144282 Neuromodulin Proteins 0.000 description 1
- 208000000160 Olfactory Esthesioneuroblastoma Diseases 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 201000005945 Peters plus syndrome Diseases 0.000 description 1
- 108090000430 Phosphatidylinositol 3-kinases Proteins 0.000 description 1
- 102000003993 Phosphatidylinositol 3-kinases Human genes 0.000 description 1
- 102100034014 Prolyl 3-hydroxylase 3 Human genes 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 102000017975 Protein C Human genes 0.000 description 1
- 108091008611 Protein Kinase B Proteins 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 102000002067 Protein Subunits Human genes 0.000 description 1
- 102000016611 Proteoglycans Human genes 0.000 description 1
- 108010067787 Proteoglycans Proteins 0.000 description 1
- 102100033135 RNA-binding protein with multiple splicing Human genes 0.000 description 1
- 101710140071 RNA-binding protein with multiple splicing Proteins 0.000 description 1
- 102000004278 Receptor Protein-Tyrosine Kinases Human genes 0.000 description 1
- 108090000873 Receptor Protein-Tyrosine Kinases Proteins 0.000 description 1
- 102000018779 Replication Protein C Human genes 0.000 description 1
- 108010027647 Replication Protein C Proteins 0.000 description 1
- 101000937826 Rhodococcus erythropolis Barbiturase Proteins 0.000 description 1
- 102100039474 Ribonuclease H2 subunit B Human genes 0.000 description 1
- 101150095449 SDC4 gene Proteins 0.000 description 1
- 108091006207 SLC-Transporter Proteins 0.000 description 1
- 102000037054 SLC-Transporter Human genes 0.000 description 1
- 108091006261 SLC4A5 Proteins 0.000 description 1
- 101100516512 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) NGR1 gene Proteins 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 101100193368 Schizosaccharomyces pombe (strain 972 / ATCC 24843) pgp1 gene Proteins 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- 229940122055 Serine protease inhibitor Drugs 0.000 description 1
- 101710102218 Serine protease inhibitor Proteins 0.000 description 1
- 101150026500 Slc4a4 gene Proteins 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 210000000662 T-lymphocyte subset Anatomy 0.000 description 1
- 108010046722 Thrombospondin 1 Proteins 0.000 description 1
- 201000007023 Thrombotic Thrombocytopenic Purpura Diseases 0.000 description 1
- 102100033504 Thyroglobulin Human genes 0.000 description 1
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 1
- 108010040002 Tumor Suppressor Proteins Proteins 0.000 description 1
- 206010064390 Tumour invasion Diseases 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 1
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- 101710121873 Werner syndrome ATP-dependent helicase homolog Proteins 0.000 description 1
- 101150004834 Wrn gene Proteins 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 235000001014 amino acid Nutrition 0.000 description 1
- 229940024606 amino acid Drugs 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 108010064397 amyloid beta-protein (1-40) Proteins 0.000 description 1
- 108010064539 amyloid beta-protein (1-42) Proteins 0.000 description 1
- 230000019552 anatomical structure morphogenesis Effects 0.000 description 1
- 235000021120 animal protein Nutrition 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 208000010928 autoimmune thyroid disease Diseases 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008499 blood brain barrier function Effects 0.000 description 1
- 210000001218 blood-brain barrier Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 102000021115 calcium ion binding proteins Human genes 0.000 description 1
- 108091011132 calcium ion binding proteins Proteins 0.000 description 1
- 230000009400 cancer invasion Effects 0.000 description 1
- 239000012830 cancer therapeutic Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000012292 cell migration Effects 0.000 description 1
- 230000005754 cellular signaling Effects 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000010228 ex vivo assay Methods 0.000 description 1
- 210000002744 extracellular matrix Anatomy 0.000 description 1
- 208000026934 fetal alcohol spectrum disease Diseases 0.000 description 1
- 201000007794 fetal alcohol syndrome Diseases 0.000 description 1
- 229940012952 fibrinogen Drugs 0.000 description 1
- 201000005318 fish allergy Diseases 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 201000010536 head and neck cancer Diseases 0.000 description 1
- 208000014829 head and neck neoplasm Diseases 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 230000021158 homophilic cell adhesion Effects 0.000 description 1
- 229940116978 human epidermal growth factor Drugs 0.000 description 1
- 206010021198 ichthyosis Diseases 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 108010069264 keratinocyte CD44 Proteins 0.000 description 1
- 206010023332 keratitis Diseases 0.000 description 1
- 201000010666 keratoconjunctivitis Diseases 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 210000005075 mammary gland Anatomy 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 102000006240 membrane receptors Human genes 0.000 description 1
- 108020004084 membrane receptors Proteins 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 230000001394 metastastic effect Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- NKAAEMMYHLFEFN-UHFFFAOYSA-M monosodium tartrate Chemical compound [Na+].OC(=O)C(O)C(O)C([O-])=O NKAAEMMYHLFEFN-UHFFFAOYSA-M 0.000 description 1
- 230000000921 morphogenic effect Effects 0.000 description 1
- 210000000472 morula Anatomy 0.000 description 1
- 230000036640 muscle relaxation Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000036473 myasthenia Effects 0.000 description 1
- 230000009826 neoplastic cell growth Effects 0.000 description 1
- GVUGOAYIVIDWIO-UFWWTJHBSA-N nepidermin Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CS)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CS)NC(=O)[C@H](C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C(C)C)C(C)C)C1=CC=C(O)C=C1 GVUGOAYIVIDWIO-UFWWTJHBSA-N 0.000 description 1
- 230000001272 neurogenic effect Effects 0.000 description 1
- 210000000715 neuromuscular junction Anatomy 0.000 description 1
- 230000020870 neuromuscular junction development Effects 0.000 description 1
- 239000002858 neurotransmitter agent Substances 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 201000008859 olfactory neuroblastoma Diseases 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 208000035824 paresthesia Diseases 0.000 description 1
- 230000004983 pleiotropic effect Effects 0.000 description 1
- 238000010837 poor prognosis Methods 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000003518 presynaptic effect Effects 0.000 description 1
- 230000003651 pro-proliferative effect Effects 0.000 description 1
- 230000001686 pro-survival effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 150000003180 prostaglandins Chemical class 0.000 description 1
- 229940121649 protein inhibitor Drugs 0.000 description 1
- 239000012268 protein inhibitor Substances 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000003001 serine protease inhibitor Substances 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 108010093841 spermadhesin Proteins 0.000 description 1
- DUYSYHSSBDVJSM-KRWOKUGFSA-N sphingosine 1-phosphate Chemical compound CCCCCCCCCCCCC\C=C\[C@@H](O)[C@@H](N)COP(O)(O)=O DUYSYHSSBDVJSM-KRWOKUGFSA-N 0.000 description 1
- 208000010110 spontaneous platelet aggregation Diseases 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000002381 testicular Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 210000001578 tight junction Anatomy 0.000 description 1
- 230000017423 tissue regeneration Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000011820 transgenic animal model Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 102000035160 transmembrane proteins Human genes 0.000 description 1
- 108091005703 transmembrane proteins Proteins 0.000 description 1
- 102000027257 transmembrane receptors Human genes 0.000 description 1
- 108091008578 transmembrane receptors Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 101150117636 vapB gene Proteins 0.000 description 1
- NWONKYPBYAMBJT-UHFFFAOYSA-L zinc sulfate Chemical compound [Zn+2].[O-]S([O-])(=O)=O NWONKYPBYAMBJT-UHFFFAOYSA-L 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Hospice & Palliative Care (AREA)
- Biophysics (AREA)
- Oncology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
本公开涉及神经调节蛋白1(NRG1)融合物、检测这类融合物的方法、鉴定或诊断具有这类融合物的患者的方法、以及治疗包含NRG1融合物的癌症、肿瘤或异常细胞的方法的领域。此外,本公开涉及用于治疗患有包含NRG1融合物的ErbB‑2/ErbB‑3阳性癌症的受试者的治疗性(人类)化合物的领域。
Description
技术领域
本公开涉及神经调节蛋白1(NRG1)融合物的领域、检测该融合物的方法、鉴定或诊断具有该融合物的患者的方法、以及治疗包含NRG1融合物的癌症、肿瘤或异常细胞的方法。此外,本公开涉及用于治疗患有包含NRG1融合物的ErbB-2/ErbB-3阳性癌症的受试者的治疗性(人类)化合物的领域。
背景技术
跨膜NRG1同种型的胞外结构域的蛋白分解处理会释放可溶性因子。HRG1-β1是由NRG1基因编码的蛋白质之一。NRG1含有Ig结构域和EGF样结构域,该EGF样结构域对于直接结合至受体酪氨酸激酶ErbB-3和ErbB-4是必要的。NRG1基因和同种型已知有许多不同的别名,诸如:神经调节蛋白1(Neuregulin 1);Pro-NRG1;HRGA;SMDF;HGL;GGF;NDF;NRG1内切转录2(Intronic Transcript 2,不编码蛋白质);Heregulin,α(45kD,ERBB2P185-活化子);乙酰胆碱受体诱导活性(Acetylcholine Receptor-Inducing Activity);原神经调节蛋白-1(Pro-Neuregulin-1),其是膜结合同种型;感觉和运动神经元衍生因子;新分化因子(NeuDifferentiation Factor);神经胶质生长因子2;NRG1-IT2;MSTP131;MST131;ARIA;GGF2;HRG1;和HRG。NRG1基因的外部Id为HGNC:7997;Entrez Gene:3084;Ensembl:ENSG00000157168;OMIM:142445及UniProtKB:Q02297。
NRG1同种型是通过选择性剪接制造,且包括跨膜、外部膜结合、脱落(shed)、分泌或胞内形式(Falls,Exp Cell Res 284:14-30,2003;Hayes和Gullick,J.Mammary GlandBiol Neoplasia13:205-214,2008)。它们结合至ErbB-3或ErbB-4,这可理解为促进与ErbB-2(HER2)形成异源二聚体。虽然通常将NRG1编码蛋白视为有丝分裂原(mitogen),但其也可强力促进细胞凋亡:特别是在细胞中表达NRG1可造成该表达细胞的细胞凋亡(参见Weinstein等人,oncogene17:2107-2113,1998)。
鉴于各种不同具有NRG1融合物的肿瘤类型,基于新的融合配偶体以及NRG1与融合配偶体之间的新的断点,需要有更快且更稳健的诊断方法,且需要鉴定前所未知的NRG融合物的方法。
发明内容
本公开一般地提供了涉及NRG1和新型融合配偶体的融合物,以及由其所编码的多肽融合物。本公开提供了涉及NRG1和VAPB、NRG1和PVALB、NRG1和DAAM1、NRG1和ASPH、NRG1和ZFAT或者NRG1和DSCAML1作为新型融合配偶体的融合物,在此分别通常指VAPB-NRG1、PVALB-NRG1、DAAM1-NRG1、ASPH-NRG1、ZFAT-NRG1和DSCAML1-NRG1。更特别的是,本公开的该方面涉及:
包含与NRG1核酸序列或NRG1核酸序列的一部分融合的VAPB核酸序列或VAPB核酸序列的一部分的多核苷酸,或
包含与NRG1核酸序列或NRG1核酸序列的一部分融合的PVALB核酸序列或PVALB核酸序列的一部分的多核苷酸,或
包含与NRG1核酸序列或NRG1核酸序列的一部分融合的DAAM1核酸序列或DAAM1核酸序列的一部分的多核苷酸,或
包含与NRG1核酸序列或NRG1核酸序列的一部分融合的ASPH核酸序列或ASPH核酸序列的一部分的多核苷酸,或
包含与NRG1核酸序列或NRG1核酸序列的一部分融合的ZFAT核酸序列或ZFAT核酸序列的一部分的多核苷酸,或
包含与NRG1核酸序列或NRG1核酸序列的一部分融合的DSCAML1核酸序列或DSCAML1核酸序列的一部分的多核苷酸。
优选地,该VAPB核酸序列包含序列SEQ ID NO:17-23中的任一者或SEQ ID NO:17-23中的任一者的等位基因变体(的一部分)或由其组成。优选地,该NRG1核酸序列包含序列SEQ ID NO:125-138中的任一者或序列SEQ ID NO:125-138中的任一者的等位基因变体(的一部分)或由其组成。
替代性地或另外地,本公开提供一种包含VAPB的外显子1或外显子1的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地,VAPB的外显子1包含SEQ ID NO:17或由其组成,且其等位基因变体优选为SEQ ID NO:17的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成,且其等位基因变体优选为SEQID NO:126的变体。
优选地,该PVALB核酸序列包含序列SEQ ID NO:439-444中的任一者或SEQ ID NO:439-444中的任一者的等位基因变体(的一部分)或由其组成。优选地,该NRG1核酸序列包含序列SEQ ID NO:125-138中的任一者或序列SEQ ID NO:125-138中的任一者的等位基因变体(的一部分)或由其组成。
替代性地或另外地,本公开提供一种包含PVALB的外显子4或外显子4的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地,PVALB的外显子4包含SEQ ID NO:422或由其组成,且其等位基因变体优选为SEQ IDNO:422的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成,且其等位基因变体优选为SEQ ID NO:130的变体。
优选地,该DAAM1核酸序列包含序列SEQ ID NO:606-631中的任一者或SEQ ID NO:606-631中的任一者的等位基因变体(的一部分)或由其组成。优选地,该NRG1核酸序列包含序列SEQ ID NO:125-138中的任一者或序列SEQ ID NO:125-138中的任一者的等位基因变体(的一部分)或由其组成。
替代性地或另外地,本公开提供一种包含DAAM1的外显子1或外显子1的等位基因变体的一部分且其与NRG1的外显子1或外显子1的等位基因变体的一部分融合的多核苷酸。优选地,DAAM1的外显子1包含SEQ ID NO:606或由其组成,且其等位基因变体优选为SEQ IDNO:606的变体。NRG1的外显子1包含SEQ ID NO:125或由其组成,且其等位基因变体优选为SEQ ID NO:125的变体。
优选地,该ASPH核酸序列包含序列SEQ ID NO:637-662中的任一者或SEQ ID NO:637-662中的任一者的等位基因变体(的一部分)或由其组成。优选地,该NRG1核酸序列包含序列SEQ ID NO:125-138中的任一者或序列SEQ ID NO:125-138中的任一者的等位基因变体(的一部分)或由其组成。
替代性地或另外地,本公开提供一种包含ASPH的外显子22或外显子22的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地,ASPH的外显子22包含SEQ ID NO:658或由其组成,且其等位基因变体优选为SEQ IDNO:658的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成,且其等位基因变体优选为SEQ ID NO:126的变体。
优选地,该ZFAT核酸序列包含序列SEQ ID NO:830-846中的任一者或SEQ ID NO:830-846中的任一者的等位基因变体(的一部分)或由其组成。优选地,该NRG1核酸序列包含序列SEQ ID NO:125-138中的任一者或序列SEQ ID NO:125-138中的任一者的等位基因变体(的一部分)或由其组成。
替代性地或另外地,本公开提供一种包含ZFAT的外显子12或外显子12的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地,ZFAT的外显子12包含SEQ ID NO:841或由其组成,且其等位基因变体优选为SEQ IDNO:841的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成,且其等位基因变体优选为SEQ ID NO:130的变体。
优选地,该DSCAML1核酸序列包含序列SEQ ID NO:870-903中的任一者或SEQ IDNO:870-903中的任一者的等位基因变体(的一部分)或由其组成。优选地,该NRG1核酸序列包含序列SEQ ID NO:125-138中的任一者或序列SEQ ID NO:125-138中的任一者的等位基因变体(的一部分)或由其组成。
替代性地或另外地,本公开提供一种包含DSCAML1的外显子3或外显子3的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地,DSCAML1的外显子3包含SEQ ID NO:872或由其组成,且其等位基因变体优选为SEQ ID NO:872的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成,且其等位基因变体优选为SEQ ID NO:126的变体。
此外,本公开提供涉及具有先前未经公开的融合接点(fusion junctions)的NRG1的融合物,以及由其所编码的多肽融合物。特别地,本公开另外提供涉及NRG1与CADM1的融合物,在此一般来说指的是CADM1-NRG1。本公开也提供涉及NRG1与CD44的融合物,在此一般来说指的是CD44-NRG1。本公开也提供涉及NRG1与SLC3A2的融合物,在此一般来说指的是SLC3A2-NRG1。本公开也提供涉及NRG1与VTCN1的融合物,在此一般来说指的是VTCN1-NRG1。本公开也提供涉及NRG1与CDH1的融合物,在此一般来说指的是CDH1-NRG1。本公开也提供涉及NRG1与CXADR的融合物,在此一般来说指的是CXADR-NRG1。本公开也提供涉及NRG1与GTF2E2的融合物,在此一般来说指的是GTF2E2-NRG1。本公开也提供涉及NRG1与CSMD1的融合物,在此一般来说指的是CSMD1-NRG1。本公开也提供涉及NRG1与PTN的融合物,在此一般来说指的是PTN-NRG1。本公开也提供涉及NRG1与ST14的融合物,在此一般来说指的是ST14-NRG1。本公开也提供涉及NRG1与THBS1的融合物,在此一般来说指的是THBS1-NRG1。本公开也提供涉及NRG1与AGRN的融合物,在此一般来说指的是AGRN-NRG1。本公开也提供涉及NRG1与APP的融合物,在此一般来说指的是APP-NRG1。本公开也提供涉及NRG1与WRN的融合物,在此一般来说指的是WRN-NRG1。本公开也提供涉及NRG1与NRG1的融合物,在此一般来说指的是NRG1-NRG1。本公开也提供涉及NRG1与NOTCH2的融合物,在此一般来说指的是NOTCH2-NRG1。本公开也提供涉及NRG1与CD74的融合物,在此一般来说指的是CD74-NRG1。本公开也提供涉及NRG1与SDC4的融合物,在此一般来说指的是SDC4-NRG1。本公开也提供涉及NRG1与SLC4A4的融合物,在此一般来说指的是SLC4A4-NRG1。
本公开提供以下新型融合接点。特别地,本公开提供一种包含CADM1的外显子7或外显子7的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地,CADM1的外显子7包含SEQ ID NO:39或由其组成,且其等位基因变体优选为SEQ ID NO:39的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成,且其等位基因变体优选为SEQ ID NO:130的变体。
特别地,本公开提供一种包含CD44的外显子5或外显子5的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地,CD44的外显子5包含SEQ ID NO:65或由其组成,且其等位基因变体优选为SEQ ID NO:65的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成,且其等位基因变体优选为SEQ ID NO:126的变体。
特别地,本公开提供一种包含CD44的外显子5或外显子5的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地,CD44的外显子5包含SEQ ID NO:65或由其组成,且其等位基因变体优选为SEQ ID NO:65的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成,且其等位基因变体优选为SEQ ID NO:130的变体。
特别地,本公开提供一种包含SLC3A2的转录本6的外显子1或转录本6的外显子1的等位基因变体的一部分且其与NRG1的外显子5或外显子2的等位基因变体的一部分融合的多核苷酸。优选地,所述SLC3A2的外显子包含SEQ ID NO:103或由其组成,且其等位基因变体优选为SEQ ID NO:103的变体。NRG1的外显子5包含SEQ ID NO:129或由其组成,且其等位基因变体优选为SEQ ID NO:129的变体。
特别地,本公开提供一种包含VTCN1的外显子2或外显子2的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地,VTCN1的外显子2包含SEQ ID NO:169或由其组成,且其等位基因变体优选为SEQ ID NO:169的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成,且其等位基因变体优选为SEQ IDNO:126的变体。
特别地,本公开提供一种包含CDH1的外显子11或外显子11的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地,CDH1的外显子11包含SEQ ID NO:198或由其组成,且其等位基因变体优选为SEQ ID NO:198的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成,且其等位基因变体优选为SEQ IDNO:126的变体。
特别地,本公开提供一种包含CXADR的外显子1或外显子1的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地,CXADR的外显子1包含SEQ ID NO:219或由其组成,且其等位基因变体优选为SEQ ID NO:219的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成,且其等位基因变体优选为SEQ IDNO:126的变体。
特别地,本公开提供一种包含GTF2E2的外显子2或外显子2的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地,GTF2E2的外显子2包含SEQ ID NO:236或由其组成,且其等位基因变体优选为SEQ ID NO:236的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成,且其等位基因变体优选为SEQID NO:126的变体。
特别地,本公开提供一种包含CSMD1的外显子23或外显子23的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地,CSMD1的外显子23包含SEQ ID NO:279或由其组成,且其等位基因变体优选为SEQ ID NO:279的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成,且其等位基因变体优选为SEQID NO:130的变体。
特别地,本公开提供一种包含PTN的外显子4或外显子4的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地,PTN的外显子4包含SEQ ID NO:318或由其组成,且其等位基因变体优选为SEQ ID NO:318的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成,且其等位基因变体优选为SEQ ID NO:126的变体。
特别地,本公开提供一种包含ST14的外显子11或外显子11的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地,ST14的外显子11包含SEQ ID NO:342或由其组成,且其等位基因变体优选为SEQ ID NO:342的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成,且其等位基因变体优选为SEQ IDNO:130的变体。
特别地,本公开提供一种包含THBS1的外显子9或外显子9的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地,THBS1的外显子9包含SEQ ID NO:386或由其组成,且其等位基因变体优选为SEQ ID NO:386的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成,且其等位基因变体优选为SEQ IDNO:130的变体。
特别地,本公开提供一种包含AGRN的外显子12或外显子12的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地,AGRN的外显子12包含SEQ ID NO:416或由其组成,且其等位基因变体优选为SEQ ID NO:416的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成,且其等位基因变体优选为SEQ IDNO:130的变体。
特别地,本公开提供一种包含PVALB的外显子4或外显子4的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地,PVALB的外显子4包含SEQ ID NO:442或由其组成,且其等位基因变体优选为SEQ ID NO:442的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成,且其等位基因变体优选为SEQ IDNO:130的变体。
特别地,本公开提供一种包含SLC3A2的转录本3的外显子2或转录本3的外显子2的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地,所述SLC3A2的外显子包含SEQ ID NO:457或由其组成,且其等位基因变体优选为SEQ ID NO:457的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成,且其等位基因变体优选为SEQ ID NO:130的变体。
特别地,本公开提供一种包含APP的外显子14或外显子14的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地,APP的外显子14包含SEQ ID NO:501或由其组成,且其等位基因变体优选为SEQ ID NO:501的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成,且其等位基因变体优选为SEQ ID NO:130的变体。
特别地,本公开提供一种包含WRN的外显子33或外显子33的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地,WRN的外显子33包含SEQ ID NO:562或由其组成,且其等位基因变体优选为SEQ ID NO:562的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成,且其等位基因变体优选为SEQ ID NO:130的变体。
特别地,本公开提供一种包含NOTCH2的外显子6或外显子6的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地,NOTCH2的外显子6包含SEQ ID NO:700或由其组成,且其等位基因变体优选为SEQ ID NO:700的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成,且其等位基因变体优选为SEQID NO:130的变体。
特别地,本公开提供一种包含CD74的外显子2或外显子2的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地,CD74的外显子2包含SEQ ID NO:720或由其组成,且其等位基因变体优选为SEQ ID NO:720的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成,且其等位基因变体优选为SEQ ID NO:126的变体。
特别地,本公开提供一种包含SDC4的外显子2或外显子2的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地,SDC4的外显子2包含SEQ ID NO:746或由其组成,且其等位基因变体优选为SEQ ID NO:746的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成,且其等位基因变体优选为SEQ ID NO:126的变体。
特别地,本公开提供一种包含SDC4的外显子4或外显子4的等位基因变体的一部分且其与NRG1的外显子2或外显子2的等位基因变体的一部分融合的多核苷酸。优选地,SDC4的外显子4包含SEQ ID NO:748或由其组成,且其等位基因变体优选为SEQ ID NO:748的变体。NRG1的外显子2包含SEQ ID NO:126或由其组成,且其等位基因变体优选为SEQ ID NO:126的变体。
特别地,本公开提供一种包含SLC4A4的外显子14或外显子14的等位基因变体的一部分且其与NRG1的外显子6或外显子6的等位基因变体的一部分融合的多核苷酸。优选地,SLC4A4的外显子14包含SEQ ID NO:780或由其组成,且其等位基因变体优选为SEQ ID NO:780的变体。NRG1的外显子6包含SEQ ID NO:130或由其组成,且其等位基因变体优选为SEQID NO:130的变体。
本文所提供的NRG1融合物均已在源自患者的样本中观察到,特别是经诊断患有癌症的患者。
所公开的鉴定这些NRG1融合物及基因重排可提供用于确定NRG1多核苷酸融合物或多肽是否存在于或来自于生物样本中的新方法,用于测定NRG1多肽融合物的活性的方法,用于诊断表达NRG1多肽融合物的癌症、肿瘤或异常细胞的方法,用于测定NRG1多肽融合物的活性的方法,用于治疗表达NRG1多肽融合物的癌症、肿瘤或异常细胞的方法,和/或抑制特征在于表达NRG1多核苷酸融合物或多肽的肿瘤形成进程的方法。本公开因此也提供这些或更多个方面并详细描述于下文中。
本公开也提供由选自以下中的任一种多核苷酸融合物所编码的多肽融合物:VAPB-NRG1、CADM1-NRG1 CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1和DSCAML1-NRG1。当本公开的任一种多肽融合物被本文所提及的异常细胞表达时,其优选地也包含NRG1的EGF样结构域。当本公开的任一种多核苷酸融合物被含在本文所提及的异常细胞时,其优选地包含编码EGF样结构域的NRG1外显子,诸如NRG1的外显子6、7或8,更优选地包含NRG1多核苷酸序列的外显子6和7。
也提供一种包含本公开的多核苷酸融合物的载体、一种包含所述多核苷酸和/或所述载体的宿主细胞。也提供一种制造本公开的多肽的方法,包含将所述重组宿主细胞维持在适合该多核苷酸表达的条件下,从而表达该多核苷酸融合物且产生多肽融合物,随后分离或纯化该多肽。也提供一种制造重组宿主细胞的方法,包括将所述载体导入宿主细胞内。
也提供一种用于检测本公开的多核苷酸融合物的核酸探针、引物或引物对以及一种包含用于检测本公开的多核苷酸融合物的存在的核酸探针、引物或引物对的检测测定法。本公开的这类核酸探针、引物或引物对优选的长度为10-40个核苷酸。
也提供一种用于检测本公开的多核苷酸融合物所编码的多肽的第一抗体或第一与第二抗体组,以及包含该第一抗体或该第一与第二抗体组以用于检测本公开的多核苷酸融合物所编码的多肽的存在的检测测定法。优选地,该第一抗体与选自以下的多肽融合物结合:VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1和DSCAML1-NRG1,而该第一与第二抗体组分别与VAPB和NRG1、或CADM1和NRG1、或CD44和NRG1、或SLC3A2和NRG1、或VTCN1和NRG1、或CDH1和NRG1、或CXADR和NRG1、或GTF2E2和NRG1、或CSMD1和NRG1、或PTN和NRG1、或ST14和NRG1、或THBS1和NRG1、或AGRN和NRG1、或PVALB和NRG1、APP和NRG1、或WRN和NRG1、或ASPH和NRG1、或NOTCH2和NRG1、或CD74和NRG1、或SDC4和NRG1、或SLC4A4和NRG1、或ZFAT和NRG1、或DSCAML1和NRG1结合。
本公开包括鉴定或检测人类受试者中的NRG1融合物的方法,且进一步涵盖诊断、治疗选择和药物治疗的方法及其组合,以改善NRG1融合物相关的疾病,包括实体瘤。除此之外,本公开提供直接了断的手段或测定来快速评估受试者是否罹患或易于罹患癌症、肿瘤或异常细胞。这类NRG1融合物信息可有利作为诊断工具中的生物标志物使用。
因此,也提供一种在样本中鉴定如本文所提及的任一多核苷酸融合物、或由其所编码的多肽的方法,所述方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。
也提供一种在样本中检测如本文所提及的任一多核苷酸融合物、或由其所编码的多肽是否存在的方法,所述方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。
也提供一种确定来自受试者的异常细胞(诸如癌细胞或肿瘤细胞)是否包含本文所提及的任一多核苷酸融合物、或由其所编码的多肽的方法,所述方法包括检验获自该受试者的细胞或所述细胞的多核苷酸或多肽内容物是否在样本中存在该融合物。
也提供一种鉴定受试者携带本文所提及的多核苷酸融合物、或由其所编码的多肽的方法,所述方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。
本文所提及的样本的检验优选地为体外分析或这类方法、或离体分析或这类方法的一部分。
优选地,该受试者为哺乳动物或人类受试者,且该多核苷酸或多肽为哺乳动物或人类多核苷酸或多肽。
优选地,本文所提及的任一多核苷酸融合物和/或本文所提及的由其所编码的多肽经分离和/或纯化或者实质上分离或实质上纯化。
本公开涉及于罹患癌症或怀疑罹患癌症(特别是实体癌或实体瘤)的受试者。特别地,这类癌症为腺癌,更特别是黏液腺癌、胰脏癌,更特别是胰脏腺癌、或肾细胞癌、胆管癌、脑癌、神经胶质母细胞瘤、胆管癌、神经胶质瘤、胰管腺癌、肉瘤、膀胱癌、大肠癌、直肠癌、大肠直肠癌、胆囊癌、头颈癌、前列腺癌、子宫癌、乳癌、卵巢癌、肝癌、子宫内膜癌、肺癌,特别是非小细胞肺癌、或浸润性黏液腺癌。该癌症可为原发性癌或转移性癌。
本公开也提供一种治疗患有ErbB-2和/或ErbB-3阳性异常细胞(诸如癌症或肿瘤)的受试者的方法,所述异常细胞包含本文所提及的多核苷酸融合物,和/或这类细胞表达由其所编码的多肽融合物,所述方法包括向该受试者施用治疗量的ErbB-2和/或ErbB-3靶向剂。优选地,在施用所述靶向剂之前检测本文所提及的多核苷酸或多肽融合物。
本公开也提供一种抑制患有ErbB-2和ErbB-3阳性异常细胞的受试者进程的方法,所述异常细胞包含本文所提及的多核苷酸融合物,和/或表达由其所编码的多肽融合物,所述方法包括向该受试者施用治疗量的ErbB-2和/或ErbB-3靶向剂。优选地,在施用所述靶向剂之前检测本文所提及的多核苷酸或多肽融合物。
本公开也提供一种用于患有ErbB-2和ErbB-3阳性癌症或肿瘤的受试者的治疗中的ErbB-2和/或ErbB-3靶向剂,所述癌症或肿瘤包含本文所提及的多核苷酸融合物,和/或表达由其所编码的多肽融合物,所述治疗包含向该受试者施用治疗量的ErbB-2和/或ErbB-3靶向剂。优选地,在施用所述靶向剂之前检测本文所提及的多核苷酸或多肽融合物。
本公开也提供一种诊断携带包含本文所提及的多核苷酸融合物由其所编码的多肽的异常细胞的受试者的方法,该方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。
本公开也提供一种ErbB-2和/或ErbB-3靶向剂的治疗方法或用途,其中筛选受试者是否存有本文所提及的NGR1融合物,随后施用ErbB-2和/或ErbB-3试剂。
本公开也包括体内模型,诸如表达在其基因组内或者包含本文所提及的多核苷酸融合物的移植异常细胞的异种移植或基因转基因动物模型,和/或表达由其所编码的多肽融合物,以及使用ERB2和/或Erb3靶向剂或其他靶向剂的这类模型的治疗。优选地,该动物模型为非人类动物模型。
具体实施方式
本公开提供涉及NRG1与新型融合配偶体的融合物,以及由其所编码的多肽融合物。此外,本公开提供涉及具有先前未经公开的融合接点的NRG1的融合物,以及由其所编码的多肽融合物。
一般地,本公开提供涉及NRG1与融合配偶体的融合物,该融合配偶体选自VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1。所述融合物在本文中指VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、DAAM1-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1或DSCAML1-NRG1。存在本公开的NRG1融合物中的任一者时,无论是多核苷酸或由其翻译的多肽,都表示了异常细胞(诸如癌症或肿瘤)的存在。
NRG1
NRG1基因编码各种NRG1同种型。各种同种型及其预期功能在Adelaide等人,GenesChromosomes Cancer,Aug;37(4):333-45(2003)中进行了描述。GGF和GGF2同种型含有kringle样序列加上Ig和EGF样结构域;且SMDF同种型与其他同种型仅共享EGF样结构域。NRG1同种型的受体是酪氨酸激酶跨膜受体的ErbB家族。该家族也被称作人类表皮生长因子(EGF)受体家族(HER)。该家族有四个成员:ErbB(红血球母细胞瘤)-1、ErbB-2、ErbB-3和ErbB-4。受体(综述于Yarden和Pines,Nat Rev Cancer.2012Jul 12;12(8):553-63)广泛表达于上皮细胞上。HER受体或其配位体,诸如神经调理因子(heregulin,HRG)或表皮生长因子(EGF)的表达量上调,是人类癌症中常见的事件(Wilson,Fridlyand等人,Nature.2012Jul 26;487(7408):505-509)。ErbB-1和ErbB-2的过度表达尤其发生在上皮肿瘤中,并且与肿瘤侵袭、转移、化疗耐药性及预后不良有关(Zhang,H.,Berezov,A.,Wang,Q.,Zhang,G.,Drebin,J.,Murali,R.等人(2007)Erbb receptors:from oncogenes totargeted cancer therapies.J.Clin.Invest.,117,2051-2058)。在正常乳房中,ErbB-3已被证明在管腔上皮的生长及分化中很重要。例如,ErbB-3的丢失/抑制会导致在管腔上皮上的基底选择性扩增(Balko,Miller等人,2012PNAS January 3,2012 109(1)221-226)。配体与酪氨酸激酶受体的细胞外结构域的结合诱导了受体二聚化,两者介于相同(同源二聚化(homodimerization))和不同(异源二聚化(heterodimerization)受体亚型之间。二聚化可以活化细胞内的酪氨酸激酶结构域,使这些结构域进行自磷酸化且继而活化许多下游的促增生信号传导路径,包括由促分裂原活化蛋白激酶(MAPK)及促存活路径Akt所介导的路径(综述于Yarden和Pines,2012)。ErbB-3可以通过其配体的接合而被活化。这些配体包括但不限于神经调节蛋白(NRG)及神经调理因子(HRG),以及NRG1融合物。
各种NRG1融合基因描述于Dhanasekaran等人Nature Communications 5:5893,2014,以及Jonna等人,Clin Cancer Res August 15 2019,25(16)4966-4972。
本文所使用的术语“NRG1”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。NRG1基因及同种型已知有许多不同的别名,诸如:神经调节蛋白1(Neuregulin 1);Pro-NRG1;HRGA;SMDF;HGL;GGF;NDF;NRG1内切转录2(Intronic Transcript 2,不编码蛋白质);Heregulin,α(45kD,ERBB2 P185-活化子);乙酰胆碱受体诱导活性(Acetylcholine Receptor-Inducing Activity);原神经调节蛋白-1(Pro-Neuregulin-1),其是膜结合同种型;感觉及运动神经元衍生因子;新分化因子(Neu Differentiation Factor);神经胶质生长因子2;NRG1-IT2;MSTP131;MST131;ARIA;GGF2;HRG1以及HRG。NRG1基因的外部Id为HGNC:7997;Entrez Gene:3084;Ensembl:ENSG00000157168;OMIM:142445及UniProtKB:Q02297。为了避免疑虑,带有NRG1序列是指带有来自诸如NCBI参考序列NM_001159999.3或NM_001159999.3的等位基因变体的任何多核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。优选地,本公开的NRG1的全多核苷酸序列是根据SEQ ID NO:138转录,而经转录的NRG1多肽序列是根据SEQ ID NO:152。
优选地,该编码NRG1蛋白序列或NRG1外显子的多核苷酸融合物部分进一步包含或编码NRG1的EGF样结构域。于该融合物中的NRG1基因(例如NRG1基因的3’端)优选地包含外显子6、7或8的编码序列。此结构域是由位于NRG1基因(例如外显子6-8)3’处的部分编码,且对于结合至ErbB-3而言是必要的。NRG1融合基因优选地包含编码NRG1的EGF样结构域的核酸序列。本公开的NRG1融合物优选地在该融合物分子的3’端保有此EGF样结构域的框内编码区。EGF样结构域一般为约三十至四十个氨基酸残基长的序列,其原型发现于表皮生长因子(EGF)的序列“PMID:2288911,PMID:6334307,PMID:1522591,PMID:6607417,PMID:3282918,PMID:11498013”中。已知其以大致保守的形式存在于其他众多、主要为动物蛋白质中。EGF样结构域的共同特征是,它们发现于膜结合蛋白的细胞外结构域或已知会分泌的蛋白质中(例外:前列腺素G/H合成酶)。EGF样结构域一般包括六个半胱氨酸残基,已证明它们(在EGF中)涉及二硫化物键。主要结构为一个双链β折板(sheet),然后是一个环接到C端的短双链折板。保守半胱氨酸之间的次结构域长度不一。本公开的示例性EGF样结构域优选地是由NCBI参考序列NM_001159999.3的外显子6-8组成,更优选地由外显子6和7组成,但本公开是有关于NRG1的任何功能性EGF样结构域。NRG1的EGF样结构域因此优选地包含示例性序列HLVKCAEKEKTF CVNGGECFMVKDLSNPSRYLCKCPNEFTGDRCQNYVMASF(SEQ ID:163),或与其具有至少85%一致性、或与其具有至少90%、92%、94%、95%、96%或甚至至少98%一致性的等位基因变体。
本公开的任一NRG1融合多核苷酸优选地至少包含VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的5’部分以作为融合配偶体,以与NRG1核酸序列的3’部分融合。经翻译的多肽融合物包含该NRG1融合多肽的游离C端以及该融合配偶体的游离N端。为了在分子融合物水平反应出此倾向,先提及NRG1的任一融合配偶体,接着是作为其融合配偶体的NRG1。
VAPB
VAPB或囊泡相关膜蛋白的相关蛋白B/C已知有许多不同名称,诸如VAMP相关蛋白B和C;VAMP(囊泡相关膜蛋白)相关蛋白B和C;VAP-B;VAPB;ALS8;VAMP相关33KDa蛋白;VAMP相关蛋白B/C;VAMP-B/VAMP-C;VAP-B/VAP-C;VAMP-B和VAP-C。VAPB基因的外部Id为HGNC:12649;Entrez Gene:9217;Ensembl:ENSG00000124164;OMIM:605704;以及UniProtKB:O95292。本文所使用的术语“VAPB”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有VAPB序列是指带有来自诸如NCBI参考序列NM_004738.4或其任一等位基因变体的任何多核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
CADM1
CADM1或细胞黏附分子1已知有许多不同的名称,诸如肺癌肿瘤抑制因子1;TSLC1;TSLC-1;生精免疫球蛋白超家族;SgIgSF;SgIGSF;免疫球蛋白超家族成员4;IGSF4;IgSF4;IGSF4A;突触细胞黏附分子;SynCAM1;SYNCAM1;SynCAM;SYNCAM;Nectin样蛋白2;NECL2;NECL-2;Nectin样2;Necl-2;RA175;ST17;BL2;免疫球蛋白超家族的成员4D变体1;免疫球蛋白超家族的成员4D变体2;免疫球蛋白超家族的成员4;TSLC1/Nectin样2/IGSF4;截断的CADM1蛋白1及STSLC-1。CADM1的外部Id为HGNC:5951;Entrez Gene:23705;Ensembl:ENSG00000182985;OMIM:605686;以及UniProtKB:Q9BY67。本文所使用的术语“CADM1”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有CADM1序列是指带有来自诸如NCBI参考序列NM_001301045.1或其任一等位基因变体的任何多核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
CD44
CD44已知有许多不同的名称,诸如CD44分子(印度血型);造血细胞E-及L-选滞蛋白配体;GP90淋巴细胞归巢/黏附受体;硫酸软骨素蛋白聚醣;细胞外基质受体III;硫酸软骨素蛋白聚醣;吞噬细胞醣蛋白1;玻尿酸受体;赫尔墨斯抗原(Hermes Antigen);CD44抗原;ECMR-III;HUTCH-I;Epican;MDU2;MDU3;MIC4;LHR;CD44抗原(归巢功能及印度血型系统);归巢功能及印度血型系统;细胞表面醣蛋白CD44;印度血型抗原;吞噬细胞醣蛋白I;可溶性CD44;CDW44;CSPG8;HCELL;CDw44;PGP-1;MC56;Pgp1;及In。CD44基因的外部Id为HGNC:1681;Entrez Gene:960;Ensembl:ENSG00000026508;OMIM:107269;及UniProtKB:P16070。本文所使用的术语“CD44”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有NRG1序列是指带有来自诸如CD44参考序列NM_000610.4或其任一等位基因变体的任何多核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
SLC3A2
SLC3A2或溶质载体家族3成员2已知有许多不同的名称,诸如淋巴细胞活化抗原4F2大亚单元;溶质载体家族3(二元(Dibasic)及中性氨基酸转运的活化子),成员2;由单克隆抗体4F2、TRA1.10、TROP4及T43所识别的抗原;溶质载体家族3(氨基酸转运蛋白重链),成员2;4F2细胞表面抗原重链;CD98重链;4F2HC;MDU1;由单克隆抗体4F2定义的抗原,重链;由单克隆抗体4F2定义的抗原;4F2重链抗原;4F2重链;CD98抗原;CD98HC;4T2HC;NACAE;CD98及4F2。SLC3A2的外部Id为HGNC:11026;Entrez Gene:6520;Ensembl:ENSG00000168003;OMIM:158070;及UniProtKB:P08195。本文所使用的术语“SLC3A2”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有SLC3A2转录本6序列是指带有来自诸如NCBI参考序列NM_001013251.3或其任一等位基因变体的任何多核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。而带有SLC3A2转录本3序列是指带有来自诸如NCBI参考序列NM_001013251.3或其任一等位基因变体的任何多核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
VTCN1
VTCN1已知有许多不同的名称,诸如含有T细胞活化抑制剂1的V-Set结构域;B7-H4;B7H4;免疫共刺激蛋白B7-H4;B7超级家族成员1;B7家族成员,H4;B7同源物4;B7h.5;B7S1;T细胞共刺激分子B7x;蛋白质B7S1;FLJ22418;PRO1291;VCTN1;VTCN1及B7X。VTCN1的外部Id为HGNC:28873;NCBI Entrez Gene:79679;Ensembl:ENSG00000134258;608162及UniProtKB/Swiss-Prot:Q7Z7D3。本文所使用的术语“VTCN1”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有VTCN1序列是指带有来自诸如NCBI参考序列NM_024626.4或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
CDH1
CDH1或钙黏蛋白1已知有许多不同的名称,如桑椹胚黏着蛋白(Uvomorulin);钙黏蛋白1,1型,E-钙黏蛋白(上皮);上皮钙黏蛋白;E-钙黏蛋白;钙黏蛋白-1;CAM 120/80;CD324;CDHE;UVO;钙依赖性黏附蛋白,上皮;副睪分泌精子结合蛋白;钙黏蛋白1,E-钙黏蛋白(上皮);细胞-CAM 120/80;CD324抗原;E-钙黏蛋白;Arc-1;BCDS1;ECAD;及LCAM。CDH1的外部Id为HGNC:1748;NCBI Entrez Gene:999;Ensembl:ENSG00000039068;192090及UniProtKB/Swiss-Prot:P12830。本文所使用的术语“CDH1”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有CDH1序列是指带有来自诸如NCBI参考序列NM_001317185.2或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
CXADR
CXADR或柯萨奇病毒及腺病毒受体是B组柯萨奇病毒及C亚组腺病毒的I型膜受体。已发现此基因的若干编码不同同种型的转录变体。与CXADR相关的疾病包括心肌炎及角膜结膜炎。其相关途径包括黏附及同种异体移植排斥。它是上皮细胞顶部接合复合物的一个组成部分,可作用为嗜同性细胞黏附分子,对细胞紧密连接的完整性至关重要。其也涉及通过与白血球膜质膜的跨膜蛋白JAML黏附交互作用所进行的白血球跨上皮细胞迁移。这两种受体之间的交互作用也介导了驻留在上皮细胞中的一种T细胞次族群γ-δT细胞的活化,并涉及组织内环境稳定与修复。在上皮细胞CXADR结合时,JAML会通过PI3激酶及MAP激酶来介导γ-δT细胞中的下游细胞信号传导事件。这通过T细胞相应地刺激上皮细胞组织修复而造成细胞介素及生长因子的增生与生成。CXADR的外部Id包括HGNC:2559NCBI;Entrez Gene:1525;Ensembl:ENSG00000154639;602621;UniProtKB/Swiss-Prot:P78310。本文所使用的术语“CXADR”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有CXADR序列是指带有来自诸如NCBI参考序列NM_001207063.2或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
GTF2E2
GTF2E2或共享转录因子IIE(TFIIE)是RNA聚合酶II转录起始复合体的一部分,其吸收TFIIH且对RNA聚合酶II清除启动子是绝对必要的。TFIIE是一种含α和β亚单元的异源二聚体(且有时为异源四聚体)。此基因所编码的蛋白质表达TFIIE的β亚单元。与GTF2E2相关的疾病包括毛发硫营养障碍症6、非光敏性毛发硫营养障碍症。其相关途径有滑液膜纤维母细胞中的细胞凋亡路径以及巨噬细胞中的CCR5路径。GTF2E2的外部Id包括HGNC:4651;NCBI Entrez Gene:2961;Ensembl:ENSG 00000197265;189964;UniProtKB/Swiss-Prot:P29084。本文所使用的术语“GTF2E2”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有GTF2E2序列是指带有来自诸如NCBI参考序列NM_002095.6或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
CSMD1
CSMD1(或CUB与Sushi多重功能域1)是一种与包括自闭症和思觉失调症的疾病相关的蛋白质。CSMD1的外部Id包括HGNC:14026;NCBI Entrez Gene:64478;Ensembl:ENSG00000183117;608397;UniProtKB/Swiss-Prot:Q96PZ7。本文所使用的术语“CSMD1”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有CSMD1序列是指带有来自诸如NCBI参考序列NM_033225.6或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
PTN
多效生长因子(Pleiotrophin或PTN)蛋白质是一种分泌型肝素结合生长因子。该蛋白质在细胞生长与存活、细胞迁移、血管生成以及肿瘤生成中具有重要的作用。PTN(Pleiotrophin)是蛋白编码基因。与PTN相关的疾病包括佩洛尼氏病(Peyronie'sDisease)及鼻腔嗅神经母细胞瘤。其相关路径有滑液膜纤维母细胞中的GPCR路径及细胞凋亡路径。PTN的外部Id包括HGNC:9630;NCBI Entrez Gene:5764;Ensembl:ENSG00000105894;162095;UniProtKB/Swiss-Prot:P21246。本文所使用的术语“PTN”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有PTN序列是指带有来自诸如NCBI参考序列NM_001321386.2或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
ST14
ST14或ST14跨膜丝氨酸蛋白酶Matriptase是一种上皮细胞衍生的膜主体蛋白丝氨酸蛋白酶。此蛋白酶与Kunitz型丝氨酸蛋白酶抑制剂HAI-1形成复合物,且被发现会被神经鞘胺醇1-磷酸盐活化。此蛋白酶已被证明可裂解及活化肝细胞生长因子/分射因子,以及尿激酶纤溶酶原激活酶,这表明此蛋白酶作为其他蛋白酶与潜在生长因子的上皮细胞膜活化子的功能。与ST14相关的疾病包括不同类型的鱼鳞病。其相关路径包括发育生物学及黏附。ST14的外部Id包括HGNC:11344;NCBI Entrez Gene:6768;Ensembl:ENSG00000149418;606797;UniProtKB/Swiss-Prot:Q9Y5Y6。本文所使用的术语“ST14”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有ST14序列是指带有来自诸如NCBI参考序列NM_021978.4或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
THBS1
THBS1或血小板反应素1是一种二硫键连接的同源三聚体蛋白亚单元。此蛋白质是一种黏附性醣蛋白并介导细胞与细胞的交互作用以及细胞与基质的交互作用。此蛋白可结合至纤维蛋白原、纤维连接蛋白、层黏蛋白、V型胶原蛋白和整联蛋白α-V/β-1。此蛋白已被证明在血小板凝集、血管生成以及肿瘤生成中扮演重要角色。与THBS1相关的疾病包括血栓形成性血小板减少性紫瘢病和Peters-Plus症候群。其相关路径有癌症中的蛋白多醣和胞外基质的降解。与此基因相关的基因本体(GO)标记包括钙离子结合及肝素结合。THBS1的外部Id包括HGNC:11785;NCBI Entrez Gene:7057;Ensembl:ENSG00000137801;188060;UniProtKB/Swiss-Prot:P07996。本文所使用的术语“THBS1”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有THBS1序列是指带有来自诸如NCBI参考序列NM_003246.4或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
AGRN
AGRN或聚集蛋白(Agrin)是神经肌肉接合发育中重要的几种蛋白质之一。所编码的蛋白质包含数个层黏蛋白G、Kazal型丝氨酸蛋白抑制剂和表皮生长因子结构域。其他的翻译后修饰出现在添加葡萄糖胺聚醣及二硫键。在与影响肢带肌的先天性肌无力症候群有关的一个基因家族中发现此基因的突变。与AGRN相关的疾病包括肌无力症候群、先天性、8及突触前先天性肌无力症候群。其相关路径有在神经肌肉接合、血脑障壁、及免疫细胞移位处的Agrin交互作用。AGRN的外部Id包括HGNC:329;NCBI Entrez Gene:375790;Ensembl:ENSG00000188157;103320;UniProtKB/Swiss-Prot:O00468。本文所使用的术语“AGRN”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有AGRN序列是指带有来自诸如NCBI参考序列NM_001305275.2或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
PVALB
PVALP或微小白蛋白(Parvalbumin)是一种高亲合性钙离子结合蛋白,其在结构上与作用上与钙调素及旋光素C相似。所编码的蛋白被认为涉及到肌肉放松。与PVALB相关的疾病包括鱼类过敏及胎儿酒精症候群。与此基因相关的基因本体标记包括钙离子结合及蛋白杂二聚化活性。PVALB的外部Id包括HGNC:9704;NCBI Entrez Gene:5816;Ensembl:ENSG00000100362;168890;UniProtKB/Swiss-Prot:P20472。本文所使用的术语“PVALB”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有PVALB序列是指带有来自诸如NCBI参考序列NM_002854.3或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
APP
APP已知有许多不同的名称,诸如类淀粉蛋白β前驱蛋白、α-SAPP、AD1、阿兹海默病类淀粉蛋白A4蛋白同源物、类淀粉蛋白β(A4)前驱蛋白、阿兹海默病类淀粉蛋白、脑血管类淀粉蛋白肽、类淀粉蛋白β前驱蛋白、类淀粉蛋白前驱蛋白、肽酶连接蛋白(Nexin)-II、蛋白酶连接蛋白-II、PN-II、PreA4、ABPP、APPI、CVAP、β-类淀粉蛋白前驱蛋白、睾丸组织蛋白Li2、β-类淀粉蛋白肽(1-40)、β-类淀粉蛋白肽(1-42)、类淀粉蛋白β-A4蛋白、β-类淀粉蛋白肽、阿兹海默病、CTFγ、ABETA、AAA、PN2和A4。APP基因的外部ID是HGNC:620;Entrez Gene:351;Ensembl:ENSG00000142192;104760及UniProtKB/Swiss-Prot:P05067。APP基因的外部Id为HGNC:620;Entrez Gene:351;Ensembl:ENSG00000142192;/>104760和UniProtKB/Swiss-Prot:P05067。本文所使用的术语“APP”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有APP序列是指带有来自诸如NCBI参考序列NM_001136130.3或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
WRN
WRN或维尔纳氏症候群(Werner Syndrome)ATP依赖性解旋酶已知有许多不同的名称,诸如WRN RecQ样解旋酶;RECQL2;RECQ3;维尔纳氏症候群RecQ样解旋酶;DNA解旋酶、RecQ样第3型;RecQ蛋白样2;核酸外切酶WRN;维尔纳氏症候群,RecQ解旋酶样;维尔纳氏症候群;EC 3.6.4.12;RECQL3和RecQ3。WRN基因外部ID为HGNC:12791;NCBI Entrez Gene:7486;Ensembl:ENSG00000165392;604611和UniProtKB/Swiss-Prot:Q14191。本文所使用的术语“WRN”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有WRN序列是指带有来自诸如NCBI参考序列NM_000553.6或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
DAAM1
DAAM1或形态发生紊乱相关活化子1已知有许多不同的名称,诸如KIAA0666;及形态发生紊乱相关活化子1。DAAM1基因的外部Id为HGNC:18142;NCBI Entrez Gene:23002;Ensembl:ENSG00000100592;606626;及UniProtKB/Swiss-Prot:Q9Y4D1。本文所使用的术语“DAAM1”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有DAAM1序列是指带有来自诸如NCBI参考序列NM_001270520.2或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
ASPH
ASPH或天门冬氨酸β-羟化酶已知有许多不同的名称,诸如BAH、CASQ2BP1、JCTN、HAAH、天门冬氨酸/天冬酰胺基β-羟化酶、肽-天门冬氨酸β-二氧酶、ASPβ-羟化酶、Junctate、Junctin、Humbug、Cardiac Junctin、EC 1.14.11.16、AβH-J-J、FDLAB和AAH。ASPH基因的外部Id为HGNC:757;Entrez Gene:444;Ensembl:ENSG00000198363;600582及UniProtKB/Swiss-Prot:Q12797。本文所使用的术语“ASPH”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有ASPH序列是指带有来自诸如NCBI参考序列NM_001164750.2或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
NOTCH2
NOTCH2或Notch受体2已知有许多不同的名称,诸如Notch 2;神经源性位点缺口同源蛋白2;HN2;Notch(果蝇)同源物2;Notch同源物2(果蝇);Notch同源物2;HJCYS;和AGS2。NOTCH2基因的外部Id为HGNC:7882;NCBI Entrez Gene:4853;Ensembl:ENSG00000134250;600275;及UniProtKB/Swiss-Prot:Q04721。本文所使用的术语“NOTCH2”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有NOTCH2序列是指带有来自诸如NCBI参考序列NM_024408.4或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
CD74
CD74已知有许多不同的名称,诸如CD74分子;DHLAG;CD74分子,主要组织兼容性复合物,II类不变链;HLA II类组织兼容性抗原γ链;II类MHC相关不变链肽;HLA-DR抗原相关不变链;II类抗原的γ链;Ia相关不变链;MHC HLA-DRγ链;HLA-DR-γ;CLIP;Ia抗原相关不变链;CD74抗原;Ia-γ;HLADG;P33;II;及Ii;CD74基因的外部Id为HGNC:1697;NCBI EntrezGene:972;Ensembl:ENSG00000019582;142790;及UniProtKB/Swiss-Prot:P04233。本文所使用的术语“CD74”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有CD74序列是指带有来自诸如NCBI参考序列NM_001025159.3或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
SDC4
SDC4或多配体聚醣4(Syndecan 4)已知有许多不同的名称,诸如双栖蛋白聚醣(Amphiglycan);SYND4;多配体聚醣4(Amphiglycan,Ryudocan);多配体聚醣蛋白聚醣4;Ryudocan核心蛋白;多配体聚醣-4;Ryudocan;及Ryudocan双栖蛋白聚醣。SDC4基因的外部Id为HGNC:10661;NCBI Entrez Gene:6385;Ensembl:ENSG00000124145;600017;及UniProtKB/Swiss-Prot:P31431。本文所使用的术语“SDC4”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有SDC4序列是指带有来自诸如NCBI参考序列NM_002999.4或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
SLC4A4
SLC4A4或溶质载体家族4成员4已知有许多不同的名称,诸如NBC1;HNBC1;HhNMC;NBC2;PNBC;溶质载体家族4(碳酸氢钠共转运蛋白),成员4;产电位碳酸氢钠共转运蛋白1;Na(+)/HCO3(-)共转运蛋白;SLC4A5;KNBC1;碳酸氢钠共转运蛋白1(碳酸氢钠共转运蛋白,肾脏;碳酸氢钠共转运蛋白,胰脏);溶质载体家族4,碳酸氢钠共转运蛋白,成员4,脑型;溶质载体家族4,碳酸氢钠共转运蛋白,成员4;溶质载体家族4,碳酸氢钠共转运蛋白,成员5;碳酸氢钠共转运蛋白;NBCe1-A;NBCE1;KNBC;及NBC。SLC4A4基因的外部Id为HGNC:11030;NCBI Entrez Gene:8671;Ensembl:ENSG00000080493;603345;及UniProtKB/Swiss-Prot:Q9Y6R1。本文所使用的术语“SLC4A4”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有SLC4A4序列是指带有来自诸如NCBI参考序列NM_001098484.3或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
ZFAT
ZFAT或含AT-钩结构域的锌指(Zing Finger And AT-Hook Domain Containing)已知有许多不同的名称,诸如锌指蛋白406;KIAA1485;ZNF406;ZFAT1;锌指蛋白ZFAT;在自体免疫性甲状腺疾病的锌指基因;在AITD易感区的锌指基因;和AITD3。ZFAT基因的外部Id为HGNC:19899;NCBI Entrez Gene:57623;Ensembl:ENSG00000066827;610931;及UniProtKB/Swiss-Prot:Q9P243。本文所使用的术语“ZFAT”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有ZFAT序列是指带有来自诸如NCBI参考序列NM_020863.4或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
DSCAML1
DSCAML1或类DS细胞黏附分子1已知有许多不同的名称,诸如KIAA1132;类唐氏症细胞黏附分子蛋白1;唐氏症细胞黏附分子2;DSCAM2;类唐氏症细胞黏附分子1;类唐氏症细胞黏附分子1;及类DSCAM 1。DSCAML1基因的外部Id为HGNC:14656;NCBI Entrez Gene:57453;Ensembl:ENSG00000177103;611782;及UniProtKB/Swiss-Prot:Q8TD84。本文所使用的术语“DSCAML1”并不意味着局限于任何诸如蛋白质、RNA、mRNA、cDNA或DNA序列的形式,而是包括所有这类的形式,除非上下文清楚指出是哪种形式。为了避免疑虑,带有DSCAML1序列是指带有来自诸如NCBI参考序列NM_020693.4或其任一等位基因变体的任何核苷酸序列,包括编码序列或是任何外显子,但也包括任何多肽序列,或其任何部分。
NRG1多核苷酸融合物
根据本公开,现在提供了会导致NRG1融合产物表达的前所未知的基因重排,其中NRG1与融合配偶体融合。特别地,提供了包含NRG1的多核苷酸融合物,包括VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、DAAM1-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1或DSCAML1-NRG1。特别地,在被诊断患有癌症的人类患者中存在或已鉴定出这类融合物,并在下节中更详细地提及。
在某些实施例中,该NRG1融合物在编码该EGF样结构域的序列的3’处可包含另外的下游融合配偶体。
VAPB-NRG1多核苷酸融合物
根据本公开,也提供一种包含VAPB核酸序列(或VAPB核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸。所述融合物中也包括VAPB和NRG1核酸序列的等位基因变体。
优选地,该VAPB核酸序列(或其一部分)包含SEQ ID NO:17-23中的任一者或SEQID NO:17-23中的任一者的等位基因变体,或是由其组成,而该NRG1核酸序列(或其一部分)包含SEQ ID NO:125-138中的任一者或SEQ ID NO:125-138中的任一者的等位基因变体,或是由其组成。更优选地,该VAPB核酸序列包含SEQ ID NO:23或SEQ ID NO:23的等位基因变体的一部分,或是由其组成,而该NRG1核酸序列包含SEQ ID NO:138或SEQ ID NO:138的等位基因变体的一部分,或是由其组成。SEQ ID NO:17-22分别对应于根据NM_004738.4的VAPB的个别外显子1-6。SEQ ID NO:23对应于根据NM_004738.4的VAPB的外显子1-5。SEQ IDNO:125-137分别对应于根据NM_001159999的NRG1的个别外显子1-13。SEQ ID NO:138对应于根据NM_001159999的NRG1的外显子1-13。
在一个优选实施方式中,该VAPB核酸序列部分包含来自SEQ ID NO:17-23中的任一者(或SEQ ID NO:17-23中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,而该NRG1核酸序列部分包含来自SEQ ID NO:125-138中的任一者(或SEQ ID NO:125-138中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸。
优选地,该VAPB核酸序列或其一部分位于NRG1核酸序列或其一部分的5’处。
优选地,该包含VAPB的VAPB核酸序列(或所述序列的一部分)与NRG1核酸序列(或所述序列的一部分)融合的多核苷酸包含或编码NRG1的EGF样结构域。包含该VAPB-NRG1多核苷酸融合物或表达该多肽融合物的异常细胞包含或编码NRG1的EGF样结构域。为了检测、诊断或鉴定的目的,只需证明介于VAPB与NRG1之间的融合接点是框内的并且发生在使得所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该VAPB核酸序列的等位基因变体与SEQ ID NO:17-23中的任一者有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性;且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
在一个优选实施方式中,该包含VAPB核酸与NRG1核酸融合的多核苷酸包含来自SEQ ID NO:3的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且优选地包括位置43和44的核酸。连续核酸的数目可为SEQ ID NO:3的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置43和44的核酸。
在一个优选实施方式中,提供了一种根据SEQ ID NO:3的多核苷酸,或一种包含来自SEQ ID NO:3的约20、约30、约40个或全部的连续核酸且优选地包括位置43和44的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:3的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置43和44的核酸。
优选地,该NRG1核酸序列的多核苷酸部分(或其等位基因变体)编码NRG1的EGF样结构域,优选为根据SEQ ID NO:163的EGF样结构域。
在一个替代方面中,提供了一种包含VAPB的外显子1或其等位基因变体的一部分与NRG1的外显子2或其等位基因变体的一部分融合的多核苷酸。优选地,VAPB的外显子1为SEQ ID NO:17的外显子。优选地,NRG1的外显子2为SEQ ID NO:126的外显子。所述VAPB外显子1的部分优选地包含SEQ ID NO:1或其等位基因变体或是由其组成。所述NRG1外显子2的部分优选地包含SEQ ID NO:2或其等位基因变体或是由其组成。当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括NRG1外显子2的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:17和126可能就足够。来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ IDNO:127-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该VAPB的外显子1的等位基因变体与SEQ ID NO:17有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1的外显子2的等位基因变体与SEQ ID NO:126有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
在一个优选实施方式中,VAPB的外显子1的部分包含SEQ ID NO:1或由其组成,且其等位基因变体与SEQ ID NO:1有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此融合物中的NRG1的外显子2的部分包含SEQ ID NO:2或由其组成,且其等位基因变体与SEQ ID NO:2有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。这类短的多核苷酸序列特别有利于检测VAPB与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。更优选地,VAPB的外显子1的部分包含来自SEQ ID NO:1的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置43的核酸。连续核酸的数目可为SEQ ID NO:1的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置43的核酸。更优选地,VAPB的外显子1的部分包含或根据SEQ ID NO:1或其等位基因变体。
替代性地,VAPB外显子1的部分包含SEQ ID NO:17(或SEQ ID NO:17的等位基因变体)或由其组成,至少包括位置399的核酸。优选地,VAPB外显子1的部分包含来自SEQ IDNO:17或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置399的核酸。连续核酸的数目可为SEQ ID NO:17的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置399的核酸。在此替代例中,VAPB外显子1的部分更优选地包含或根据SEQ ID NO:17或其等位基因变体。优选地,在与VAPB的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
在一个替代性优选实施方式中,该包含VAPB外显子1的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:3的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置43和44的核酸。连续核酸的数目可为SEQ ID NO:3的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置43和44的核酸。SEQ ID NO:3包括介于VAPB与NRG1之间的接点,尤其该接点介于源于VAPB的位置43的核酸与源于NRG1的位置44的核酸之间。优选地,该包含VAPB外显子1的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:3的多核苷酸序列或其等位基因变体。
优选地,本文所提供的任一VAPB-NRG1多核苷酸融合物为VAPB与NRG1的框内融合。更优选地所述融合物为包含VAPB的外显子1或外显子1的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:3或其等位基因变体的融合物。
优选地,VAPB外显子1(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有VAPB的N端和NRG1的C端。此外,本文所提供的VAPB-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自VAPB的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供其EGF样结构域。该VAPB-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,包括肺癌或腺癌,特别是肺腺癌或非小细胞肺癌。
CADM1-NRG1多核苷酸融合物
也提供了一种包含CADM1的外显子7的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。CADM1的外显子7优选为SEQ ID NO:39或SEQ ID NO:39的等位基因变体的外显子,而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。
优选地,CADM1外显子7的等位基因变体与SEQ ID NO:39有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,CADM1的外显子7的部分包含或根据SEQ ID NO:5,且其等位基因变体与SEQ ID NO:5有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与CADM1的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:6的序列,且其等位基因变体与SEQ ID NO:6有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。这类短的多核苷酸序列特别有利于检测CADM1与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。更优选地,CADM1的外显子7的部分包含来自SEQ ID NO:5的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置43的核酸。连续核酸的数目可为SEQ ID NO:5的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置53的核酸。更优选地,CADM1的外显子7的部分包含或根据SEQ ID NO:5或其等位基因变体。
替代性地,CADM1外显子7的部分包含SEQ ID NO:39(或SEQ ID NO:39的等位基因变体)或由其组成,至少包括位置173的核酸。优选地,CADM1外显子7的部分包含来自SEQ IDNO:39或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置173的核酸。连续核酸的数目可为SEQ ID NO:39的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置173的核酸。在此替代例中,CADM1外显子7的部分更优选地包含或根据SEQ ID NO:39或其等位基因变体。优选地,在与CADM1的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
在一个替代性优选实施方式中,该包含CADM1外显子7的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:7的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置53和54的核酸。连续核酸的数目可为SEQ ID NO:7的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置53和54的核酸。SEQ ID NO:7包括介于CADM1与NRG1之间的接点,尤其该接点介于源于CADM1的位置53的核酸与源于NRG1的位置54的核酸之间。优选地,该包含CADM1外显子7的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:7的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:7的多核苷酸,或一种包含来自SEQ ID NO:7的约20、约30、约40个或全部的连续核酸且优选地包括位置53和54的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:7的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置53和54的核酸。
优选地,本文所提供的任一CADM1-NRG1多核苷酸融合物为CADM1与NRG1的框内融合。更优选地所述融合物为包含CADM1的外显子7或外显子7的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:7或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:7有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
优选地,该包含CADM1外显子7(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及CADM1或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于CADM1与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该CADM1外显子7(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有CADM1的N端和NRG1的C端。此外,本文所提供的CADM1-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自CADM1的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该CADM1-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,包括肺癌或腺癌,特别是肺腺癌。
当存在于患者或受试者的异常细胞中时,所述CADM1-NRG1多核苷酸融合物优选地进一步包括CADM1外显子7的5’处的任一序列以及NRG1外显子6的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:39和130可能就足够。来自CADM1外显子7的5’处的任一序列包含SEQ ID NO:33-38(或SEQ ID NO:33-38的任一等位基因变体)中的一者或全部,或是由其组成,而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的任一者或全部,或是由其组成。
CD44-NRG1多核苷酸融合物
也提供了一种包含CD44的外显子5的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。CD44的外显子5优选为SEQ ID NO:65或SEQ ID NO:65的等位基因变体的外显子,而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。
优选地,该CD44外显子5的等位基因变体与SEQ ID NO:65有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,CD44的外显子5的部分包含或根据SEQ ID NO:9,且其等位基因变体与SEQID NO:9有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与CD44的融合物中的NRG1的外显子2的部分优选是或包含如SEQID NO:10的序列,且其等位基因变体与SEQ ID NO:10有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,CD44的外显子5的部分包含来自SEQ ID NO:9的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置52的核酸。连续核酸的数目可为SEQ ID NO:9的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置52的核酸。更优选地,CD44的外显子5的部分包含或根据SEQ ID NO:9或其等位基因变体。这类短的多核苷酸序列特别有利于检测CD44与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,CD44外显子5的部分包含SEQ ID NO:65(或SEQ ID NO:65的等位基因变体)或由其组成,至少包括位置231的核酸。优选地,CD44外显子5的部分包含来自SEQ IDNO:65或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置231的核酸。连续核酸的数目可为SEQ ID NO:65的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置231的核酸。在此替代例中,CD44外显子5的部分更优选地包含或根据SEQ ID NO:231或其等位基因变体。优选地,在与CD44的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
在一个替代性优选实施方式中,该包含CD44外显子5的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:11的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置52和53的核酸。连续核酸的数目可为SEQ ID NO:11的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置52和53的核酸。SEQ IDNO:11包括介于CD44与NRG1之间的接点,尤其该接点介于源于CD44的位置52的核酸与源于NRG1的位置53的核酸之间。优选地,该包含CD44外显子5的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:15的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:11的多核苷酸,或一种包含来自SEQ ID NO:11的约20、约30、约40个或全部的连续核酸且优选地包括位置52和53的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:11的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置52和53的核酸。
优选地,本文所提供的任一CD44-NRG1多核苷酸融合物为CD44与NRG1的框内融合。更优选地所述融合物为包含CD44的外显子5(或外显子5的一部分)以及NRG1的外显子2(或NRG1的外显子2的一部分)的框内融合。所述框内融合优选为SEQ ID NO:11或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:11有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
优选地,该包含CD44外显子5(或其等位基因变体)的一部分与NRG1外显子2(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及CD44或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于CD44与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该CD44外显子5(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有CD44的N端和NRG1的C端。此外,本文所提供的CD44-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自CD44的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该CD44-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,包括胰脏癌或胰脏腺癌,特别是胰脏导管腺癌(或PDAC)。
当存在于患者或受试者的异常细胞中时,所述CD44-NRG1多核苷酸融合物优选地进一步包括CD44外显子5的5’处的任一序列以及NRG1外显子2的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:65和126可能就足够。来自CD44外显子5的5’处的任一序列包含SEQ ID NO:61-64(或SEQ ID NO:61-64的任一等位基因变体)中的一者或全部,或是由其组成,而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部,或是由其组成。
进一步地,提供了一种包含CD44的外显子5的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。所述CD44的外显子5优选为SEQ ID NO:65或SEQ ID NO:65的等位基因变体的外显子,而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。
优选地,所述CD44外显子5的等位基因变体与SEQ ID NO:65有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,所述CD44的外显子5的部分包含或根据SEQ ID NO:759,且其等位基因变体与SEQ ID NO:9有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与CD44的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:760的序列,且其等位基因变体与SEQ ID NO:760有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,CD44的外显子5的部分包含来自SEQ ID NO:759的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置75的核酸。连续核酸的数目可为SEQ ID NO:759的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75的核酸。更优选地,所述CD44的外显子5的部分包含或根据SEQ ID NO:759或其等位基因变体。这类短的多核苷酸序列特别有利于检测CD44与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,所述CD44外显子5的部分包含SEQ ID NO:65(或SEQ ID NO:65的等位基因变体)或由其组成,至少包括位置231的核酸。优选地,所述CD44外显子5的部分包含来自SEQ ID NO:65或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置231的核酸。连续核酸的数目可为SEQ ID NO:65的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置231的核酸。在此替代例中,CD44外显子5的部分更优选地包含或根据SEQ ID NO:65或其等位基因变体。优选地,在与CD44的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
优选地,本文所提供的任一CD44-NRG1多核苷酸融合物为CD44与NRG1的框内融合。更优选地所述融合物为包含CD44的外显子5或外显子5的一部分以及NRG1的外显子6或NRG1的外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:761或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:761有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含所述CD44外显子5的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:761的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置75和76的核酸。连续核酸的数目可为SEQ ID NO:761的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75和76的核酸。SEQ IDNO:761包括介于CD44与NRG1之间的接点,尤其该接点介于源于CD44的位置75的核酸与源于NRG1的位置76的核酸之间。优选地,该包含CD44外显子5的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:761的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:761的多核苷酸,或一种包含来自SEQ ID NO:761的约20、约30、约40个或全部的连续核酸且优选地包括位置75和76的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:761的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置75和76的核酸。
优选地,该包含CD44外显子5(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及所述CD44或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于CD44与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该CD44外显子5(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有CD44的N端和NRG1的C端。此外,本文所提供的CD44-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自CD44的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该CD44-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,特别是胰脏癌。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括CD44外显子5的5’处的任一序列以及NRG1外显子6的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:65和130可能就足够。来自CD44外显子5的5’处的任一序列包含SEQ ID NO:61-64(或SEQ ID NO:61-64的任一等位基因变体)中的一者或全部,或是由其组成,而来自NRG1外显子6的3’处的任一序列包含SEQID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部,或是由其组成。
SLC3A2-NRG1多核苷酸融合物
也提供了一种包含SLC3A2转录本6的外显子1的一部分与NRG1的外显子5的一部分融合的多核苷酸融合物。所述SLC3A2的外显子1优选为SEQ ID NO:103或SEQ ID NO:103的等位基因变体的外显子,而NRG1的外显子5优选为SEQ ID NO:129或SEQ ID NO:129的等位基因变体的外显子。
优选地,所述SLC3A2外显子1的等位基因变体与SEQ ID NO:103有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子5的等位基因变体与SEQ ID NO:129有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,所述SLC3A2的外显子1的部分包含或根据SEQ ID NO:13,且其等位基因变体与SEQ ID NO:13有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与SLC3A2的融合物中的NRG1的外显子5的部分优选是或包含如SEQ ID NO:14的序列,且其等位基因变体与SEQ ID NO:14有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,所述SLC3A2的外显子1的部分包含来自SEQ ID NO:13的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置53的核酸。连续核酸的数目可为SEQ ID NO:13的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置53的核酸。更优选地,所述SLC3A2的外显子1的部分包含或根据SEQ ID NO:13或其等位基因变体。这类短的多核苷酸序列特别有利于检测SLC3A2与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,所述SLC3A2外显子1的部分包含SEQ ID NO:103(或SEQ ID NO:103的等位基因变体)或由其组成,至少包括位置552的核酸。优选地,所述SLC3A2外显子1的部分包含来自SEQ ID NO:103或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置552的核酸。连续核酸的数目可为SEQ ID NO:103的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置552的核酸。在此替代例中,SLC3A2外显子1的部分更优选地包含或根据SEQ ID NO:103或其等位基因变体。优选地,在与所述SLC3A2的融合物中的NRG1外显子5的部分包含来自SEQ ID NO:157或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:157的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
优选地,本文所提供的任一SLC3A2-NRG1多核苷酸融合物为SLC3A2与NRG1的框内融合。更优选地所述融合物为包含SLC3A2的转录本6的外显子1或外显子1的一部分以及NRG1的外显子5或外显子5的一部分的框内融合。所述框内融合优选为SEQ ID NO:15或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:15有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含所述SLC3A2外显子1的一部分与NRG1外显子5的一部分融合的多核苷酸包含来自SEQ ID NO:15的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置53和54的核酸。连续核酸的数目可为SEQ ID NO:15的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置53和54的核酸。SEQID NO:15包括介于SLC3A2与NRG1之间的接点,尤其该接点介于源于SLC3A2的位置53的核酸与源于NRG1的位置54的核酸之间。优选地,该包含SLC3A2外显子1的一部分与NRG1外显子5的一部分融合的多核苷酸具有SEQ ID NO:15的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:15的多核苷酸,或一种包含来自SEQ ID NO:15的约20、约30、约40个或全部的连续核酸且优选地包括位置53和54的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:15的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置53和54的核酸。
优选地,该包含SLC3A2转录本6的外显子1(或其等位基因变体)的一部分与NRG1外显子5(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及所述SLC3A2或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于所述SLC3A2与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该SLC3A2转录本6的外显子1(或其等位基因变体)的部分位于NRG1外显子5(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有SLC3A2的N端和NRG1的C端。此外,本文所提供的SLC3A2-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自SLC3A2的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该SLC3A2-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,包括肺癌或腺癌,特别是肺腺癌。
当存在于患者或受试者的异常细胞中时,所述SCL3A2-NRG1多核苷酸融合物优选地进一步包括NRG1外显子5的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:103及129可能就足够。来自NRG1外显子5的3’处的任一序列包含SEQ ID NO:130-137(或SEQ ID NO:130-137的任一等位基因变体)中的一者或全部,或是由其组成。
进一步地,提供了一种包含SLC3A2转录本3的外显子2的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。所述SLC3A2的外显子2优选为SEQ ID NO:457或SEQ IDNO:457的等位基因变体的外显子,而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。
优选地,所述SLC3A2外显子2的等位基因变体与SEQ ID NO:457有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,所述SLC3A2的外显子2的部分包含或根据SEQ ID NO:452,且其等位基因变体与SEQ ID NO:452有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与SLC3A2的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:453的序列,且其等位基因变体与SEQ ID NO:453有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,SLC3A2的外显子2的部分包含来自SEQ ID NO:452的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置93的核酸。连续核酸的数目可为SEQ ID NO:452的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置93的核酸。更优选地,所述SLC3A2的外显子2的部分包含或根据SEQ ID NO:452或其等位基因变体。这类短的多核苷酸序列特别有利于检测SLC3A2与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,所述SLC3A2外显子2的部分包含SEQ ID NO:457(或SEQ ID NO:457的等位基因变体)或由其组成,至少包括位置93的核酸。优选地,所述SLC3A2外显子2的部分包含来自SEQ ID NO:457或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置93的核酸。连续核酸的数目可为SEQ ID NO:39的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置457的核酸。在此替代例中,SLC3A2外显子2的部分更优选地包含或根据SEQ ID NO:457或其等位基因变体。优选地,在与SLC3A2转录本3的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
优选地,本文所提供的任一SLC3A2-NRG1多核苷酸融合物为SLC3A2与NRG1的框内融合。更优选地所述融合物为包含SLC3A2的转录本3的外显子2或外显子2的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:454或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:454有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含所述SLC3A2外显子2的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:454的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置93和94的核酸。连续核酸的数目可为SEQ ID NO:454的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置93和94的核酸。SEQ ID NO:454包括介于所述SLC3A2与NRG1之间的接点,尤其该接点介于源于SLC3A2的位置93的核酸与源于NRG1的位置94的核酸之间。优选地,该包含SLC3A2外显子2的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:454的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:454的多核苷酸,或一种包含来自SEQ ID NO:454的约20、约30、约40个或全部的连续核酸且优选地包括位置93和94的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:454的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置93和94的核酸。
优选地,该包含SLC3A2转录本3的外显子2(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及所述SLC3A2或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于所述SLC3A2与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该SLC3A2转录本3的外显子2(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有SLC3A2的N端和NRG1的C端。此外,本文所提供的SLC3A2-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自SLC3A2的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该CADM1-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,包括肺癌或腺癌,特别是肺腺癌。
当存在于患者或受试者的异常细胞中时,所述SCL3A2-NRG1多核苷酸融合物优选地进一步包括NRG1外显子6的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:457和130可能就足够。来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部,或是由其组成。
VTCN1-NRG1多核苷酸融合物
也提供了一种包含VTCN1的外显子2的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。VTCN1的外显子2优选为SEQ ID NO:169或SEQ ID NO:169的等位基因变体的外显子,而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。
优选地,该VTCN1外显子2的等位基因变体与SEQ ID NO:169有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,VTCN1的外显子2的部分包含或根据SEQ ID NO:164,且其等位基因变体与SEQ ID NO:164有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与VTCN1的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:165的序列,且其等位基因变体与SEQ ID NO:165有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,VTCN1的外显子2的部分包含来自SEQ ID NO:164的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置65的核酸。连续核酸的数目可为SEQ ID NO:164的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置65的核酸。更优选地,VTCN1的外显子2的部分包含或根据SEQ ID NO:164或其等位基因变体。这类短的多核苷酸序列特别有利于检测VTCN1与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
优选地,本文所提供的任一VTCN1-NRG1多核苷酸融合物为VTCN1与NRG1的框内融合。更优选地所述融合物为包含VTCN1的外显子2或外显子2的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:166或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:166有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含VTCN1外显子2的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:166的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置65和66的核酸。连续核酸的数目可为SEQ ID NO:166的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置65和66的核酸。SEQ IDNO:166包括介于VTCN1与NRG1之间的接点,尤其该接点介于源于VTCN1的位置65的核酸与源于NRG1的位置66的核酸之间。优选地,该包含VTCN1外显子2的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:166的多核苷酸序列或其等位基因变体。优选地,在与VTCN1的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
在一个优选实施方式中,提供了一种根据SEQ ID NO:166的多核苷酸,或一种包含来自SEQ ID NO:166的约20、约30、约40个或全部的连续核酸且优选地包括位置65和66的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:166的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置65和66的核酸。
优选地,该包含VTCN1外显子2(或其等位基因变体)的一部分与NRG1外显子2(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及VTCN1或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于VTCN1与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该VTCN1外显子2(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有VTCN1的N端和NRG1的C端。此外,本文所提供的VTCN1-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自VTCN1的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该VTCN1-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,特别是腺癌。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括VTCN1外显子2的5’处的任一序列以及NRG1外显子2的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:169和126可能就足够。来自VTCN1外显子2的5’处的任一序列包含SEQ ID NO:168(或SEQ ID NO:168的任一等位基因变体)或是由其组成,而来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部,或是由其组成。
CDH1-NRG1多核苷酸融合物
也提供了一种包含CDH1的外显子11的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。CDH1的外显子11优选为SEQ ID NO:198或SEQ ID NO:198的等位基因变体的外显子,而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括CDH1外显子11的5’处的任一序列以及NRG1外显子2的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:198和126可能就足够。来自CDH1外显子11的5’处的任一序列包含SEQ ID NO:188-197(或SEQ ID NO:188-197的任一等位基因变体)中的一者或全部,或是由其组成,而来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该CDH1外显子11的等位基因变体与SEQ ID NO:198有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,CDH1的外显子11的部分包含或根据SEQ ID NO:184,且其等位基因变体与SEQ ID NO:184有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与CDH1的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:185的序列,且其等位基因变体与SEQ ID NO:185有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,CDH1的外显子11的部分包含来自SEQ ID NO:184的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置119的核酸。连续核酸的数目可为SEQ ID NO:184的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置119的核酸。更优选地,CDH1的外显子11的部分包含或根据SEQ ID NO:184或其等位基因变体。这类短的多核苷酸序列特别有利于检测CDH1与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,CDH1外显子11的部分包含SEQ ID NO:198(或SEQ ID NO:198的等位基因变体)或由其组成,至少包括位置146的核酸。优选地,CDH1外显子11的部分包含来自SEQID NO:198或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置146的核酸。连续核酸的数目可为SEQ ID NO:198的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置146的核酸。在此替代例中,CDH1外显子11的部分更优选地包含或根据SEQ ID NO:198或其等位基因变体。
优选地,本文所提供的任一CDH1-NRG1多核苷酸融合物为CDH1与NRG1的框内融合。更优选地所述融合物为包含CDH1的外显子11或外显子2的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:186或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:186有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含CDH1外显子11的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:186的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置119和120的核酸。连续核酸的数目可为SEQ ID NO:186的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置119和120的核酸。SEQID NO:186包括介于CDH1与NRG1之间的接点,尤其该接点介于源于CDH1的位置119的核酸与源于NRG1的位置120的核酸之间。优选地,该包含CDH1外显子11的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:186的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:186的多核苷酸,或一种包含来自SEQ ID NO:186的约20、约30、约40个或全部的连续核酸且优选地包括位置119和120的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:186的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置119和120的核酸。
优选地,该包含CDH1外显子11(或其等位基因变体)的一部分与NRG1外显子2(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及CDH1或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于CDH1与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该CDH1外显子11(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有CDH1的N端和NRG1的C端。此外,本文所提供的CDH1-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自CDH1的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该CDH1-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,包括肺癌或腺癌,特别是肺腺癌。
CXADR-NRG1多核苷酸融合物
也提供了一种包含CXADR的外显子1的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。CXADR的外显子1优选为SEQ ID NO:2199或SEQ ID NO:219的等位基因变体的外显子,而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括CXADR外显子1的5’处的任一序列以及NRG1外显子2的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:219和126可能就足够。NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该CXADR外显子1的等位基因变体与SEQ ID NO:219有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,CXADR的外显子1的部分包含或根据SEQ ID NO:215,且其等位基因变体与SEQ ID NO:215有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与CXADR的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:216的序列,且其等位基因变体与SEQ ID NO:216有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,CXADR的外显子1的部分包含来自SEQ ID NO:215的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置43的核酸。连续核酸的数目可为SEQ ID NO:215的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置43的核酸。更优选地,CXADR的外显子1的部分包含或根据SEQ ID NO:215或其等位基因变体。这类短的多核苷酸序列特别有利于检测CXADR与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,CXADR外显子1的部分包含SEQ ID NO:219(或SEQ ID NO:219的等位基因变体)或由其组成,至少包括位置130的核酸。优选地,CXADR外显子1的部分包含来自SEQID NO:219或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置130的核酸。连续核酸的数目可为SEQ ID NO:219的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置130的核酸。在此替代例中,CXADR外显子1的部分更优选地包含或根据SEQ ID NO:219或其等位基因变体。
优选地,本文所提供的任一CXADR-NRG1多核苷酸融合物为CXADR与NRG1的框内融合。更优选地所述融合物为包含CXADR的外显子1或外显子2的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:217或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:217有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含CXADR外显子1的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:217的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置43和44的核酸。连续核酸的数目可为SEQ ID NO:217的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置43和44的核酸。SEQ IDNO:217包括介于CXADR与NRG1之间的接点,尤其该接点介于源于CXADR的位置43的核酸与源于NRG1的位置44的核酸之间。优选地,该包含CXADR外显子1的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:217的多核苷酸序列或其等位基因变体。优选地,在与CXADR的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
在一个优选实施方式中,提供了一种根据SEQ ID NO:217的多核苷酸,或一种包含来自SEQ ID NO:217的约20、约30、约40个或全部的连续核酸且优选地包括位置43和44的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:217的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置43和44的核酸。
优选地,该包含CXADR外显子1(或其等位基因变体)的一部分与NRG1外显子2(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及CXADR或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于CXADR与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该CXADR外显子1(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有CXADR的N端和NRG1的C端。此外,本文所提供的CXADR-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自CXADR的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该CXADR-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,特别是大肠癌。
GTF2E2-NRG1多核苷酸融合物
也提供了一种包含GTF2E2的外显子2的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。GTF2E2的外显子2优选为SEQ ID NO:236或SEQ ID NO:236的等位基因变体的外显子,而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括GTF2E2外显子2的5’处的任一序列以及NRG1外显子2的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:236和126可能就足够。来自GTF2E2外显子2的5’处的任一序列包含SEQ ID NO:235(或SEQ ID NO:235的任一等位基因变体)或是由其组成,而来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该GTF2E2外显子2的等位基因变体与SEQ ID NO:236有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,GTF2E2的外显子2的部分包含或根据SEQ ID NO:231,且其等位基因变体与SEQ ID NO:231有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与GTF2E2的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:232的序列,且其等位基因变体与SEQ ID NO:232有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,GTF2E2的外显子2的部分包含来自SEQ ID NO:231的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置141的核酸。连续核酸的数目可为SEQ ID NO:231的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置141的核酸。更优选地,GTF2E2的外显子2的部分包含或根据SEQ ID NO:231或其等位基因变体。这类短的多核苷酸序列特别有利于检测GTF2E2与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,GTF2E2外显子2的部分包含SEQ ID NO:236(或SEQ ID NO:236的等位基因变体)或由其组成,至少包括位置170的核酸。优选地,GTF2E2外显子2的部分包含来自SEQID NO:236或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置170的核酸。连续核酸的数目可为SEQ ID NO:236的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置170的核酸。在此替代例中,GTF2E2外显子2的部分更优选地包含或根据SEQ ID NO:236或其等位基因变体。优选地,在与GTF2E2的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
优选地,本文所提供的任一GTF2E2-NRG1多核苷酸融合物为GTF2E2与NRG1的框内融合。更优选地所述融合物为包含GTF2E2的外显子2或外显子2的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:233或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:233有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含GTF2E2外显子2的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:233的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置141和142的核酸。连续核酸的数目可为SEQ ID NO:233的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置141和142的核酸。SEQID NO:233包括介于GTF2E2与NRG1之间的接点,尤其该接点介于源于GTF2E2的位置141的核酸与源于NRG1的位置142的核酸之间。优选地,该包含GTF2E2外显子2的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:233的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:233的多核苷酸,或一种包含来自SEQ ID NO:233的约20、约30、约40个或全部的连续核酸且优选地包括位置141和142的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:233的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置141和142的核酸。
优选地,该包含GTF2E2外显子2(或其等位基因变体)的一部分与NRG1外显子2(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及GTF2E2或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于GTF2E2与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该GTF2E2外显子2(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有GTF2E2的N端和NRG1的C端。此外,本文所提供的GTF2E2-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自GTF2E2的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该GTF2E2-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,更特别是(转移性)乳腺癌NOS。
CSMD1-NRG1多核苷酸融合物
也提供了一种包含CSMD1的外显子23的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。CSMD1的外显子23优选为SEQ ID NO:279或SEQ ID NO:279的等位基因变体的外显子,而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括CSMD1外显子23的5’处的任一序列以及NRG1外显子6的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:279和130可能就足够。来自CSMD1外显子23的5’处的任一序列包含SEQ ID NO:257-278(或SEQ ID NO:257-278的任一等位基因变体)中的任一者或全部,或是由其组成,而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该CSMD1外显子23的等位基因变体与SEQ ID NO:279有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,CSMD1的外显子23的部分包含或根据SEQ ID NO:253,且其等位基因变体与SEQ ID NO:253有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与CSMD1的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:254的序列,且其等位基因变体与SEQ ID NO:254有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,CSMD1的外显子23的部分包含来自SEQ ID NO:253的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置88的核酸。连续核酸的数目可为SEQ ID NO:253的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置88的核酸。更优选地,CSMD1的外显子23的部分包含或根据SEQ ID NO:253或其等位基因变体。这类短的多核苷酸序列特别有利于检测CSMD1与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,CSMD1外显子23的部分包含SEQ ID NO:279(或SEQ ID NO:279的等位基因变体)或由其组成,至少包括位置157的核酸。优选地,CSMD1外显子23的部分包含来自SEQID NO:279或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置157的核酸。连续核酸的数目可为SEQ ID NO:279的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置157的核酸。在此替代例中,CSMD1外显子23的部分更优选地包含或根据SEQ ID NO:279或其等位基因变体。优选地,在与CSMD1的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
优选地,本文所提供的任一CSMD1-NRG1多核苷酸融合物为CSMD1与NRG1的框内融合。更优选地所述融合物为包含CSMD1的外显子23或外显子6的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:255或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:255有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含CSMD1外显子23的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:255的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置88和89的核酸。连续核酸的数目可为SEQ ID NO:255的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置88和89的核酸。SEQ IDNO:255包括介于CSMD1与NRG1之间的接点,尤其该接点介于源于CSMD1的位置88的核酸与源于NRG1的位置89的核酸之间。优选地,该包含CSMD1外显子23的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:255的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:255的多核苷酸,或一种包含来自SEQ ID NO:255的约20、约30、约40个或全部的连续核酸且优选地包括位置88和89的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:255的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置88和89的核酸。
优选地,该包含CSMD1外显子23(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及CSMD1或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于CSMD1与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该CSMD1外显子23(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有CSMD1的N端和NRG1的C端。此外,本文所提供的CSMD1-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自CSMD1的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该CSMD1-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,特别是腺癌,更特别是胰脏导管腺癌。
PTN-NRG1多核苷酸融合物
也提供了一种包含PTN的外显子4的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。PTN的外显子4优选为SEQ ID NO:318或SEQ ID NO:318的等位基因变体的外显子,而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括PTN外显子4的5’处的任一序列以及NRG1外显子2的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:318和126可能就足够。来自PTN外显子4的5’处的任一序列包含SEQ ID NO:315-317(或SEQ ID NO:315-317的任一等位基因变体)中的任一者或全部,或是由其组成,而来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该PTN外显子4的等位基因变体与SEQ ID NO:318有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,PTN的外显子4的部分包含或根据SEQ ID NO:311,且其等位基因变体与SEQ ID NO:311有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与PTN的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:312的序列,且其等位基因变体与SEQ ID NO:312有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,PTN的外显子4的部分包含来自SEQ ID NO:311的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置102的核酸。连续核酸的数目可为SEQ IDNO:311的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置102的核酸。更优选地,PTN的外显子4的部分包含或根据SEQ ID NO:311或其等位基因变体。这类短的多核苷酸序列特别有利于检测PTN与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,PTN外显子4的部分包含SEQ ID NO:318(或SEQ ID NO:318的等位基因变体)或由其组成,至少包括位置162的核酸。优选地,PTN外显子4的部分包含来自SEQ IDNO:318或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置162的核酸。连续核酸的数目可为SEQ ID NO:318的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置162的核酸。在此替代例中,PTN外显子4的部分更优选地包含或根据SEQ ID NO:318或其等位基因变体。优选地,在与PTN的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
优选地,本文所提供的任一PTN-NRG1多核苷酸融合物为PTN与NRG1的框内融合。更优选地所述融合物为包含PTN的外显子4或外显子2的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:313或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:313有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含PTN外显子4的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:313的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置102和103的核酸。连续核酸的数目可为SEQ ID NO:313的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置102和103的核酸。SEQID NO:313包括介于PTN与NRG1之间的接点,尤其该接点介于源于PTN的位置102的核酸与源于NRG1的位置103的核酸之间。优选地,该包含PTN外显子4的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:313的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:313的多核苷酸,或一种包含来自SEQ ID NO:313的约20、约30、约40个或全部的连续核酸且优选地包括位置102和103的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:313的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置102和103的核酸。
优选地,该包含PTN外显子4(或其等位基因变体)的一部分与NRG1外显子2(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及PTN或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于PTN与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该PTN外显子4(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有PTN的N端和NRG1的C端。此外,本文所提供的PTN-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自PTN的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该PTN-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,特别是腺癌,更特别是胰脏导管腺癌。
ST14-NRG1多核苷酸融合物
也提供了一种包含ST14的外显子11的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。ST14的外显子11优选为SEQ ID NO:342或SEQ ID NO:342的等位基因变体的外显子,而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括ST14外显子11的5’处的任一序列以及NRG1外显子6的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:324和130可能就足够。来自ST14外显子11的5’处的任一序列包含SEQ ID NO:332-341(或SEQ ID NO:332-341的任一等位基因变体)中的任一者或全部,或是由其组成,而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该ST14外显子11的等位基因变体与SEQ ID NO:342有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,ST14的外显子11的部分包含或根据SEQ ID NO:328,且其等位基因变体与SEQ ID NO:328有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与ST14的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:329的序列,且其等位基因变体与SEQ ID NO:329有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,ST14的外显子11的部分包含来自SEQ ID NO:328的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置95的核酸。连续核酸的数目可为SEQ ID NO:328的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置95的核酸。更优选地,ST14的外显子11的部分包含或根据SEQ ID NO:328或其等位基因变体。这类短的多核苷酸序列特别有利于检测ST14与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,ST14外显子11的部分包含SEQ ID NO:342(或SEQ ID NO:342的等位基因变体)或由其组成,至少包括位置131的核酸。优选地,ST14外显子11的部分包含来自SEQID NO:342或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置131的核酸。连续核酸的数目可为SEQ ID NO:342的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置131的核酸。在此替代例中,ST14外显子11的部分更优选地包含或根据SEQ ID NO:342或其等位基因变体。优选地,在与ST14的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
优选地,本文所提供的任一ST14-NRG1多核苷酸融合物为ST14与NRG1的框内融合。更优选地所述融合物为包含ST14的外显子11或外显子6的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:330或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:330有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含ST14外显子11的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:330的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置95和96的核酸。连续核酸的数目可为SEQ ID NO:330的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置95和96的核酸。SEQ IDNO:330包括介于ST14与NRG1之间的接点,尤其该接点介于源于ST14的位置95的核酸与源于NRG1的位置96的核酸之间。优选地,该包含ST14外显子11的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:330的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:330的多核苷酸,或一种包含来自SEQ ID NO:330的约20、约30、约40个或全部的连续核酸且优选地包括位置95和96的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:330的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置95和96的核酸。
优选地,该包含ST14外显子11(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及ST14或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于ST14与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该ST14外显子11(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有ST14的N端和NRG1的C端。此外,本文所提供的ST14-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自ST14的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该ST14-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,特别是腺癌,更特别是胰脏导管腺癌。
THBS1-NRG1多核苷酸融合物
也提供了一种包含THBS1的外显子9的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。THBS1的外显子9优选为SEQ ID NO:386或SEQ ID NO:386的等位基因变体的外显子,而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括THBS1外显子9的5’处的任一序列以及NRG1外显子6的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:386和130可能就足够。来自THBS1外显子9的5’处的任一序列包含SEQ ID NO:378-385(或SEQ ID NO:378-385的任一等位基因变体)中的任一者或全部,或是由其组成,而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该THBS1外显子9的等位基因变体与SEQ ID NO:386有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,THBS1的外显子9的部分包含或根据SEQ ID NO:374,且其等位基因变体与SEQ ID NO:374有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与THBS1的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:375的序列,且其等位基因变体与SEQ ID NO:375有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,THBS1的外显子9的部分包含来自SEQ ID NO:374的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置56的核酸。连续核酸的数目可为SEQ ID NO:374的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置56的核酸。更优选地,THBS1的外显子9的部分包含或根据SEQ ID NO:374或其等位基因变体。这类短的多核苷酸序列特别有利于检测THBS1与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,THBS1外显子9的部分包含SEQ ID NO:386(或SEQ ID NO:386的等位基因变体)或由其组成,至少包括位置177的核酸。优选地,THBS1外显子9的部分包含来自SEQID NO:386或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置177的核酸。连续核酸的数目可为SEQ ID NO:386的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置177的核酸。在此替代例中,THBS1外显子9的部分更优选地包含或根据SEQ ID NO:386或其等位基因变体。优选地,在与THBS1的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
优选地,本文所提供的任一THBS1-NRG1多核苷酸融合物为THBS1与NRG1的框内融合。更优选地所述融合物为包含THBS1的外显子9或外显子6的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:376或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:376有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含THBS1外显子9的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:376的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置56和57的核酸。连续核酸的数目可为SEQ ID NO:376的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置56和57的核酸。SEQ IDNO:376包括介于THBS1与NRG1之间的接点,尤其该接点介于源于THBS1的位置56的核酸与源于NRG1的位置57的核酸之间。优选地,该包含THBS1外显子9的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:376的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:376的多核苷酸,或一种包含来自SEQ ID NO:376的约20、约30、约40个或全部的连续核酸且优选地包括位置56和57的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:376的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置56和57的核酸。
优选地,该包含THBS1外显子9(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及THBS1或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于THBS1与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该THBS1外显子9(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有THBS1的N端和NRG1的C端。此外,本文所提供的THBS1-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自THBS1的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该THBS1-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,特别是腺癌,更特别是胰脏导管腺癌。
AGRN-NRG1多核苷酸融合物
也提供了一种包含AGRN的外显子12的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。AGRN的外显子12优选为SEQ ID NO:416或SEQ ID NO:416的等位基因变体的外显子,而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括AGRN外显子12的5’处的任一序列以及NRG1外显子6的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:416和130可能就足够。来自AGRN外显子12的5’处的任一序列包含SEQ ID NO:405-415(或SEQ ID NO:405-415的任一等位基因变体)中的任一者或全部,或是由其组成,而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该AGRN外显子12的等位基因变体与SEQ ID NO:416有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,AGRN的外显子12的部分包含或根据SEQ ID NO:401,且其等位基因变体与SEQ ID NO:401有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与AGRN的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:402的序列,且其等位基因变体与SEQ ID NO:402有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,AGRN的外显子12的部分包含来自SEQ ID NO:401的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置106的核酸。连续核酸的数目可为SEQ ID NO:401的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置106的核酸。更优选地,AGRN的外显子12的部分包含或根据SEQ ID NO:401或其等位基因变体。这类短的多核苷酸序列特别有利于检测AGRN与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,AGRN外显子12的部分包含SEQ ID NO:416(或SEQ ID NO:416的等位基因变体)或由其组成,至少包括位置106的核酸。优选地,AGRN外显子12的部分包含来自SEQID NO:416或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置106的核酸。连续核酸的数目可为SEQ ID NO:416的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置106的核酸。在此替代例中,AGRN外显子12的部分更优选地包含或根据SEQ ID NO:416或其等位基因变体。优选地,在与AGRN的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
优选地,本文所提供的任一AGRN-NRG1多核苷酸融合物为AGRN与NRG1的框内融合。更优选地所述融合物为包含AGRN的外显子12或外显子12的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:403或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:403有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含AGRN外显子12的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:403的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置106和107的核酸。连续核酸的数目可为SEQ ID NO:403的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置106和107的核酸。SEQID NO:403包括介于AGRN与NRG1之间的接点,尤其该接点介于源于AGRN的位置106的核酸与源于NRG1的位置107的核酸之间。优选地,该包含AGRN外显子12的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:403的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:403的多核苷酸,或一种包含来自SEQ ID NO:403的约20、约30、约40个或全部的连续核酸且优选地包括位置106和107的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:403的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置106和107的核酸。
优选地,该包含AGRN外显子12(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及AGRN或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于AGRN与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该AGRN外显子12(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有AGRN的N端和NRG1的C端。此外,本文所提供的AGRN-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自AGRN的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该AGRN-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,特别是腺癌,更特别是胰脏导管腺癌。
PVALB-NRG1多核苷酸融合物
根据本公开,也提供一种包含PVALB核酸序列(或PVALB核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸。所述融合物中也包括PVALB和NRG1核酸序列的等位基因变体。
优选地,该PVALB核酸序列(或其一部分)包含SEQ ID NO:439-444中的任一者或SEQ ID NO:439-444中的任一者的等位基因变体,或是由其组成,而该NRG1核酸序列(或其一部分)包含SEQ ID NO:125-138中的任一者或SEQ ID NO:125-138中的任一者的等位基因变体,或是由其组成。更优选地,该PVALB核酸序列包含SEQ ID NO:444或SEQ ID NO:444的等位基因变体的一部分,或是由其组成,而该NRG1核酸序列包含SEQ ID NO:138或SEQ IDNO:138的等位基因变体的一部分,或是由其组成。SEQ ID NO:439-443分别对应于根据NM_002854.3的PVALB的个别外显子1-5。SEQ ID NO:444对应于根据NM_002854.3的PVALB的外显子1-5。SEQ ID NO:125-137分别对应于根据NM_001159999的NRG1的个别外显子1-13。SEQID NO:138对应于根据NM_001159999的NRG1的外显子1-13。
在一个优选实施方式中,该PVALB核酸序列部分包含来自SEQ ID NO:439-444中的任一者(或SEQ ID NO:439-444中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,而该NRG1核酸序列部分包含来自SEQ ID NO:125-138中的任一者(或SEQ ID NO:125-138中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸。
也提供了一种包含PVALB的外显子4的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。PVALB的外显子4优选为SEQ ID NO:442或SEQ ID NO:442的等位基因变体的外显子,而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括PVALB外显子4的5’处的任一序列以及NRG1外显子6的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:422和130可能就足够。来自PVALB外显子4的5’处的任一序列包含SEQ ID NO:439-441(或SEQ ID NO:439-441的任一等位基因变体)中的任一者或全部,或是由其组成,而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该PVALB外显子4的等位基因变体与SEQ ID NO:442有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,PVALB的外显子4的部分包含或根据SEQ ID NO:435,且其等位基因变体与SEQ ID NO:435有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与PVALB的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:436的序列,且其等位基因变体与SEQ ID NO:436有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,PVALB的外显子4的部分包含来自SEQ ID NO:435的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置102的核酸。连续核酸的数目可为SEQ ID NO:435的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置102的核酸。更优选地,PVALB的外显子4的部分包含或根据SEQ ID NO:435或其等位基因变体。这类短的多核苷酸序列特别有利于检测PVALB与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,PVALB外显子4的部分包含SEQ ID NO:442(或SEQ ID NO:442的等位基因变体)或由其组成,至少包括位置110的核酸。优选地,PVALB外显子4的部分包含来自SEQID NO:442或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置110的核酸。连续核酸的数目可为SEQ ID NO:442的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置110的核酸。在此替代例中,PVALB外显子4的部分更优选地包含或根据SEQ ID NO:442或其等位基因变体。优选地,在与PVALB的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
优选地,本文所提供的任一PVALB-NRG1多核苷酸融合物为PVALB与NRG1的框内融合。更优选地所述融合物为包含PVALB的外显子4或外显子4的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:437或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:437有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含PVALB外显子4的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:437的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置102和103的核酸。连续核酸的数目可为SEQ ID NO:437的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置102和103的核酸。SEQID NO:437包括介于PVALB与NRG1之间的接点,尤其该接点介于源于PVALB的位置102的核酸与源于NRG1的位置103的核酸之间。优选地,该包含PVALB外显子4的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:437的多核苷酸序列或其等位基因变体。
优选地,该包含PVALB外显子4(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及PVALB或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于PVALB与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该PVALB外显子4(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有PVALB的N端和NRG1的C端。此外,本文所提供的PVALB-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自PVALB的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该PVALB-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,特别是腺癌,更特别是胰脏导管腺癌。
APP-NRG1多核苷酸融合物
也提供了一种包含APP的外显子14的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。APP的外显子14优选为SEQ ID NO:501或SEQ ID NO:501的等位基因变体的外显子,而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括APP外显子14的5’处的任一序列以及NRG1外显子6的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:501和130可能就足够。来自APP外显子14的5’处的任一序列包含SEQ ID NO:488-500(或SEQ ID NO:488-500的任一等位基因变体)中的任一者或全部,或是由其组成,而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该APP外显子14的等位基因变体与SEQ ID NO:501有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,APP的外显子14的部分包含或根据SEQ ID NO:484,且其等位基因变体与SEQ ID NO:484有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与APP的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:485的序列,且其等位基因变体与SEQ ID NO:485有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,APP的外显子14的部分包含来自SEQ ID NO:484的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置54的核酸。连续核酸的数目可为SEQID NO:484的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置54的核酸。更优选地,APP的外显子14的部分包含或根据SEQ ID NO:484或其等位基因变体。这类短的多核苷酸序列特别有利于检测APP与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,APP外显子14的部分包含SEQ ID NO:501(或SEQ ID NO:501的等位基因变体)或由其组成,至少包括位置54的核酸。优选地,APP外显子14的部分包含来自SEQ IDNO:501或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置54的核酸。连续核酸的数目可为SEQ ID NO:501的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置54的核酸。在此替代例中,APP外显子14的部分更优选地包含或根据SEQ ID NO:501或其等位基因变体。优选地,在与APP的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
优选地,本文所提供的任一APP-NRG1多核苷酸融合物为APP与NRG1的框内融合。更优选地所述融合物为包含APP的外显子14或外显子14的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:486或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:486有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含APP外显子14的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:486的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置54和55的核酸。连续核酸的数目可为SEQ ID NO:486的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置54和55的核酸。SEQ IDNO:486包括介于APP与NRG1之间的接点,尤其该接点介于源于APP的位置54的核酸与源于NRG1的位置54的核酸之间。优选地,该包含APP外显子14的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:486的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:486的多核苷酸,或一种包含来自SEQ ID NO:486的约20、约30、约40个或全部的连续核酸且优选地包括位置54和55的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:486的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置54和55的核酸。
优选地,该包含APP外显子14(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及APP或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于APP与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该APP外显子14(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有APP的N端和NRG1的C端。此外,本文所提供的APP-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自APP的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该APP-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,特别是腺癌,更特别是胰脏导管腺癌。
WRN-NRG1多核苷酸融合物
也提供了一种包含WRN的外显子33的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。WRN的外显子33优选为SEQ ID NO:562或SEQ ID NO:562的等位基因变体的外显子,而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括WRN外显子33的5’处的任一序列以及NRG1外显子6的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:562和130可能就足够。来自WRN外显子33的5’处的任一序列包含SEQ ID NO:530-561(或SEQ ID NO:530-561的任一等位基因变体)中的任一者或全部,或是由其组成,而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该WRN外显子33的等位基因变体与SEQ ID NO:562有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,WRN的外显子33的部分包含或根据SEQ ID NO:526,且其等位基因变体与SEQ ID NO:526有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与WRN的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:527的序列,且其等位基因变体与SEQ ID NO:527有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,WRN的外显子33的部分包含来自SEQ ID NO:526的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置96的核酸。连续核酸的数目可为SEQID NO:526的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置96的核酸。更优选地,WRN的外显子33的部分包含或根据SEQ ID NO:526或其等位基因变体。这类短的多核苷酸序列特别有利于检测WRN与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,WRN外显子33的部分包含SEQ ID NO:562(或SEQ ID NO:562的等位基因变体)或由其组成,至少包括位置163的核酸。优选地,WRN外显子33的部分包含来自SEQ IDNO:562或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置163的核酸。连续核酸的数目可为SEQ ID NO:562的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置163的核酸。在此替代例中,WRN外显子33的部分更优选地包含或根据SEQ ID NO:562或其等位基因变体。优选地,在与WRN的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
优选地,本文所提供的任一WRN-NRG1多核苷酸融合物为WRN与NRG1的框内融合。更优选地所述融合物为包含WRN的外显子33或外显子33的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:528或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:528有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含WRN外显子33的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:528的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置96和97的核酸。连续核酸的数目可为SEQ ID NO:528的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置96和97的核酸。SEQ IDNO:528包括介于WRN与NRG1之间的接点,尤其该接点介于源于WRN的位置96的核酸与源于NRG1的位置97的核酸之间。优选地,该包含WRN外显子33的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:528的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:528的多核苷酸,或一种包含来自SEQ ID NO:528的约20、约30、约40个或全部的连续核酸且优选地包括位置96和97的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:528的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置96和97的核酸。
优选地,该包含WRN外显子33(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及WRN或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于WRN与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该WRN外显子33(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有WRN的N端和NRG1的C端。此外,本文所提供的WRN-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自WRN的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该WRN-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,特别是乳癌。
DAAM1-NRG1多核苷酸融合物
根据本公开,也提供一种包含DAAM1核酸序列(或DAAM1核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸。所述融合物中也包括DAAM1和NRG1核酸序列的等位基因变体。
优选地,该DAAM1核酸序列(或其一部分)包含SEQ ID NO:606-631中的任一者或SEQ ID NO:606-631中的任一者的等位基因变体,或是由其组成,而该NRG1核酸序列(或其一部分)包含SEQ ID NO:125-138中的任一者或SEQ ID NO:125-138中的任一者的等位基因变体,或是由其组成。更优选地,该DAAM1核酸序列包含SEQ ID NO:631或SEQ ID NO:631的等位基因变体的一部分,或是由其组成,而该NRG1核酸序列包含SEQ ID NO:138或SEQ IDNO:138的等位基因变体的一部分,或是由其组成。SEQ ID NO:606-630分别对应于根据NM_001270520.2的DAAM1的个别外显子1-25。SEQ ID NO:631对应于根据NM_001270520.2的DAAM1的外显子1-25。SEQ ID NO:125-137分别对应于根据NM_001159999.3的NRG1的个别外显子1-13。SEQ ID NO:138对应于根据NM_001159999.3的NRG1的外显子1-13。
在一个优选实施方式中,该DAAM1核酸序列部分包含来自SEQ ID NO:606-631中的任一者(或SEQ ID NO:606-631中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,而该NRG1核酸序列部分包含来自SEQ ID NO:125-138中的任一者(或SEQ ID NO:125-138中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸。
优选地,该DAAM1核酸序列的等位基因变体与SEQ ID NO:606-631中的任一者有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性;且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该DAAM1核酸序列或其一部分位于NRG1核酸序列或其一部分的5’处。
优选地,该包含DAAM1的DAAM1核酸序列(或所述序列的一部分)与NRG1核酸序列(或所述序列的一部分)融合的多核苷酸包含或编码NRG1的EGF样结构域。包含该DAAM1-NRG1多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了检测、诊断或鉴定的目的,只需证明介于DAAM1与NRG1之间的融合接点是框内的并且发生在可使得所得融合核酸编码NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
也提供了一种包含DAAM1的外显子1的一部分与NRG1的外显子1的一部分融合的多核苷酸融合物。DAAM1的外显子1优选为SEQ ID NO:606或SEQ ID NO:606的等位基因变体的外显子,而NRG1的外显子1优选为SEQ ID NO:125或SEQ ID NO:125的等位基因变体的外显子。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括DAAM1外显子1的5’处的任一序列以及NRG1外显子1的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:606及125可能就足够。来自DAAM1外显子1的5’处的任一序列包含SEQ ID NO:606(或SEQ ID NO:606的任一等位基因变体)或是由其组成,而来自NRG1外显子1的3’处的任一序列包含SEQ ID NO:126-137(或SEQ ID NO:126-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该DAAM1外显子1的等位基因变体与SEQ ID NO:606有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子1的等位基因变体与SEQ ID NO:125有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,DAAM1的外显子1的部分包含或根据SEQ ID NO:603,且其等位基因变体与SEQ ID NO:603有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与DAAM1的融合物中的NRG1的外显子1的部分优选是或包含如SEQ ID NO:604的序列,且其等位基因变体与SEQ ID NO:604有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,DAAM1的外显子1的部分包含来自SEQ ID NO:603的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置75的核酸。连续核酸的数目可为SEQ ID NO:603的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75的核酸。更优选地,DAAM1的外显子1的部分包含或根据SEQ ID NO:603或其等位基因变体。这类短的多核苷酸序列特别有利于检测DAAM1与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,DAAM1外显子1的部分包含SEQ ID NO:606(或SEQ ID NO:606的等位基因变体)或由其组成,至少包括位置102的核酸。优选地,DAAM1外显子1的部分包含来自SEQID NO:606或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置102的核酸。连续核酸的数目可为SEQ ID NO:606的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置102的核酸。在此替代例中,DAAM1外显子1的部分更优选地包含或根据SEQ ID NO:606或其等位基因变体。优选地,在与DAAM1的融合物中的NRG1外显子1的部分包含来自SEQ ID NO:125或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:125的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
在一个替代性优选实施方式中,该包含DAAM1外显子1的一部分与NRG1外显子1的一部分融合的多核苷酸包含来自SEQ ID NO:605的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置75和76的核酸。连续核酸的数目可为SEQ ID NO:605的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75和76的核酸。SEQ IDNO:605包括介于DAAM1与NRG1之间的接点,尤其该接点介于源于DAAM1的位置75的核酸与源于NRG1的位置76的核酸之间。优选地,该包含DAAM1外显子1的一部分与NRG1外显子1的一部分融合的多核苷酸具有SEQ ID NO:605的多核苷酸序列或其等位基因变体。
优选地,本文提供的任一DAAM1-NRG1多核苷酸融合物为DAAM1的未翻译区域的一部分与NRG1的未翻译区域的一部分的融合物。更优选地,所述融合物为一种包含DAAM1的外显子1(或外显子1的一部分)与NRG1的外显子1(或NRG1外显子1的一部分)的融合物。所述融合物优选为SEQ ID NO:605或其等位基因变体的融合物,且与SEQ ID NO:605有至少85%的一致性,优选地与其至少90%、92%、94%、96%或甚至98%的一致性。
优选地,DAAM1外显子1(或其等位基因变体)的部分位于NRG1外显子1(或其等位基因变体)的5’处。该NRG1蛋白因而变成了位于DAAM1启动子的下游并且期望能在转录上受所述启动子的控制。所得融合物因而导致非蛋白质融合的NRG1蛋白质表达,且因此含有EGF样结构域。随之而来的是驱动一小群人类癌症增生及存活的能力,特别是乳癌。
ASPH-NRG1多核苷酸融合物
根据本公开,也提供一种包含ASPH核酸序列(或ASPH核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸。所述融合物中也包括ASPH和NRG1核酸序列的等位基因变体。
优选地,该ASPH核酸序列(或其一部分)包含SEQ ID NO:637-662中的任一者或SEQID NO:637-662中的任一者的等位基因变体,或是由其组成,而该NRG1核酸序列(或其一部分)包含SEQ ID NO:125-138中的任一者或SEQ ID NO:125-138中的任一者的等位基因变体,或是由其组成。更优选地,该ASPH核酸序列包含SEQ ID NO:662或SEQ ID NO:662的等位基因变体的一部分,或是由其组成,而该NRG1核酸序列包含SEQ ID NO:138或SEQ ID NO:138的等位基因变体的一部分,或是由其组成。SEQ ID NO:637-661分别对应于根据NM_001164750.2的ASPH的个别外显子1-25。SEQ ID NO:662对应于根据NM_001164750.2的ASPH的外显子1-25。SEQ ID NO:125-137分别对应于根据NM_001159999.3的NRG1的个别外显子1-13。SEQ ID NO:138对应于根据NM_001159999.3的NRG1的外显子1-13。
在一个优选实施方式中,该ASPH核酸序列部分包含来自SEQ ID NO:637-662中的任一者(或SEQ ID NO:637-662中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,而该NRG1核酸序列部分包含来自SEQ ID NO:125-138中的任一者(或SEQ ID NO:125-138中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸。
优选地,该ASPH核酸序列的等位基因变体与SEQ ID NO:637-662中的任一者有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性;且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该ASPH核酸序列或其一部分位于NRG1核酸序列或其一部分的5’处。
优选地,该包含ASPH的ASPH核酸序列(或所述序列的一部分)与NRG1核酸序列(或所述序列的一部分)融合的多核苷酸包含或编码NRG1的EGF样结构域。包含该ASPH-NRG1多核苷酸融合物或表达该多肽融合物的异常细胞包含或编码NRG1的EGF样结构域。为了检测、诊断或鉴定的目的,只需证明介于ASPH与NRG1之间的融合接点是框内的并且发生在可使得所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
也提供了一种包含ASPH的外显子22的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。ASPH的外显子22优选为SEQ ID NO:658或SEQ ID NO:658的等位基因变体的外显子,而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括ASPH外显子22的5’处的任一序列以及NRG1外显子2的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:658和126可能就足够。来自ASPH外显子22的5’处的任一序列包含SEQ ID NO:637-657(或SEQ ID NO:637-657的任一等位基因变体)中的一者或全部,而来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该ASPH外显子22的等位基因变体与SEQ ID NO:658有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,ASPH的外显子22的部分包含或根据SEQ ID NO:633,且其等位基因变体与SEQ ID NO:633有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与ASPH的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:634的序列,且其等位基因变体与SEQ ID NO:634有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,ASPH的外显子22的部分包含来自SEQ ID NO:633的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置75的核酸。连续核酸的数目可为SEQ ID NO:633的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75的核酸。更优选地,ASPH的外显子22的部分包含或根据SEQ ID NO:633或其等位基因变体。这类短的多核苷酸序列特别有利于检测ASPH与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,ASPH外显子22的部分包含SEQ ID NO:658(或SEQ ID NO:658的等位基因变体)或由其组成,至少包括位置136的核酸。优选地,ASPH外显子22的部分包含来自SEQID NO:658或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置136的核酸。连续核酸的数目可为SEQ ID NO:658的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置136的核酸。在此替代例中,ASPH外显子22的部分更优选地包含或根据SEQ ID NO:658或其等位基因变体。优选地,在与ASPH的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
在一个替代性优选实施方式中,该包含ASPH外显子22的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:635的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置75和76的核酸。连续核酸的数目可为SEQ ID NO:635的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75和76的核酸。SEQ IDNO:635包括介于ASPH与NRG1之间的接点,尤其该接点介于源于ASPH的位置75的核酸与源于NRG1的位置76的核酸之间。优选地,该包含ASPH外显子22的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:635的多核苷酸序列或其等位基因变体。
优选地,本文所提供的任一ASPH-NRG1多核苷酸融合物为ASPH与NRG1的框内融合。更优选地所述融合物为包含ASPH的外显子22或外显子22的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:635或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:635有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
优选地,ASPH外显子2(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有ASPH的N端和NRG1的C端。此外,本文所提供的ASPH-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自ASPH的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该ASPH-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,特别是腺癌,更特别是大肠直肠腺癌。
NOTCH2-NRG1多核苷酸融合物
也提供了一种包含NOTCH2的外显子6的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。NOTCH2的外显子6优选为SEQ ID NO:700或SEQ ID NO:700的等位基因变体的外显子,而NRG1的外显子1优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括NOTCH2外显子6的5’处的任一序列以及NRG1外显子6的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:700和130可能就足够。来自NOTCH2外显子6的5’处的任一序列包含SEQ ID NO:695-699(或SEQ ID NO:695-699的任一等位基因变体)中的一者或全部,或是由其组成,而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该NOTCH2外显子6的等位基因变体与SEQ ID NO:700有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,NOTCH2的外显子6的部分包含或根据SEQ ID NO:691,且其等位基因变体与SEQ ID NO:691有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与NOTCH2的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:692的序列,且其等位基因变体与SEQ ID NO:692有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,NOTCH2的外显子6的部分包含来自SEQ ID NO:691的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置75的核酸。连续核酸的数目可为SEQ ID NO:691的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75的核酸。更优选地,NOTCH2的外显子6的部分包含或根据SEQ ID NO:691或其等位基因变体。这类短的多核苷酸序列特别有利于检测NOTCH2与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,NOTCH2外显子6的部分包含SEQ ID NO:700(或SEQ ID NO:700的等位基因变体)或由其组成,至少包括位置234的核酸。优选地,NOTCH2外显子6的部分包含来自SEQID NO:700或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置234的核酸。连续核酸的数目可为SEQ ID NO:700的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置234的核酸。在此替代例中,NOTCH2外显子6的部分更优选地包含或根据SEQ ID NO:700或其等位基因变体。优选地,在与NOTCH2的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
优选地,本文所提供的任一NOTCH2-NRG1多核苷酸融合物为NOTCH2与NRG1的框内融合。更优选地所述融合物为包含NOTCH2的外显子6或外显子6的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:693或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:693有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含NOTCH2外显子6的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:693的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置75和76的核酸。连续核酸的数目可为SEQ ID NO:693的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75和76的核酸。SEQ IDNO:693包括介于NOTCH2与NRG1之间的接点,尤其该接点介于源于NOTCH2的位置75的核酸与源于NRG1的位置76的核酸之间。优选地,该包含NOTCH2外显子6的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:693的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:693的多核苷酸,或一种包含来自SEQ ID NO:693的约20、约30、约40个或全部的连续核酸且优选地包括位置75和76的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:693的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置75和76的核酸。
优选地,该包含NOTCH2外显子6(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及NOTCH2或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于NOTCH2与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该NOTCH2外显子6(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有NOTCH2的N端和NRG1的C端。此外,本文所提供的NOTCH2-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自NOTCH2的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该NOTCH2-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,特别是腺癌,更特别是胰脏导管腺癌。
CD74-NRG1多核苷酸融合物
也提供了一种包含CD74的外显子2的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。CD74的外显子2优选为SEQ ID NO:720或SEQ ID NO:720的等位基因变体的外显子,而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括CD74外显子2的5’处的任一序列以及NRG1外显子2的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:720和126可能就足够。来自CD74外显子2的5’处的任一序列包含SEQ ID NO:719(或SEQ ID NO:719的任一等位基因变体)或是由其组成,而来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该CD74外显子2的等位基因变体与SEQ ID NO:720有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,CD74的外显子2的部分包含或根据SEQ ID NO:715,且其等位基因变体与SEQ ID NO:715有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与CD74的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:716的序列,且其等位基因变体与SEQ ID NO:716有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,CD74的外显子2的部分包含来自SEQ ID NO:715的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置75的核酸。连续核酸的数目可为SEQID NO:715的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75的核酸。更优选地,CD74的外显子2的部分包含或根据SEQ ID NO:715或其等位基因变体。这类短的多核苷酸序列特别有利于检测CD74与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,CD74外显子2的部分包含SEQ ID NO:720(或SEQ ID NO:720的等位基因变体)或由其组成,至少包括位置173的核酸。优选地,CD74外显子2的部分包含来自SEQ IDNO:720或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置173的核酸。连续核酸的数目可为SEQ ID NO:720的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置173的核酸。在此替代例中,CD74外显子2的部分更优选地包含或根据SEQ ID NO:720或其等位基因变体。优选地,在与CD74的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
优选地,本文所提供的任一CD74-NRG1多核苷酸融合物为CD74与NRG1的框内融合。更优选地所述融合物为包含CD74的外显子2或外显子2的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:717或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:717有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含CD74外显子2的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:717的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置53和54的核酸。连续核酸的数目可为SEQ ID NO:7的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75和76的核酸。SEQ ID NO:717包括介于CD74与NRG1之间的接点,尤其该接点介于源于CD74的位置75的核酸与源于NRG1的位置76的核酸之间。优选地,该包含CD74外显子2的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:717的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:717的多核苷酸,或一种包含来自SEQ ID NO:717的约20、约30、约40个或全部的连续核酸且优选地包括位置75和76的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:717的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置75和76的核酸。
优选地,该包含CD74外显子2(或其等位基因变体)的一部分与NRG1外显子2(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及CD74或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于CD74与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该CD74外显子2(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有CD74的N端和NRG1的C端。此外,本文所提供的CD74-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自CD74的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该CD74-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,特别是肺癌。
SDC4-NRG1多核苷酸融合物
也提供了一种包含SDC4的外显子2的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。所述SDC4的外显子2优选为SEQ ID NO:746或SEQ ID NO:746的等位基因变体的外显子,而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。
优选地,所述SDC4外显子2的等位基因变体与SEQ ID NO:746有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,所述SDC4的外显子2的部分包含或根据SEQ ID NO:741,且其等位基因变体与SEQ ID NO:741有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与SDC4的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:742的序列,且其等位基因变体与SEQ ID NO:742有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,SDC4的外显子2的部分包含来自SEQ ID NO:741的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置75的核酸。连续核酸的数目可为SEQ ID NO:741的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75的核酸。更优选地,所述SDC4的外显子2的部分包含或根据SEQ ID NO:741或其等位基因变体。这类短的多核苷酸序列特别有利于检测SDC4与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,所述SDC4外显子2的部分包含SEQ ID NO:746(或SEQ ID NO:746的等位基因变体)或由其组成,至少包括位置139的核酸。优选地,所述SDC4外显子2的部分包含来自SEQ ID NO:746或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置139的核酸。连续核酸的数目可为SEQ ID NO:746的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置139的核酸。在此替代例中,SDC4外显子2的部分更优选地包含或根据SEQ ID NO:746或其等位基因变体。优选地,在与SDC4的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
优选地,本文所提供的任一SDC4-NRG1多核苷酸融合物为SDC4与NRG1的框内融合。更优选地所述融合物为包含SDC4的外显子2或外显子2的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:743或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:743有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含所述SDC4外显子2的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:743的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置75和76的核酸。连续核酸的数目可为SEQ ID NO:743的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75和76的核酸。SEQ IDNO:743包括介于SDC4与NRG1之间的接点,尤其该接点介于源于SDC4的位置75的核酸与源于NRG1的位置76的核酸之间。优选地,该包含SDC4外显子2的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:743的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:743的多核苷酸,或一种包含来自SEQ ID NO:743的约20、约30、约40个或全部的连续核酸且优选地包括位置75和76的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:743的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置75和76的核酸。
优选地,该包含SDC4外显子2(或其等位基因变体)的一部分与NRG1外显子2(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及所述SDC4或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于SDC4与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该SDC4外显子2(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有SDC4的N端和NRG1的C端。此外,本文所提供的SDC4-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自SDC4的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该SDC4-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,特别是肺癌。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括SDC4外显子2的5’处的任一序列以及NRG1外显子2的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:746和126可能就足够。来自SDC4外显子2的5’处的任一序列包含SEQ ID NO:745(或SEQ ID NO:745的任一等位基因变体)或是由其组成,而来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部,或是由其组成。
进一步地,提供了一种包含SDC4的外显子4的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。所述SDC4的外显子4优选为SEQ ID NO:748或SEQ ID NO:748的等位基因变体的外显子,而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。
优选地,所述SDC4外显子4的等位基因变体与SEQ ID NO:748有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,所述SDC4的外显子4的部分包含或根据SEQ ID NO:822,且其等位基因变体与SEQ ID NO:822有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与SDC4的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:823的序列,且其等位基因变体与SEQ ID NO:823有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,SDC4的外显子4的部分包含来自SEQ ID NO:822的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置75的核酸。连续核酸的数目可为SEQ ID NO:822的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75的核酸。更优选地,所述SDC4的外显子4的部分包含或根据SEQ ID NO:822或其等位基因变体。这类短的多核苷酸序列特别有利于检测SDC4与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,所述SDC4外显子4的部分包含SEQ ID NO:748(或SEQ ID NO:748的等位基因变体)或由其组成,至少包括位置199的核酸。优选地,所述SDC4外显子4的部分包含来自SEQ ID NO:748或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置199的核酸。连续核酸的数目可为SEQ ID NO:748的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置199的核酸。在此替代例中,SDC4外显子4的部分更优选地包含或根据SEQ ID NO:748或其等位基因变体。优选地,在与SDC4的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
优选地,本文所提供的任一SDC4-NRG1多核苷酸融合物为SDC4与NRG1的框内融合。更优选地所述融合物为包含SDC4的外显子4或外显子4的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:824或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:824有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含所述SDC4外显子4的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:824的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置75和76的核酸。连续核酸的数目可为SEQ ID NO:824的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75和76的核酸。SEQ IDNO:824包括介于SDC4与NRG1之间的接点,尤其该接点介于源于SDC4的位置75的核酸与源于NRG1的位置76的核酸之间。优选地,该包含SDC4外显子4的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:824的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:824的多核苷酸,或一种包含来自SEQ ID NO:824的约20、约30、约40个或全部的连续核酸且优选地包括位置53和54的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:824的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置75和76的核酸。
优选地,该包含SDC4外显子4(或其等位基因变体)的一部分与NRG1外显子2(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及所述SDC4或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于SDC4与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该SDC4外显子4(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有SDC4的N端和NRG1的C端。此外,本文所提供的SDC4-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自SDC4的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该SDC4-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,包括肺癌,特别是非小细胞肺癌。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括SDC4外显子4的5’处的任一序列以及NRG1外显子2的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:748和126可能就足够。来自SDC4外显子4的5’处的任一序列包含SEQ ID NO:745-747(或SEQ ID NO:745-747的任一等位基因变体)中的一者或全部,或是由其组成,而来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部,或是由其组成。
SLC4A4-NRG1多核苷酸融合物
也提供了一种包含SLC4A4的外显子14的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。SLC4A4的外显子14优选为SEQ ID NO:780或SEQ ID NO:780的等位基因变体的外显子,而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括SLC4A4外显子14的5’处的任一序列以及NRG1外显子6的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:780和130可能就足够。来自SLC4A4外显子14的5’处的任一序列包含SEQ ID NO:767-779(或SEQ ID NO:767-779的任一等位基因变体)中的一者或全部,或是由其组成,而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该SLC4A4外显子14的等位基因变体与SEQ ID NO:780有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,SLC4A4的外显子14的部分包含或根据SEQ ID NO:763,且其等位基因变体与SEQ ID NO:763有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与SLC4A4的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:764的序列,且其等位基因变体与SEQ ID NO:764有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,SLC4A4的外显子14的部分包含来自SEQ ID NO:763的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置75的核酸。连续核酸的数目可为SEQ ID NO:763的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75的核酸。更优选地,SLC4A4的外显子14的部分包含或根据SEQ ID NO:763或其等位基因变体。这类短的多核苷酸序列特别有利于检测SLC4A4与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,SLC4A4外显子14的部分包含SEQ ID NO:780(或SEQ ID NO:780的等位基因变体)或由其组成,至少包括位置272的核酸。优选地,SLC4A4外显子14的部分包含来自SEQ ID NO:780或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置272的核酸。连续核酸的数目可为SEQ ID NO:780的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置272的核酸。在此替代例中,SLC4A4外显子14的部分更优选地包含或根据SEQ ID NO:780或其等位基因变体。优选地,在与SLC4A4的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
优选地,本文所提供的任一SLC4A4-NRG1多核苷酸融合物为SLC4A4与NRG1的框内融合。更优选地所述融合物为包含SLC4A4的外显子14或外显子14的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:765或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:765有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
在一个替代性优选实施方式中,该包含SLC4A4外显子14的一部分与NRG1外显子6的一部分融合的多核苷酸包含来自SEQ ID NO:765的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置75和76的核酸。连续核酸的数目可为SEQ ID NO:765的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75和76的核酸。SEQ IDNO:765包括介于SLC4A4与NRG1之间的接点,尤其该接点介于源于SLC4A4的位置75的核酸与源于NRG1的位置76的核酸之间。优选地,该包含SLC4A4外显子14的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:765的多核苷酸序列或其等位基因变体。
在一个优选实施方式中,提供了一种根据SEQ ID NO:765的多核苷酸,或一种包含来自SEQ ID NO:765的约20、约30、约40个或全部的连续核酸且优选地包括位置75和76的核酸的多核苷酸。连续核酸的数目可为SEQ ID NO:765的18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且优选地至少包括位置75和76的核酸。
优选地,该包含SLC4A4外显子14(或其等位基因变体)的一部分与NRG1外显子6(或其等位基因变体)的一部分融合的多核苷酸是一种进一步包含或编码NRG1的EGF样结构域的较长多核苷酸的一部分。包含涉及SLC4A4或表达该多肽融合物的多核苷酸融合物的异常细胞包含或编码NRG1的EGF样结构域。为了快速检测、诊断或鉴定的目的,只需证明介于SLC4A4与NRG1之间的融合接点是框内的并且发生在所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该SLC4A4外显子14(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有SLC4A4的N端和NRG1的C端。此外,本文所提供的SLC4A4-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自SLC4A4的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该SLC4A4-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,特别是胰脏癌。
ZFAT-NRG1多核苷酸融合物
根据本公开,也提供一种包含ZFAT核酸序列(或ZFAT核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸。所述融合物中也包括ZFAT和NRG1核酸序列的等位基因变体。
优选地,该ZFAT核酸序列(或其一部分)包含SEQ ID NO:830-846中的任一者或SEQID NO:830-846中的任一者的等位基因变体,或是由其组成,而该NRG1核酸序列(或其一部分)包含SEQ ID NO:125-138中的任一者或SEQ ID NO:125-138中的任一者的等位基因变体,或是由其组成。更优选地,该ZFAT核酸序列包含SEQ ID NO:846或SEQ ID NO:846的等位基因变体的一部分,或是由其组成,而该NRG1核酸序列包含SEQ ID NO:138或SEQ ID NO:138的等位基因变体的一部分,或是由其组成。SEQ ID NO:830-845分别对应于根据NM_020863.4的ZFAT的个别外显子1-16。SEQ ID NO:846对应于根据NM_020863.4的ZFAT的外显子1-16。SEQ ID NO:125-137分别对应于根据NM_001159999.3的NRG1的个别外显子1-13。SEQ ID NO:138对应于根据NM_001159999.3的NRG1的外显子1-13。
在一个优选实施方式中,该ZFAT核酸序列部分包含来自SEQ ID NO:830-846中的任一者(或SEQ ID NO:830-846中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,而该NRG1核酸序列部分包含来自SEQ ID NO:125-138中的任一者(或SEQ ID NO:125-138中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸。
优选地,该ZFAT核酸序列的等位基因变体与SEQ ID NO:830-846中的任一者有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性;且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该ZFAT核酸序列或其一部分位于NRG1核酸序列或其一部分的5’处。
优选地,该包含ZFAT的ZFAT核酸序列(或所述序列的一部分)与NRG1核酸序列(或所述序列的一部分)融合的多核苷酸包含或编码NRG1的EGF样结构域。
包含该ZFAT-NRG1多核苷酸融合物或表达该多肽融合物的异常细胞包含或编码NRG1的EGF样结构域。为了检测、诊断或鉴定的目的,只需证明介于ZFAT与NRG1之间的融合接点是框内的并且发生在可使得所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
也提供了一种包含ZFAT的外显子12的一部分与NRG1的外显子6的一部分融合的多核苷酸融合物。ZFAT的外显子12优选为SEQ ID NO:841或SEQ ID NO:841的等位基因变体的外显子,而NRG1的外显子6优选为SEQ ID NO:130或SEQ ID NO:130的等位基因变体的外显子。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括ZFAT外显子12的5’处的任一序列以及NRG1外显子6的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:841和130可能就足够。来自ZFAT外显子12的5’处的任一序列包含SEQ ID NO:830-840(或SEQ ID NO:830-840的任一等位基因变体)中的一者或全部,或是由其组成,而来自NRG1外显子6的3’处的任一序列包含SEQ ID NO:131-137(或SEQ ID NO:131-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该ZFAT外显子12的等位基因变体与SEQ ID NO:841有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子6的等位基因变体与SEQ ID NO:130有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,ZFAT的外显子12的部分包含或根据SEQ ID NO:826,且其等位基因变体与SEQ ID NO:826有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与ZFAT的融合物中的NRG1的外显子6的部分优选是或包含如SEQ ID NO:827的序列,且其等位基因变体与SEQ ID NO:827有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,ZFAT的外显子12的部分包含来自SEQ ID NO:826的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置75的核酸。连续核酸的数目可为SEQ ID NO:826的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75的核酸。更优选地,ZFAT的外显子12的部分包含或根据SEQ ID NO:826或其等位基因变体。这类短的多核苷酸序列特别有利于检测ZFAT与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,ZFAT外显子12的部分包含SEQ ID NO:841(或SEQ ID NO:841的等位基因变体)或由其组成,至少包括位置139的核酸。优选地,ZFAT外显子12的部分包含来自SEQID NO:841或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置139的核酸。连续核酸的数目可为SEQ ID NO:841的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置139的核酸。在此替代例中,ZFAT外显子12的部分更优选地包含或根据SEQ ID NO:841或其等位基因变体。优选地,在与ZFAT的融合物中的NRG1外显子6的部分包含来自SEQ ID NO:130或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:130的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
在一个替代性优选实施方式中,该包含ZFAT外显子12的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:828的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置75和76的核酸。连续核酸的数目可为SEQ ID NO:828的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75和76的核酸。SEQ IDNO:828包括介于ZFAT与NRG1之间的接点,尤其该接点介于源于ZFAT的位置75的核酸与源于NRG1的位置76的核酸之间。优选地,该包含ZFAT外显子12的一部分与NRG1外显子6的一部分融合的多核苷酸具有SEQ ID NO:828的多核苷酸序列或其等位基因变体。
优选地,本文所提供的任一ZFAT-NRG1多核苷酸融合物为ZFAT与NRG1的框内融合。更优选地所述融合物为包含ZFAT的外显子12或外显子12的一部分以及NRG1的外显子6或外显子6的一部分的框内融合。所述框内融合优选为SEQ ID NO:828或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:828有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
优选地,该ZFAT外显子12(或其等位基因变体)的部分位于NRG1外显子6(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有ZFAT的N端和NRG1的C端。此外,本文所提供的ZFAT-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自ZFAT的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该ZFAT-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,特别是非小细胞肺癌。
DSCAML1-NRG1多核苷酸融合物
根据本公开,也提供一种包含DSCAML1核酸序列(或DSCAML1核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸。所述融合物中也包括DSCAML1和NRG1核酸序列的等位基因变体。
优选地,该DSCAML1核酸序列(或其一部分)包含SEQ ID NO:870-903中的任一者或SEQ ID NO:870-903中的任一者的等位基因变体,或是由其组成,而该NRG1核酸序列(或其一部分)包含SEQ ID NO:125-138中的任一者或SEQ ID NO:125-138中的任一者的等位基因变体,或是由其组成。更优选地,该DSCAML1核酸序列包含SEQ ID NO:903或SEQ ID NO:903的等位基因变体的一部分,或是由其组成,而该NRG1核酸序列包含SEQ ID NO:138或SEQ IDNO:138的等位基因变体的一部分,或是由其组成。SEQ ID NO:870-902分别对应于根据NM_020693.4的DSCAML1的个别外显子1-33。SEQ ID NO:903对应于根据NM_020693.4的DSCAML1的外显子1-33。SEQ ID NO:125-137分别对应于根据NM_001159999.3的NRG1的个别外显子1-13。SEQ ID NO:138对应于根据NM_001159999.3的NRG1的外显子1-13。
在一个优选实施方式中,该DSCAML1核酸序列部分包含来自SEQ ID NO:870-903中的任一者(或SEQ ID NO:870-903中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,而该NRG1核酸序列部分包含来自SEQ ID NO:125-138中的任一者(或SEQ ID NO:125-138中的任一者的等位基因变体)的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸。
优选地,该DSCAML1核酸序列的等位基因变体与SEQ ID NO:870-903中的任一者有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性;且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,该DSCAML1核酸序列或其一部分位于NRG1核酸序列或其一部分的5’处。
优选地,该包含DSCAML1的DSCAML1核酸序列(或所述序列的一部分)与NRG1核酸序列(或所述序列的一部分)融合的多核苷酸包含或编码NRG1的EGF样结构域。
包含该DSCAML1-NRG1多核苷酸融合物或表达该多肽融合物的异常细胞包含或编码NRG1的EGF样结构域。为了检测、诊断或鉴定的目的,只需证明介于DSCAML1与NRG1之间的融合接点是框内的并且发生在可使得所得融合产物、核酸或蛋白质包含NRG1的EGF样结构域的位置即可。所述EGF样结构域优选为根据SEQ ID NO:163或其等位基因变体的EGF样结构域并与SEQ ID NO:163有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
也提供了一种包含DSCAML1的外显子3的一部分与NRG1的外显子2的一部分融合的多核苷酸融合物。DSCAML1的外显子3优选为SEQ ID NO:872或SEQ ID NO:872的等位基因变体的外显子,而NRG1的外显子2优选为SEQ ID NO:126或SEQ ID NO:126的等位基因变体的外显子。
当存在于患者或受试者的异常细胞中时,所述多核苷酸融合物优选地进一步包括DSCAML1外显子3的5’处的任一序列以及NRG1外显子2的3’处的任一序列,但为了能使用以多核苷酸为基础的检测测定法来检测融合接点,至少存在SEQ ID NO:872和126可能就足够。来自DSCAML1外显子3的5’处的任一序列包含SEQ ID NO:870-871(或SEQ ID NO:870-871的任一等位基因变体)中的一者或全部,或是由其组成,而来自NRG1外显子2的3’处的任一序列包含SEQ ID NO:127-137(或SEQ ID NO:127-137的任一等位基因变体)中的一者或全部,或是由其组成。
优选地,该DSCAML1外显子3的等位基因变体与SEQ ID NO:872有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性,而该NRG1外显子2的等位基因变体与SEQ ID NO:126有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,DSCAML1的外显子3的部分包含或根据SEQ ID NO:866,且其等位基因变体与SEQ ID NO:866有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在与DSCAML1的融合物中的NRG1的外显子2的部分优选是或包含如SEQ ID NO:867的序列,且其等位基因变体与SEQ ID NO:867有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。更优选地,DSCAML1的外显子3的部分包含来自SEQ ID NO:866的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置75的核酸。连续核酸的数目可为SEQ ID NO:826的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75的核酸。更优选地,DSCAML1的外显子3的部分包含或根据SEQ ID NO:866或其等位基因变体。这类短的多核苷酸序列特别有利于检测DSCAML1与NRG1之间是否存在有较大的多核苷酸融合物并确定这类融合物是否为包含NRG1的EGF样结构域的框内的致癌性融合物。
替代性地,DSCAML1外显子3的部分包含SEQ ID NO:872(或SEQ ID NO:872的等位基因变体)或由其组成,至少包括位置147的核酸。优选地,DSCAML1外显子3的部分包含来自SEQ ID NO:872或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置147的核酸。连续核酸的数目可为SEQ ID NO:872的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置147的核酸。在此替代例中,DSCAML1外显子3的部分更优选地包含或根据SEQ ID NO:872或其等位基因变体。优选地,在与DSCAML1的融合物中的NRG1外显子2的部分包含来自SEQ ID NO:126或其等位基因变体的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸或是由其所组成,且至少包括位置1的核酸。连续核酸的数目可为SEQ ID NO:126的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置1的核酸。
在一个替代性优选实施方式中,该包含DSCAML1外显子3的一部分与NRG1外显子2的一部分融合的多核苷酸包含来自SEQ ID NO:868的2至约10、约20、约30、或高达约40个或甚至全部的连续核酸,且包括位置75和76的核酸。连续核酸的数目可为SEQ ID NO:868的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40个或全部的核酸,且至少包括位置75和76的核酸。SEQ IDNO:868包括介于DSCAML1与NRG1之间的接点,尤其该接点介于源于DSCAML1的位置75的核酸与源于NRG1的位置76的核酸之间。优选地,该包含DSCAML1外显子3的一部分与NRG1外显子2的一部分融合的多核苷酸具有SEQ ID NO:868的多核苷酸序列或其等位基因变体。
优选地,本文所提供的任一DSCAML1-NRG1多核苷酸融合物为DSCAML1与NRG1的框内融合。更优选地所述融合物为包含DSCAML1的外显子3或外显子3的一部分以及NRG1的外显子2或外显子2的一部分的框内融合。所述框内融合优选为SEQ ID NO:868或其等位基因变体的融合物,且该等位基因变体与SEQ ID NO:868有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
优选地,该DSCAML1外显子3(或其等位基因变体)的部分位于NRG1外显子2(或其等位基因变体)的5’处。此核酸水平的倾向造成融合多肽产物含有DSCAML1的N端和NRG1的C端。此外,本文所提供的DSCAML1-NRG1多核苷酸融合物产生了一种蛋白质融合物,其中从N端到该融合接点的部分是来自DSCAML1的多肽序列,而从该接点到C端的部分为NRG1多肽序列,其中该NRG1部分也提供了其EGF样结构域。该DSCAML1-NRG1融合蛋白因此保留了NRG1的EGF样结构域以及驱动一小群人类癌症增生及存活的能力,特别是腺癌,更特别是胰脏导管腺癌。
本文所提及的每个包含NRG1的多核苷酸融合物,包括VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、DAAM1-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1或DSCAML1-NRG1,优选地被分离出来。本发明的任一方法优选地包括从样本分离出一种或多种含有多核苷酸的组分。该一种或多种含有多核苷酸的组分通常从样本中的任一细胞或细胞材料中分离出来。
NRG1多肽融合物
根据本公开,现在提供了包含NRG1的多肽融合物,包括VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1和DSCAML1-NRG1。特别地,在被诊断患有癌症的人类患者中存在或已鉴定出这类融合物,并在下节中更详细地提及。
VAPB-NRG1多肽融合物
根据本公开,也提供一种由包含VAPB核酸序列(或VAPB核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸所编码的多肽融合物。该VAPB核酸序列(或其一部分)优选地编码包含SEQ ID NO:24-30中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。该NRG1核酸序列(或其一部分)优选地编码包含SEQ ID NO:139-152中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。
SEQ ID NO:24-30中的任一者的VAPB等位基因变体优选地与其具有至少85%的序列一致性,更优选地与其具有90%、92%、94%、96%或甚至更优选地至少98%的序列一致性。SEQ ID NO:139-152中的任一者的NRG1等位基因变体优选地与其具有至少85%的序列一致性,更优选地与其具有90%、92%、94%、96%或甚至更优选地至少98%的序列一致性。
优选地,所述融合物的VAPB核酸序列部分编码VAPB的多肽部分,此多肽部分包含来自SEQ ID NO:24-30中的任一者(或SEQ ID NO:24-30中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。优选地,所述融合物的NRG1核酸序列部分编码NRG1的多肽部分,此多肽部分包含来自SEQ ID NO:139-152中的任一者(或SEQ IDNO:139-152中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。
优选地,本公开的任一VAPB-NRG1多肽融合物包括SEQ ID NO:24-30中的任一者的多肽序列,此多肽序列具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变添加、删除或取代SEQ ID NO:24-30的多肽的任一氨基酸。优选地,所述多肽融合物包括SEQ ID NO:24-30中的任一者的多肽序列,此多肽序列具有1、2、3、4或5个点突变添加、删除或取代SEQ IDNO:24-30的多肽的任一氨基酸。更优选地,所述多核苷酸融合物包括SEQ ID NO:24-30中的任一者的多肽序列,此多肽序列具有1、2或3个点突变添加、删除或取代SEQ ID NO:24-30的多肽的任一氨基酸。
在一个优选实施方式中,也提供一种由包含VAPB的外显子1(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该VAPB的外显子1所编码的多肽优选地包含SEQ ID NO:24或SEQ ID NO:24的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ IDNO:140的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:141-151中的任一者或全部,或SEQ ID NO:141-151的任一等位基因变体。SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可根据SEQ ID NO:154或SEQ ID NO:154的等位基因变体,其序列对应于外显子2-13全部所编码的多肽序列。
优选地,该VAPB的外显子1部分所编码的多肽包含来自SEQ ID NO:24或SEQ IDNO:24的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:24有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:140有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一VAPB-NRG1多肽融合物包括如SEQ ID NO:4或其等位基因变体的多肽序列。SEQ ID NO:4含有在VAPB与NRG1之间的融合接点,该融合位于位置14的氨基酸(其与VAPB的茎位置1-13处的氨基酸一起)与位置16的氨基酸(其与NRG1的茎位置17-31处的氨基酸一起)之间。在位置15处,因为NRG1与VAPB出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该VAPB-NRG1多肽融合物包括来自SEQ ID NO:4或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括位置14、15和16的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:4的多肽序列,或是一种包含来自SEQ ID NO:4或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置14、15和16处的氨基酸。所述多肽序列与SEQ ID NO:4有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一VAPB-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:4的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:4的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:4的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:4的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:4的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:4的多肽的任一氨基酸。
优选地,本文所提供的介于NRG1与VAPB之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自VAPB的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有VAPB-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
CADM1-NRG1多肽融合物
也提供一种由包含CADM1的外显子7(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该CADM1的外显子7所编码的多肽优选地包含SEQ ID NO:51或SEQ ID NO:51的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:45-50中的任一者或全部,或是SEQ ID NO:45-50中的任一者的任一等位基因变体,且优选地进一步包括SEQ ID NO:145-151中的任一者,或是SEQ ID NO:145-151中的任一者的任一等位基因变体。SEQ IDNO:45-50分别对应CADM1的外显子1-7所编码的个别多肽序列。SEQ ID NO:145-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成,其序列对应于外显子6-13全部所编码的多肽序列。
优选地,该CADM1的外显子7部分所编码的多肽包含来自SEQ ID NO:51或SEQ IDNO:51的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:51有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:144有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一CADM1-NRG1多肽融合物包括如SEQ ID NO:8或其等位基因变体的多肽序列。SEQ ID NO:8含有在CADM1与NRG1之间的融合接点,该融合位于位置17的氨基酸(其与CADM1的茎位置1-16处的氨基酸一起)与位置19的氨基酸(其与NRG1的茎位置20-28处的氨基酸一起)之间。在位置18处,因为NRG1与CADM1出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该CADM1-NRG1多肽融合物包括来自SEQ ID NO:8或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括其位置17、18和19的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:8的多肽序列,或是一种包含来自SEQ ID NO:8或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置17、18和19处的氨基酸。所述多肽序列与SEQ ID NO:8有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一CADM1-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:8的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:8的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:8的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:8的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:8的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:8的多肽的任一氨基酸。
优选地,本文所提供的介于NRG1与CADM1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自CADM1的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有CADM1-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
CD44-NRG1多肽融合物
也提供一种由包含CD44的外显子5(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该CD44的外显子5所编码的多肽优选地包含SEQ ID NO:84或SEQ ID NO:84的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:80-83中的任一者或全部,或是SEQ ID NO:80-83中的任一者的任一等位基因变体,且优选地进一步包括SEQ ID NO:141-151中的任一者,或是SEQ ID NO:141-151中的任一者的任一等位基因变体。SEQ ID NO:80-83分别对应CD44的外显子1-4所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可由SEQ ID NO:154或SEQID NO:154的等位基因变体所组成,其序列对应于外显子2-13全部所编码的多肽序列。
优选地,该CD44的外显子5部分所编码的多肽包含来自SEQ ID NO:84或SEQ IDNO:84的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:84有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:140有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一CD44-NRG1多肽融合物包括如SEQ ID NO:12或其等位基因变体的多肽序列。SEQ ID NO:12含有在CD44与NRG1之间的融合接点,该融合位于位置17的氨基酸(其与CD44的茎位置1-16处的氨基酸一起)与位置19的氨基酸(其与NRG1的茎位置20-36处的氨基酸一起)之间。在位置18处,因为NRG1与CD44出乎意料产生框内融合而使苏氨酸(T,Thr)残基存在。优选地,该CD44-NRG1多肽融合物包括来自SEQ IDNO:12或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括其位置17、18和19的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:12的多肽序列,或是一种包含来自SEQ ID NO:12或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置17、18和19处的氨基酸。所述多肽序列与SEQ ID NO:12有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一CD44-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:12的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:12的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:12的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:12的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:12的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:12的多肽的任一氨基酸。
优选地,本文所提供的介于NRG1与CD44之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自CD44的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有CD44-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
也提供一种由包含CD44的外显子5(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该CD44的外显子5所编码的多肽优选地包含SEQ ID NO:84或SEQ ID NO:84的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:80-83中的任一者,或是SEQ IDNO:80-83的任一等位基因变体,且优选地进一步包括SEQ ID NO:145-151或SEQ ID NO:145-151的任一等位基因变体。SEQ ID NO:80-83分别对应CD44的外显子1-4所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成,其序列对应于外显子6-13全部所编码的多肽序列。
优选地,该CD44的外显子5部分所编码的多肽包含来自SEQ ID NO:84或SEQ IDNO:84的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:84有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:144有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一CD44-NRG1多肽融合物包括如SEQ ID NO:762或其等位基因变体的多肽序列。SEQ ID NO:762含有在CD44-与NRG1之间的融合接点,该融合位于位置24的氨基酸(其与CD44-的茎位置1-23处的氨基酸一起)与位置26的氨基酸(其与NRG1的茎位置27-49处的氨基酸一起)之间。在位置25处,因为NRG1与CD44-出乎意料产生框内融合而使苏氨酸(T,Thr)残基存在。优选地,该CD44-NRG1多肽融合物包括来自SEQ ID NO:762或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括其位置24、25和26的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:762的多肽序列,或是一种包含来自SEQ ID NO:762或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置24、25和26处的氨基酸。所述多肽序列与SEQ ID NO:762有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一CD44-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:762的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:762的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:762的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:762的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:762的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:762的多肽的任一氨基酸。
优选地,本文所提供的介于CD44与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自CD44的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有CD44-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
SLC3A2-NRG1多肽融合物
也提供一种由包含SLC3A2的转录本6的外显子1(或其等位基因变体)的一部分以及NRG1的外显子5(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。所述SLC3A2外显子1所编码的多肽优选地包含SEQ ID NO:113或SEQ ID NO:113的等位基因变体或是由其组成。该NRG1的外显子5所编码的多肽优选地包含SEQ ID NO:143或SEQ ID NO:143的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:144-151中的任一者,或是SEQ ID NO:144-151中的任一者的任一等位基因变体。SEQ ID NO:144-151分别对应NRG1的外显子6-13所编码的个别多肽序列。所述NRG1的外显子5部分也可由SEQ ID NO:158或SEQ ID NO:158的等位基因变体所组成,其序列对应于外显子6-13全部所编码的多肽序列且包括一个由外显子5的最3’框内的三联体所编码的额外丝氨酸残基。
优选地,该SLC3A2的转录本6的外显子1部分所编码的多肽包含来自SEQ ID NO:113或SEQ ID NO:113的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:113有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在一个优选实施方式中,该SLC3A2-NRG1融合物中的NRG1的外显子5部分至少包含SEQ ID NO:143位置16的氨基酸,或SEQ ID NO:143的等位基因变体的对应氨基酸。该等位基因变体与SEQ ID NO:143有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的SLC3A2-NRG1多肽融合物的任一转录本6包括如SEQ ID NO:16或其等位基因变体的多肽序列。SEQ ID NO:16含有在SLC3A2与NRG1之间的融合接点,该融合位于位置17的氨基酸(其与SLC3A2的茎位置1-16处的氨基酸一起)与位置19的氨基酸(其与NRG1的茎位置20-29处的氨基酸一起)之间。在位置18处,因为NRG1与该SLC3A2转录本出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该SLC3A2-NRG1多肽融合物包括来自SEQ ID NO:16或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括位置17、18和19的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:16的多肽序列,或是一种包含来自SEQ ID NO:16或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置17、18和19处的氨基酸。所述多肽序列与SEQ ID NO:16有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的SLC3A2-NRG1多肽融合物的任一转录本6包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:16的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:16的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:16的多肽序列,且所述点突变添加、删除或取代该包含SEQID NO:16的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQID NO:16的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:16的多肽的任一氨基酸。
优选地,本文所提供的介于NRG1与SLC3A2的转录本6之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自SLC3A2的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有SLC3A2-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
也提供一种由包含SLC3A2的转录本3的外显子2(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。所述SLC3A2外显子2所编码的多肽优选地包含SEQ ID NO:470或SEQ ID NO:470的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:469或145-151中的任一者,或是SEQ ID NO:469或145-151的任一等位基因变体。SEQ ID NO:145-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成,其序列对应于外显子6-13全部所编码的多肽序列。
优选地,该SLC3A2的转录本3的外显子2部分所编码的多肽包含来自SEQ ID NO:470或SEQ ID NO:470的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:470有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。在一个优选实施方式中,该SLC3A2-NRG1融合物中的NRG1的外显子6部分包含或者是根据SEQ ID NO:144或SEQ ID NO:144的等位基因变体的序列。该等位基因变体与SEQ ID NO:144有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的SLC3A2-NRG1多肽融合物的任一转录本3包括如SEQ ID NO:455或其等位基因变体的多肽序列。SEQ ID NO:455含有在SLC3A2与NRG1之间的融合接点,该融合位于位置30的氨基酸(其与SLC3A2的茎位置1-29处的氨基酸一起)与位置32的氨基酸(其与NRG1的茎位置33-39处的氨基酸一起)之间。在位置31处,因为NRG1与该SLC3A2转录本出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该SLC3A2-NRG1多肽融合物包括来自SEQ ID NO:455或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括位置30、31和32的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:455的多肽序列,或是一种包含来自SEQ ID NO:455或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置30、31和32处的氨基酸。所述多肽序列与SEQ ID NO:455有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的SLC3A2-NRG1多肽融合物的任一转录本3包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:455的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:455的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:455的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:455的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:455的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:455的多肽的任一氨基酸。
优选地,本文所提供的介于NRG1与SLC3A2的转录本6之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自SLC3A2的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有SLC3A2-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
VTCN1-NRG1多肽融合物
也提供一种由包含VTCN1的外显子2(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该VTCN1的外显子2所编码的多肽优选地包含SEQ ID NO:176或SEQ ID NO:176的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:175或SEQ ID NO:175的等位基因变体,且优选地进一步包括SEQ ID NO:141-151中的任一者,或是SEQ ID NO:141-151中的任一者的任一等位基因变体。SEQ ID NO:175对应VTCN1的外显子1所编码的多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可由SEQ ID NO:154或SEQ ID NO:154的等位基因变体所组成,其序列对应于外显子2-13全部所编码的多肽序列。
优选地,该VTCN1的外显子2部分所编码的多肽包含来自SEQ ID NO:176或SEQ IDNO:176的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:176有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:140有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一VTCN1-NRG1多肽融合物包括如SEQ ID NO:167或其等位基因变体的多肽序列。SEQ ID NO:167含有在VTCN1与NRG1之间的融合接点,该融合位于位置21的氨基酸(其与VTCN1的茎位置1-20处的氨基酸一起)与位置23的氨基酸(其与NRG1的茎位置24-30处的氨基酸一起)之间。在位置22处,因为NRG1与VTCN1出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该VTCN1-NRG1多肽融合物包括来自SEQ ID NO:167或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括其位置21、22和23的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:167的多肽序列,或是一种包含来自SEQ ID NO:167或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置21、22和23处的氨基酸。所述多肽序列与SEQ ID NO:167有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一VTCN1-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:167的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:167的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:167的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:167的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ IDNO:167的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:167的多肽的任一氨基酸。
优选地,本文所提供的介于VTCN1与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自VTCN1的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有VTCN1-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
CDH1-NRG1多肽融合物
也提供一种由包含CDH1的外显子11(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该CDH1的外显子11所编码的多肽优选地包含SEQ ID NO:206或SEQ ID NO:206的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:205或SEQ ID NO:205的等位基因变体,且优选地进一步包括SEQ ID NO:141-151中的任一者,或是SEQ ID NO:141-151中的任一者的任一等位基因变体。SEQ ID NO:205对应CDH1的外显子10所编码的多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可由SEQ ID NO:154或SEQ ID NO:154的等位基因变体所组成,其序列对应于外显子2-13全部所编码的多肽序列。
优选地,该CDH1的外显子11部分所编码的多肽包含来自SEQ ID NO:206或SEQ IDNO:206的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:206有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:140有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一CDH1-NRG1多肽融合物包括如SEQ ID NO:187或其等位基因变体的多肽序列。SEQ ID NO:187含有在CDH1与NRG1之间的融合接点,该融合位于位置39的氨基酸(其与CDH1的茎位置1-38处的氨基酸一起)与位置41的氨基酸(其与NRG1的茎位置42-49处的氨基酸一起)之间。在位置40处,因为NRG1与CDH1出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该CDH1-NRG1多肽融合物包括来自SEQ ID NO:187或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括其位置39、40和41的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:187的多肽序列,或是一种包含来自SEQ ID NO:187或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置39、40和41处的氨基酸。所述多肽序列与SEQ ID NO:187有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一CDH1-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:187的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:187的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:187的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:187的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:187的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:187的多肽的任一氨基酸。
优选地,本文所提供的介于CDH1与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自CDH1的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有CDH1-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
CXADR-NRG1多肽融合物
也提供一种由包含CXADR的外显子1(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该CXADR的外显子1所编码的多肽优选地包含SEQ ID NO:225或SEQ ID NO:225的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:141-151,或SEQ ID NO:141-151的任一等位基因变体。SEQ ID NO:225对应CXADR的外显子1所编码的多肽序列。SEQID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可由SEQ ID NO:154或SEQ ID NO:154的等位基因变体所组成,其序列对应于外显子2-13全部所编码的多肽序列。
优选地,该CXADR的外显子1部分所编码的多肽包含来自SEQ ID NO:225或SEQ IDNO:225的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:225有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:140有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一CXADR-NRG1多肽融合物包括如SEQ ID NO:218或其等位基因变体的多肽序列。SEQ ID NO:218含有在CXADR与NRG1之间的融合接点,该融合位于位置14的氨基酸(其与CXADR的茎位置1-13处的氨基酸一起)与位置16的氨基酸(其与NRG1的茎位置17-33处的氨基酸一起)之间。在位置15处,因为NRG1与CXADR出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该CXADR-NRG1多肽融合物包括来自SEQ ID NO:218或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括其位置14、15和16的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:218的多肽序列,或是一种包含来自SEQ ID NO:218或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置14、15和16处的氨基酸。所述多肽序列与SEQ ID NO:218有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一CXADR-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:218的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:218的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:218的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:218的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ IDNO:218的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:218的多肽的任一氨基酸。
优选地,本文所提供的介于CXADR与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自CXADR的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有CXADR-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
GTF2E2-NRG1多肽融合物
也提供一种由包含GTF2E2的外显子2(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该GTF2E2的外显子2所编码的多肽优选地包含SEQ ID NO:244或SEQ ID NO:244的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:141-151,或SEQ ID NO:141-151的任一等位基因变体。SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可由SEQ ID NO:154或SEQ ID NO:154的等位基因变体所组成,其序列对应于外显子2-13全部所编码的多肽序列。
优选地,该GTF2E2的外显子2部分所编码的多肽包含来自SEQ ID NO:244或SEQ IDNO:244的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:244有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:140有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一GTF2E2-NRG1多肽融合物包括如SEQ ID NO:234或其等位基因变体的多肽序列。SEQ ID NO:234含有在GTF2E2与NRG1之间的融合接点,该融合位于位置46的氨基酸(其与GTF2E2的茎位置1-45处的氨基酸一起)与位置48的氨基酸(其与NRG1的茎位置49-88处的氨基酸一起)之间。在位置47处,因为NRG1与GTF2E2出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该GTF2E2-NRG1多肽融合物包括来自SEQ ID NO:234或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括其位置46、47及48的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:234的多肽序列,或是一种包含来自SEQ ID NO:234或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置46、47及48处的氨基酸。所述多肽序列与SEQ ID NO:234有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一GTF2E2-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:234的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:234的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:234的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:234的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ IDNO:234的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:234的多肽的任一氨基酸。
优选地,本文所提供的介于GTF2E2与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自GTF2E2的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有GTF2E2-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
CSMD1-NRG1多肽融合物
也提供一种由包含CSMD1的外显子23(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该CSMD1的外显子23所编码的多肽优选地包含SEQ ID NO:305或SEQ ID NO:305的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:283-304中的任一者,或SEQ ID NO:283-304的任一等位基因变体,且优选地进一步包括SEQ ID NO:145-151,或SEQID NO:145-151的任一等位基因变体。SEQ ID NO:283-304分别对应CSMD1的外显子1-22所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成,其序列对应于外显子6-13全部所编码的多肽序列。
优选地,该CSMD1的外显子23部分所编码的多肽包含来自SEQ ID NO:305或SEQ IDNO:305的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:305有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:144有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一CSMD1-NRG1多肽融合物包括如SEQ ID NO:256或其等位基因变体的多肽序列。SEQ ID NO:256含有在CSMD1与NRG1之间的融合接点,该融合位于位置29的氨基酸(其与CSMD1的茎位置1-28处的氨基酸一起)与位置31的氨基酸(其与NRG1的茎位置32-50处的氨基酸一起)之间。在位置30处,因为NRG1与CSMD1出乎意料产生框内融合而使苏氨酸(T,Thr)残基存在。优选地,该CSMD1-NRG1多肽融合物包括来自SEQ ID NO:256或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括其位置29、30和31的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:256的多肽序列,或是一种包含来自SEQ ID NO:256或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置29、30和31处的氨基酸。所述多肽序列与SEQ ID NO:256有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一CSMD1-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:256的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:256的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:218的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:256的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ IDNO:256的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:256的多肽的任一氨基酸。
优选地,本文所提供的介于CSMD1与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自CSMD1的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有CSMD1-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
PTN-NRG1多肽融合物
也提供一种由包含PTN的外显子4(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该PTN的外显子4所编码的多肽优选地包含SEQ ID NO:323或SEQ ID NO:323的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:321和/或322或是SEQ IDNO:321和/或322的等位基因变体,且优选地进一步包括SEQ ID NO:141-151,或是SEQ IDNO:141-151的任一等位基因变体。SEQ ID NO:321、322和323分别对应PTN的外显子2、3、4所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可由SEQ ID NO:154或SEQ ID NO:154的等位基因变体所组成,其序列对应于外显子2-13全部所编码的多肽序列。
优选地,该PTN的外显子4部分所编码的多肽包含来自SEQ ID NO:323或SEQ IDNO:323的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:323有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:140有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一PTN-NRG1多肽融合物包括如SEQ ID NO:314或其等位基因变体的多肽序列。SEQ ID NO:314含有在PTN与NRG1之间的融合接点,该融合位于位置33的氨基酸(其与PTN的茎位置1-32处的氨基酸一起)与位置35的氨基酸(其与NRG1的茎位置36-67处的氨基酸一起)之间。在位置34处,因为NRG1与PTN出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该PTN-NRG1多肽融合物包括来自SEQ ID NO:314或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括位置33、34和35的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:314的多肽序列,或是一种包含来自SEQ ID NO:314或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置33、34和35处的氨基酸。所述多肽序列与SEQ ID NO:314有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一PTN-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:314的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:314的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:314的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:314的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:314的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:314的多肽的任一氨基酸。
优选地,本文所提供的介于PTN与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自PTN的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有PTN-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
ST14-NRG1多肽融合物
也提供一种由包含ST14的外显子11(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该ST14的外显子11所编码的多肽优选地包含SEQ ID NO:362或SEQ ID NO:362的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:352-361中的任一者,或是SEQ ID NO:352-361的任一等位基因变体,且优选地进一步包括SEQ ID NO:145-151或SEQ ID NO:145-151的任一等位基因变体。SEQ ID NO:352-361分别对应ST14的外显子1-10所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成,其序列对应于外显子6-13全部所编码的多肽序列。
优选地,该ST14的外显子11部分所编码的多肽包含来自SEQ ID NO:362或SEQ IDNO:362的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:362有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:144有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一ST14-NRG1多肽融合物包括如SEQ ID NO:331或其等位基因变体的多肽序列。SEQ ID NO:331含有在ST14与NRG1之间的融合接点,该融合位于位置31的氨基酸(其与ST14的茎位置1-30处的氨基酸一起)与位置33的氨基酸(其与NRG1的茎位置34-60处的氨基酸一起)之间。在位置32处,因为NRG1与ST14出乎意料产生框内融合而使脯氨酸(P,pro)残基存在。优选地,该ST14-NRG1多肽融合物包括来自SEQ ID NO:331或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括其位置31、32和33的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:331的多肽序列,或是一种包含来自SEQ ID NO:331或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置31、32和33处的氨基酸。所述多肽序列与SEQ ID NO:455有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一ST14-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:331的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:331的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:331的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:331的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:331的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:331的多肽的任一氨基酸。
优选地,本文所提供的介于ST14与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自ST14的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有ST14-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
THBS1-NRG1多肽融合物
也提供一种由包含THBS1的外显子9(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该THBS1的外显子9所编码的多肽优选地包含SEQ ID NO:396或SEQ ID NO:396的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:389-395中的任一者,或是SEQ ID NO:389-395的任一等位基因变体,且优选地进一步包括SEQ ID NO:145-151或SEQ ID NO:145-151的任一等位基因变体。SEQ ID NO:389-395分别对应THBS1的外显子2-8所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成,其序列对应于外显子6-13全部所编码的多肽序列。
优选地,该THBS1的外显子9部分所编码的多肽包含来自SEQ ID NO:396或SEQ IDNO:396的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:396有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:144有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一THBS1-NRG1多肽融合物包括如SEQ ID NO:377或其等位基因变体的多肽序列。SEQ ID NO:377含有在THBS1与NRG1之间的融合接点,该融合位于位置18的氨基酸(其与THBS1的茎位置1-16处的氨基酸一起)与位置20的氨基酸(其与NRG1的茎位置20-48处的氨基酸一起)之间。在位置19处,因为NRG1与THBS1出乎意料产生框内融合而使苏氨酸(T,Thr)残基存在。优选地,该THBS1-NRG1多肽融合物包括来自SEQ ID NO:377或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括其位置18、19和20的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:377的多肽序列,或是一种包含来自SEQ ID NO:377或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置18、19和20处的氨基酸。所述多肽序列与SEQ ID NO:377有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一THBS1-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:377的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:377的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:377的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:377的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ IDNO:377的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:377的多肽的任一氨基酸。
优选地,本文所提供的介于THBS1与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自THBS1的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有THBS1-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
AGRN-NRG1多肽融合物
也提供一种由包含AGRN的外显子12(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该AGRN的外显子12所编码的多肽优选地包含SEQ ID NO:430或SEQ ID NO:430的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:419-429中的任一者,或是SEQ ID NO:419-429的任一等位基因变体,且优选地进一步包括SEQ ID NO:145-151或SEQ ID NO:145-151的任一等位基因变体。SEQ ID NO:419-429分别对应AGRN的外显子1-11所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成,其序列对应于外显子6-13全部所编码的多肽序列。
优选地,该AGRN的外显子12部分所编码的多肽包含来自SEQ ID NO:430或SEQ IDNO:430的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:430有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:144有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一AGRN-NRG1多肽融合物包括如SEQ ID NO:404或其等位基因变体的多肽序列。SEQ ID NO:404含有在AGRN与NRG1之间的融合接点,该融合位于位置35的氨基酸(其与AGRN的茎位置1-34处的氨基酸一起)与位置37的氨基酸(其与NRG1的茎位置38-69处的氨基酸一起)之间。在位置36处,因为NRG1与AGRN出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该AGRN-NRG1多肽融合物包括来自SEQ ID NO:404或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括其位置35、36和37的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:404的多肽序列,或是一种包含来自SEQ ID NO:404或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置35、36和37处的氨基酸。所述多肽序列与SEQ ID NO:404有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一AGRN-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:404的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:404的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:404的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:404的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:404的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:404的多肽的任一氨基酸。
优选地,本文所提供的介于AGRN与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自AGRN的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有AGRN-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
PVALB-NRG1多肽融合物
根据本公开,也提供一种由包含PVALB核酸序列(或PVALB核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸所编码的多肽融合物。该PVALB核酸序列(或其一部分)优选地编码包含SEQ ID NO:445-449中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。该NRG1核酸序列(或其一部分)优选地编码包含SEQ ID NO:139-152中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。
SEQ ID NO:445-449中的任一者的PVALB等位基因变体优选地与其具有至少85%的序列一致性,更优选地与其具有90%、92%、94%、96%或甚至更优选地至少98%的序列一致性。SEQ ID NO:139-152中的任一者的NRG1等位基因变体优选地与其具有至少85%的序列一致性,更优选地与其具有90%、92%、94%、96%或甚至更优选地至少98%的序列一致性。
优选地,所述融合物的PVALB核酸序列部分编码PVALB的多肽部分,此多肽部分包含来自SEQ ID NO:445-449中的任一者(或SEQ ID NO:445-449中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。优选地,所述融合物的NRG1核酸序列部分编码NRG1的多肽部分,此多肽部分包含来自SEQ ID NO:139-152中的任一者(或SEQ ID NO:139-152中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。
优选地,本公开的任一PVALB-NRG1多肽融合物包括SEQ ID NO:445-449中的任一者的多肽序列,此多肽序列具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变添加、删除或取代SEQ ID NO:445-449的多肽的任一氨基酸。优选地,所述多肽融合物包括SEQ IDNO:445-449中的任一者的多肽序列,此多肽序列具有1、2、3、4或5个点突变添加、删除或取代SEQ ID NO:445-449的多肽的任一氨基酸。更优选地,所述多核苷酸融合物包括SEQ IDNO:445-449中的任一者的多肽序列,此多肽序列具有1、2或3个点突变添加、删除或取代SEQID NO:445-449的多肽的任一氨基酸。
在一个优选实施方式中,也提供一种由包含PVALB的外显子4(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该PVALB的外显子4所编码的多肽优选地包含SEQ ID NO:447或SEQ ID NO:447的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ IDNO:144的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:445及446中的任一者,以及SEQ ID NO:141-151中的任一者,或SEQ ID NO:141-151的任一等位基因变体。SEQ ID NO:145-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可根据SEQ ID NO:156或SEQ ID NO:156的等位基因变体,其序列对应于外显子6-13全部所编码的多肽序列。
优选地,该PVALB的外显子4部分所编码的多肽包含来自SEQ ID NO:447或SEQ IDNO:447的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:447有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:144有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一PVALB-NRG1多肽融合物包括如SEQ ID NO:438或其等位基因变体的多肽序列。SEQ ID NO:438含有在PVALB与NRG1之间的融合接点,该融合位于位置33的氨基酸(其与PVALB的茎位置1-32处的氨基酸一起)与位置35的氨基酸(其与NRG1的茎位置36-75处的氨基酸一起)之间。在位置34处,因为NRG1与PVALB出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该PVALB-NRG1多肽融合物包括来自SEQ ID NO:438或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括位置33、34和35的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:438的多肽序列,或是一种包含来自SEQ ID NO:438或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置33、34和35处的氨基酸。所述多肽序列与SEQ ID NO:438有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一PVALB-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:438的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:438的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:438的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:438的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ IDNO:438的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:438的多肽的任一氨基酸。
优选地,本文所提供的介于NRG1与PVALB之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自PVALB的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有PVALB-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
APP-NRG1多肽融合物
也提供一种由包含APP的外显子14(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该APP的外显子14所编码的多肽优选地包含SEQ ID NO:519或SEQ ID NO:519的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:506-518中的任一者,或是SEQ ID NO:506-518的任一等位基因变体,且优选地进一步包括SEQ ID NO:145-151或SEQID NO:145-151的任一等位基因变体。SEQ ID NO:506-518分别对应APP的外显子1-3所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成,其序列对应于外显子6-13全部所编码的多肽序列。
优选地,该APP的外显子14部分所编码的多肽包含来自SEQ ID NO:519或SEQ IDNO:519的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:519有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:144有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一APP-NRG1多肽融合物包括如SEQ ID NO:487或其等位基因变体的多肽序列。SEQ ID NO:487含有在APP与NRG1之间的融合接点,该融合位于位置17的氨基酸(其与APP的茎位置1-16处的氨基酸一起)与位置19的氨基酸(其与NRG1的茎位置20-46处的氨基酸一起)之间。在位置18处,因为NRG1与APP出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该APP-NRG1多肽融合物包括来自SEQ ID NO:487或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括其位置17、18和19的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:487的多肽序列,或是一种包含来自SEQ ID NO:487或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置17、18和19处的氨基酸。所述多肽序列与SEQ ID NO:487有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一APP-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:487的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:487的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:487的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:487的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:487的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:487的多肽的任一氨基酸。
优选地,本文所提供的介于APP与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自APP的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有APP-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
WRN-NRG1多肽融合物
也提供一种由包含WRN的外显子33(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该WRN的外显子33所编码的多肽优选地包含SEQ ID NO:597或SEQ ID NO:597的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:566-596中的任一者,或是SEQ ID NO:566-596的任一等位基因变体,且优选地进一步包括SEQ ID NO:145-151或SEQID NO:145-151的任一等位基因变体。SEQ ID NO:566-596对应WRN的外显子2-32所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成,其序列对应于外显子6-13全部所编码的多肽序列。
优选地,该WRN的外显子33部分所编码的多肽包含来自SEQ ID NO:597或SEQ IDNO:597的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:597有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:144有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一WRN-NRG1多肽融合物包括如SEQ ID NO:528或其等位基因变体的多肽序列。SEQ ID NO:528含有在WRN与NRG1之间的融合接点,该融合位于位置31的氨基酸(其与WRN的茎位置1-30处的氨基酸一起)与位置33的氨基酸(其与NRG1的茎位置34-60处的氨基酸一起)之间。在位置32处,因为NRG1与WRN出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该WRN-NRG1多肽融合物包括来自SEQ ID NO:528或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括其位置31、32和33的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:528的多肽序列,或是一种包含来自SEQ ID NO:528或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置31、32和33处的氨基酸。所述多肽序列与SEQ ID NO:528有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一WRN-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:528的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:528的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:528的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:528的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:528的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:528的多肽的任一氨基酸。
优选地,本文所提供的介于WRN与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自WRN的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有WRN-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
ASPH-NRG1多肽融合物
根据本公开,也提供一种由包含ASPH核酸序列(或ASPH核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸所编码的多肽融合物。该ASPH核酸序列(或其一部分)优选地编码包含SEQ ID NO:663-688中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。该NRG1核酸序列(或其一部分)优选地编码包含SEQ ID NO:139-152中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。
SEQ ID NO:663-688中的任一者的ASPH等位基因变体优选地与其具有至少85%的序列一致性,更优选地与其具有90%、92%、94%、96%或甚至更优选地至少98%的序列一致性。SEQ ID NO:139-152中的任一者的NRG1等位基因变体优选地与其具有至少85%的序列一致性,更优选地与其具有90%、92%、94%、96%或甚至更优选地至少98%的序列一致性。
优选地,所述融合物的ASPH核酸序列部分编码ASPH的多肽部分,此多肽部分包含来自SEQ ID NO:663-688中的任一者(或SEQ ID NO:663-688中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。优选地,所述融合物的NRG1核酸序列部分编码NRG1的多肽部分,此多肽部分包含来自SEQ ID NO:139-152中的任一者(或SEQID NO:139-152中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。
优选地,本公开的任一ASPH-NRG1多肽融合物包括SEQ ID NO:663-688中的任一者的多肽序列,此多肽序列具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变添加、删除或取代SEQ ID NO:663-688的多肽的任一氨基酸。优选地,所述多肽融合物包括SEQ ID NO:663-688中的任一者的多肽序列,此多肽序列具有1、2、3、4或5个点突变添加、删除或取代SEQ ID NO:663-688的多肽的任一氨基酸。更优选地,所述多核苷酸融合物包括SEQ ID NO:663-688中的任一者的多肽序列,此多肽序列具有1、2或3个点突变添加、删除或取代SEQ IDNO:663-688的多肽的任一氨基酸。
在一个优选实施方式中,也提供一种由包含ASPH的外显子22(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该ASPH的外显子22所编码的多肽优选地包含SEQ ID NO:684或SEQ ID NO:684的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ IDNO:140的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:663-683中的任一者以及SEQ ID NO:141-151中的任一者,或是SEQ ID NO:663-683或SEQID NO:141-151的任一等位基因变体。SEQ ID NO:663-683分别对应ASPH的外显子1-21所编码的个别多肽序列,而SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可根据SEQ ID NO:154或SEQ ID NO:154的等位基因变体,其序列对应于外显子3-13全部所编码的多肽序列。
优选地,该ASPH的外显子22部分所编码的多肽包含来自SEQ ID NO:684或SEQ IDNO:684的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:684有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:140有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一ASPH-NRG1多肽融合物包括如SEQ ID NO:636或其等位基因变体的多肽序列。SEQ ID NO:636含有在ASPH与NRG1之间的融合接点,该融合位于位置24的氨基酸(其与ASPH的茎位置1-23处的氨基酸一起)与位置26的氨基酸(其与NRG1的茎位置27-49处的氨基酸一起)之间。在位置25处,因为NRG1与ASPH出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该ASPH-NRG1多肽融合物包括来自SEQ ID NO:636或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括位置24、25和26的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:636的多肽序列,或是一种包含来自SEQ ID NO:636或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置24、25和26处的氨基酸。所述多肽序列与SEQ ID NO:636有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一ASPH-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:636的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:636的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:636的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:636的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:636的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:636的多肽的任一氨基酸。
优选地,本文所提供的介于NRG1与ASPH之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自ASPH的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有ASPH-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
NOTCH2-NRG1多肽融合物
也提供一种由包含NOTCH2的外显子6(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该NOTCH2的外显子6所编码的多肽优选地包含SEQ ID NO:709或SEQ ID NO:709的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:704-708中的任一者,或是SEQ ID NO:704-708的任一等位基因变体,且优选地进一步包括SEQ ID NO:145-151或SEQ ID NO:145-151的任一等位基因变体。SEQ ID NO:566-596对应NOTCH2的外显子1-5所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成,其序列对应于外显子6-13全部所编码的多肽序列。
优选地,该NOTCH2的外显子6部分所编码的多肽包含来自SEQ ID NO:709或SEQ IDNO:709的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:709有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:144有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一NOTCH2-NRG1多肽融合物包括如SEQ ID NO:694或其等位基因变体的多肽序列。SEQ ID NO:694含有在NOTCH2与NRG1之间的融合接点,该融合位于位置24的氨基酸(其与NOTCH2的茎位置1-23处的氨基酸一起)与位置26的氨基酸(其与NRG1的茎位置27-49处的氨基酸一起)之间。在位置25处,因为NRG1与NOTCH2出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该NOTCH2-NRG1多肽融合物包括来自SEQ ID NO:694或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括其位置24、25和26的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:694的多肽序列,或是一种包含来自SEQ ID NO:694或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置24、25和26处的氨基酸。所述多肽序列与SEQ ID NO:694有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一NOTCH2-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:694的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:694的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:694的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:694的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ IDNO:694的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:694的多肽的任一氨基酸。
优选地,本文所提供的介于NOTCH2与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自NOTCH2的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有NOTCH2-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
CD74-NRG1多肽融合物
也提供一种由包含CD74的外显子2(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该CD74的外显子2所编码的多肽优选地包含SEQ ID NO:730或SEQ ID NO:730的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:729或SEQ ID NO:141-151中的任一者,或是SEQ ID NO:729或SEQ ID NO:141-151的任一等位基因变体。SEQ ID NO:729对应CD74的外显子1所编码的多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可由SEQ ID NO:154或SEQ ID NO:154的等位基因变体所组成,其序列对应于外显子2-13全部所编码的多肽序列。
优选地,该CD74的外显子2部分所编码的多肽包含来自SEQ ID NO:730或SEQ IDNO:730的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:730有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:140有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一CD74-NRG1多肽融合物包括如SEQ ID NO:718或其等位基因变体的多肽序列。SEQ ID NO:718含有在CD74与NRG1之间的融合接点,该融合位于位置24的氨基酸(其与CD74的茎位置1-23处的氨基酸一起)与位置26的氨基酸(其与NRG1的茎位置27-49处的氨基酸一起)之间。在位置25处,因为NRG1与CD74出乎意料产生框内融合而使脯氨酸(P,pro)残基存在。优选地,该CD74-NRG1多肽融合物包括来自SEQ ID NO:718或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括其位置24、25和26的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:718的多肽序列,或是一种包含来自SEQ ID NO:718或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置24、25和26处的氨基酸。所述多肽序列与SEQ ID NO:718有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一CD74-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:718的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:718的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:718的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:718的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:718的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:718的多肽的任一氨基酸。
优选地,本文所提供的介于CD74与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自CD74的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有CD74-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
SDC4-NRG1多肽融合物
也提供一种由包含SDC4的外显子2(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该SDC4的外显子2所编码的多肽优选地包含SEQ ID NO:752或SEQ ID NO:752的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:751或SEQ ID NO:141-151中的任一者,或是SEQ ID NO:751或SEQ ID NO:141-151的任一等位基因变体。SEQ ID NO:751对应SDC4的外显子1所编码的多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可由SEQ ID NO:154或SEQ ID NO:154的等位基因变体所组成,其序列对应于外显子2-13全部所编码的多肽序列。
优选地,该SDC4的外显子2部分所编码的多肽包含来自SEQ ID NO:752或SEQ IDNO:752的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:752有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:140有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一SDC4-NRG1多肽融合物包括如SEQ ID NO:744或其等位基因变体的多肽序列。SEQ ID NO:744含有在SDC4与NRG1之间的融合接点,该融合位于位置24的氨基酸(其与SDC4的茎位置1-23处的氨基酸一起)与位置26的氨基酸(其与NRG1的茎位置27-49处的氨基酸一起)之间。在位置25处,因为NRG1与SDC4出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该SDC4-NRG1多肽融合物包括来自SEQ ID NO:744或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括其位置24、25和26的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:744的多肽序列,或是一种包含来自SEQ ID NO:744或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置24、25和26处的氨基酸。所述多肽序列与SEQ ID NO:744有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一SDC4-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:744的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:744的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:744的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:744的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:744的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:744的多肽的任一氨基酸。
优选地,本文所提供的介于SDC4与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自SDC4的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有SDC4-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
也提供一种由包含SDC4的外显子4(或其等位基因变体)的一部分以及NRG1的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该SDC4的外显子4所编码的多肽优选地包含SEQ ID NO:754或SEQ ID NO:754的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:751-753或SEQ ID NO:141-151中的任一者,或是SEQ ID NO:751-753或SEQ ID NO:141-151的任一等位基因变体。SEQID NO:751-753对应SDC4的外显子1-3所编码的个别多肽序列。SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可由SEQ ID NO:154或SEQ ID NO:154的等位基因变体所组成,其序列对应于外显子2-13全部所编码的多肽序列。
优选地,该SDC4的外显子4部分所编码的多肽包含来自SEQ ID NO:754或SEQ IDNO:754的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:754有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:140有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一SDC4-NRG1多肽融合物包括如SEQ ID NO:825或其等位基因变体的多肽序列。SEQ ID NO:825含有在SDC4与NRG1之间的融合接点,该融合位于位置24的氨基酸(其与SDC4的茎位置1-23处的氨基酸一起)与位置26的氨基酸(其与NRG1的茎位置27-49处的氨基酸一起)之间。在位置25处,因为NRG1与SDC4出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该SDC4-NRG1多肽融合物包括来自SEQ ID NO:825或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括其位置24、25和26的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:825的多肽序列,或是一种包含来自SEQ ID NO:825或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置24、25和26处的氨基酸。所述多肽序列与SEQ ID NO:825有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一SDC4-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:825的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:825的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:825的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:825的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:825的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:825的多肽的任一氨基酸。
优选地,本文所提供的介于SDC4与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自SDC4的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有SDC4-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
SLC4A4-NRG1多肽融合物
也提供一种由包含SLC4A4的外显子14(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该SLC4A4的外显子14所编码的多肽优选地包含SEQ ID NO:806或SEQ ID NO:806的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ ID NO:144的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:794-805中的任一者或SEQ ID NO:794-805的任一等位基因变体,且优选地进一步包括SEQ ID NO:145-151或SEQ ID NO:145-151的任一等位基因变体。SEQ ID NO:794-805对应SLC4A4的外显子2-13所编码的个别多肽序列。SEQ ID NO:145-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可由SEQ ID NO:156或SEQ ID NO:156的等位基因变体所组成,其序列对应于外显子6-13全部所编码的多肽序列。
优选地,该SLC4A4的外显子14部分所编码的多肽包含来自SEQ ID NO:806或SEQID NO:806的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:806有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:144有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一SLC4A4-NRG1多肽融合物包括如SEQ ID NO:766或其等位基因变体的多肽序列。SEQ ID NO:766含有在SLC4A4与NRG1之间的融合接点,该融合位于位置24的氨基酸(其与SLC4A4的茎位置1-23处的氨基酸一起)与位置26的氨基酸(其与NRG1的茎位置27-49处的氨基酸一起)之间。在位置25处,因为NRG1与SLC4A4出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该SLC4A4-NRG1多肽融合物包括来自SEQ ID NO:766或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括其位置24、25和26的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:766的多肽序列,或是一种包含来自SEQ ID NO:766或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置24、25和26处的氨基酸。所述多肽序列与SEQ ID NO:766有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一SLC4A4-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:766的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:766的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:766的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:766的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ IDNO:766的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:766的多肽的任一氨基酸。
优选地,本文所提供的介于SLC4A4与NRG1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自SLC4A4的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有SLC4A4-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
ZFAT-NRG1多肽融合物
根据本公开,也提供一种由包含ZFAT核酸序列(或ZFAT核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸所编码的多肽融合物。该ZFAT核酸序列(或其一部分)优选地编码包含SEQ ID NO:847-863中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。该NRG1核酸序列(或其一部分)优选地编码包含SEQ ID NO:139-152中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。
SEQ ID NO:847-863中的任一者的ZFAT等位基因变体优选地与其具有至少85%的序列一致性,更优选地与其具有90%、92%、94%、96%或甚至更优选地至少98%的序列一致性。SEQ ID NO:139-152中的任一者的NRG1等位基因变体优选地与其具有至少85%的序列一致性,更优选地与其具有90%、92%、94%、96%或甚至更优选地至少98%的序列一致性。
优选地,所述融合物的ZFAT核酸序列部分编码ZFAT的多肽部分,此多肽部分包含来自SEQ ID NO:847-863中的任一者(或SEQ ID NO:847-863中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。优选地,所述融合物的NRG1核酸序列部分编码NRG1的多肽部分,此多肽部分包含来自SEQ ID NO:139-152中的任一者(或SEQID NO:139-152中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。
优选地,本公开的任一ZFAT-NRG1多肽融合物包括SEQ ID NO:847-863中的任一者的多肽序列,此多肽序列具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变添加、删除或取代SEQ ID NO:847-863的多肽的任一氨基酸。优选地,所述多肽融合物包括SEQ ID NO:847-863中的任一者的多肽序列,此多肽序列具有1、2、3、4或5个点突变添加、删除或取代SEQ ID NO:847-863的多肽的任一氨基酸。更优选地,所述多核苷酸融合物包括SEQ ID NO:847-863中的任一者的多肽序列,此多肽序列具有1、2或3个点突变添加、删除或取代SEQ IDNO:847-863的多肽的任一氨基酸。
在一个优选实施方式中,也提供一种由包含ZFAT的外显子12(或其等位基因变体)的一部分以及NRG1的外显子6(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该ZFAT的外显子12所编码的多肽优选地包含SEQ ID NO:858或SEQ ID NO:858的等位基因变体或是由其组成。该NRG1的外显子6所编码的多肽优选地包含SEQ ID NO:144或SEQ IDNO:144的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:847-857中的任一者以及SEQ ID NO:145-151中的任一者,或是SEQ ID NO:847-857或SEQID NO:145-151的任一等位基因变体。SEQ ID NO:847-857分别对应ZFAT的外显子1-11所编码的个别多肽序列,而SEQ ID NO:145-151分别对应NRG1的外显子7-13所编码的个别多肽序列。所述NRG1的外显子6部分也可根据SEQ ID NO:156或SEQ ID NO:156的等位基因变体,其序列对应于外显子6-13全部所编码的多肽序列。
优选地,该ZFAT的外显子12部分所编码的多肽包含来自SEQ ID NO:858或SEQ IDNO:858的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:858有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子6部分所编码的多肽包含来自SEQ ID NO:144或SEQ ID NO:144的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:144有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一ZFAT-NRG1多肽融合物包括如SEQ ID NO:829或其等位基因变体的多肽序列。SEQ ID NO:829含有在ZFAT与NRG1之间的融合接点,该融合位于位置24的氨基酸(其与ZFAT的茎位置1-23处的氨基酸一起)与位置26的氨基酸(其与NRG1的茎位置27-49处的氨基酸一起)之间。在位置25处,因为NRG1与ZFAT出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该ZFAT-NRG1多肽融合物包括来自SEQ ID NO:829或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括位置24、25和26的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:829的多肽序列,或是一种包含来自SEQ ID NO:829或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置24、25和26处的氨基酸。所述多肽序列与SEQ ID NO:829有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一ZFAT-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:829的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:829的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:829的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:829的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ ID NO:829的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:829的多肽的任一氨基酸。
优选地,本文所提供的介于NRG1与ZFAT之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自ZFAT的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有ZFAT-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
DSCAML1-NRG1多肽融合物
根据本公开,也提供一种由包含DSCAML1核酸序列(或DSCAML1核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部分)融合的多核苷酸所编码的多肽融合物。该DSCAML1核酸序列(或其一部分)优选地编码包含SEQ ID NO:904-937中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。该NRG1核酸序列(或其一部分)优选地编码包含SEQ ID NO:139-152中的任一者(或这些SEQ ID NO中的任一者的等位基因变体)或是由其组成的序列。
SEQ ID NO:904-937中的任一者的DSCAML1等位基因变体优选地与其具有至少85%的序列一致性,更优选地与其具有90%、92%、94%、96%或甚至更优选地至少98%的序列一致性。SEQ ID NO:139-152中的任一者的NRG1等位基因变体优选地与其具有至少85%的序列一致性,更优选地与其具有90%、92%、94%、96%或甚至更优选地至少98%的序列一致性。
优选地,所述融合物的DSCAML1核酸序列部分编码DSCAML1的多肽部分,此多肽部分包含来自SEQ ID NO:904-937中的任一者(或SEQ ID NO:904-937中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。优选地,所述融合物的NRG1核酸序列部分编码NRG1的多肽部分,此多肽部分包含来自SEQ ID NO:139-152中的任一者(或SEQ ID NO:139-152中的任一者的等位基因变体)的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。
优选地,本公开的任一DSCAML1-NRG1多肽融合物包括SEQ ID NO:904-937中的任一者的多肽序列,此多肽序列具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变添加、删除或取代SEQ ID NO:904-937的多肽的任一氨基酸。优选地,所述多肽融合物包括SEQ IDNO:904-937中的任一者的多肽序列,此多肽序列具有1、2、3、4或5个点突变添加、删除或取代SEQ ID NO:904-937的多肽的任一氨基酸。更优选地,所述多核苷酸融合物包括SEQ IDNO:904-937中的任一者的多肽序列,此多肽序列具有1、2或3个点突变添加、删除或取代SEQID NO:904-937的多肽的任一氨基酸。
在一个优选实施方式中,也提供一种由包含DSCAML1的外显子3(或其等位基因变体)的一部分以及NRG1或其的外显子2(或其等位基因变体)的一部分的多核苷酸所编码的多肽融合物。该DSCAML1的外显子3所编码的多肽优选地包含SEQ ID NO:906或SEQ ID NO:906的等位基因变体或是由其组成。该NRG1的外显子2所编码的多肽优选地包含SEQ ID NO:140或SEQ ID NO:140的等位基因变体或是由其组成。优选地,所述多肽融合物进一步包括SEQ ID NO:904-905中的任一者以及SEQ ID NO:141-151中的任一者,或是SEQ ID NO:904-905或SEQ ID NO:141-151的任一等位基因变体。SEQ ID NO:904-905分别对应DSCAML1的外显子1-2所编码的个别多肽序列,而SEQ ID NO:141-151分别对应NRG1的外显子3-13所编码的个别多肽序列。所述NRG1的外显子2部分也可根据SEQ ID NO:154或SEQ ID NO:154的等位基因变体,其序列对应于外显子2-13全部所编码的多肽序列。
优选地,该DSCAML1的外显子3部分所编码的多肽包含来自SEQ ID NO:906或SEQID NO:906的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:906有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。此外,该NRG1的外显子2部分所编码的多肽包含来自SEQ ID NO:140或SEQ ID NO:140的等位基因变体的8、9、10、11、12、13或14个连续氨基酸,或是由其组成。该等位基因变体与SEQ ID NO:140有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一DSCAML1-NRG1多肽融合物包括如SEQ ID NO:869或其等位基因变体的多肽序列。SEQ ID NO:869含有在DSCAML1与NRG1之间的融合接点,该融合位于位置24的氨基酸(其与DSCAML1的茎位置1-23处的氨基酸一起)与位置26的氨基酸(其与NRG1的茎位置27-49处的氨基酸一起)之间。在位置25处,因为NRG1与DSCAML1出乎意料产生框内融合而使丙氨酸(A,Ala)残基存在。优选地,该DSCAML1-NRG1多肽融合物包括来自SEQID NO:869或其等位基因变体的8、9、10、11、12、13或14个连续氨基酸,至少包括位置24、25和26的氨基酸。
在一个优选实施方式中,其提供了一种根据SEQ ID NO:869的多肽序列,或是一种包含来自SEQ ID NO:869或其等位基因变体的8、9、10、11、12、13或14个或全部的连续氨基酸的多肽,至少包括位置24、25和26处的氨基酸。所述多肽序列与SEQ ID NO:869有至少85%的一致性,优选地与其至少90%的一致性,92%、94%、96%或更优选地至少98%的序列一致性。
优选地,本公开的任一DSCAML1-NRG1多肽融合物包括具有一个或多个(即1、2、3、4、5、6、7、8、9或10个)点突变的SEQ ID NO:869的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:869的多肽的任一氨基酸。优选地,所述多肽融合物包括具有1、2、3、4或5个点突变的SEQ ID NO:869的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:869的多肽的任一氨基酸。更优选地,所述多肽融合物包括具有1、2或3个点突变的SEQ IDNO:869的多肽序列,且所述点突变添加、删除或取代该包含SEQ ID NO:869的多肽的任一氨基酸。
优选地,本文所提供的介于NRG1与DSCAML1之间的多肽融合物倾向于使跨越N端至该融合接点的部分为来自DSCAML1的多肽序列,而跨越该融合接点至C端的部分为NRG1多肽序列。优选地,该NRG1多肽序列包含或编码EGF样结构域。所述含有DSCAML1-NRG1多肽融合物的EGF样结构域优选地是由本文所提及的异常细胞所组成。
本文所提及的每个包含NRG1的多核苷酸融合物,包括VAPB-NRG1,CADM1-NRG1,CD44-NRG1,SLC3A2-NRG1,VTCN1-NRG1,CDH1-NRG1,CXADR-NRG1,GTF2E2-NRG1,CSMD1-NRG1,PTN-NRG1,ST14-NRG1,THBS1-NRG1,AGRN-NRG1,PVALB-NRG1,APP-NRG1,WRN-NRG1,DAAM1-NRG1,ASPH-NRG1,NOTCH2-NRG1,CD74-NRG1,SDC4-NRG1,SLC4A4-NRG1,ZFAT-NRG1和DSCAML1-NRG1,优选地被分离出来。本发明的任一方法优选地包含从样本分离出一种或多种含有多肽的组分。该一种或多种含有多肽的组分通常从样本中的任一细胞或细胞材料中分离出来。
用于检测或鉴定NRG1融合物的测定法
一般来说,待检测的任一多核苷酸或多肽融合物获自或衍生自表达包含NRG1的EGF样结构域的多核苷酸融合物的异常细胞。检测测定法可以不是针对鉴定EGF样结构域是否存在,因为其只需仅检测实际的融合接点以指示出进一步含有NRG1的EGF样结构域的多核苷酸或多肽的存在即可。EGF样结构域的存在可以从特异性地检测或鉴定NRG1与任一融合配偶体之间为框内的多核苷酸融合而推断出,这样的融合接合会在NRG1的EGF样结构域的5’处发现。
技术人员可采用多种不同技术来检测获自人类受试者样本中的已知多核苷酸或多肽融合物,其各自通常包括会与感兴趣的目标特异性地结合的结合剂。这类结合剂是指一种可选择性地与目标序列结合以达到特异性地检测该目标的试剂,诸如引物、引物对、探针或抗体。所述结合包括与多核苷酸序列杂交或退火,通常是为了扩增和/或检测该目标,或通过具高亲合性和特异性的抗体结合表位以致使目标的检测。
基于特异性地与多核苷酸融合物结合的引物、引物对或探针的使用的技术在本领域中是众所周知的。同样地,基于结合剂来检测多肽的技术在本领域中是众所周知的,特别是可以使用特异性地结合多肽的多肽。
其他使用本公开的引物、引物对或探针的方式包括下一代测序(NGS),或是使用包含多重免疫检测技术的套组(例如利用Anchored Multiplex PCR(AMPTM)技术靶向已知外显子的Archer FusionPlexTMCustom Solid Panel)来检测融合物,或例如使用QX200TMAutoDGTM微滴式数字PCR系统(由BioRad提供)的微滴式数字PCR(ddPCRTM)。其他手段包括使用分子信标或是使用TaqManTM探针或嵌合型荧光染料(诸如SYBRTMGreen)的定量PCR(Q-PCR)、荧光原位杂交(FISH)、下一代测序(NGS)、ddPCRTM、Anchored Multiplex PCR、半定量PCR或定量PCR。
还有其他使用本公开的探针来检测本文所提及的NRG1与融合配偶体的多核苷酸融合物的方法,如IHC或FISH(诸如断裂分离FISH),其中感兴趣的基因的两端以不同颜色标记。为检测包含本文所提及融合物的NRG1,使用正链hg38 chr8:31,639,222-32,764,405来设计适宜探针以标记NRG1基因的两端以致使任何融合物的检测。
本公开提供一种用于检测本文所提及的多核苷酸融合物的核酸探针、引物或引物对。也提供一种包含所述核酸探针、引物或引物对以用于检测本文所提及的多核苷酸融合物的存在的检测测定法。这类核酸探针、引物或引物对的长度使其可检测感兴趣的多核苷酸,但优选的长度为约10至约40个核苷酸。
优选地,用于检测多核苷酸融合物的任一核酸探针、引物或引物对包括本文所述的可检测标记。
优选地,于检测选自VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、DAAM1-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1或DSCAML1-NRG1的多核苷酸融合物是否存在的测定法中使用任一核酸探针、引物或引物对,特别是检测本文所公开的该等多核苷酸融合物中的融合接点是否存在的测定法。
优选地,通过使用所述跨越NRG1与其融合配偶体之间的核酸接点的探针、引物或引物对致使该融合接合物的扩增和检测,以检测本文所提及的任一多核苷酸融合物是否存在。
用于检测VAPB-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含VAPB核酸序列(或VAPB核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部份)融合的多核苷酸融合物的核酸引物、引物对或探针。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:23的多核苷酸(或SEQ IDNO:23的等位基因变体)和根据SEQ ID NO:138的多核苷酸(或SEQ ID NO:138的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸。
此外,本公开提供一种用于检测包含SEQ ID NO:3或由其组成的VAPB-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置43和44的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:3的多核苷酸(或SEQ ID NO:3的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸,且该序列优选地包括位置43和44的核酸。
优选地,该用于检测VAPB与NRG1的融合物的核酸探针、引物或引物对特异性地与由VAPB的外显子1组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子1的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测VAPB与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:17组成的序列(或SEQ ID NO:17的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自VAPB的外显子1包含SEQ ID NO:17或其等位基因变体,或是由其组成。
用于检测CADM1-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:7或由其组成的CADM1-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置53和54的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:7的多核苷酸(或SEQ ID NO:7的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置53和54的核酸。
优选地,该用于检测CADM1与NRG1的融合物的核酸探针、引物或引物对特异性地与由CADM1的外显子7组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子7的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测CADM1与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:57组成的序列(或SEQ ID NO:57的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自CADM1的外显子7包含SEQ ID NO:39或其等位基因变体,或是由其组成。
用于检测CD44-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:11或由其组成的CD44-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置52和53的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:11的多核苷酸(或SEQ ID NO:11的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置52和53的核酸。
优选地,该用于检测CD44与NRG1的融合物的核酸探针、引物或引物对特异性地与由CD44的外显子5组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子5的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测CD44与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:99组成的序列(或SEQ ID NO:99的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自CD44的外显子5包含SEQ ID NO:65或其等位基因变体,或是由其组成。
本公开提供一种用于检测包含SEQ ID NO:761或由其组成的CD44-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置75和76的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:761的多核苷酸(或SEQ ID NO:761的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置75和76的核酸。
优选地,该用于检测CD44与NRG1的融合物的核酸探针、引物或引物对特异性地与由CD44的外显子5组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子5的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测CD44与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:99组成的序列(或SEQ ID NO:99的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自CD44的外显子5包含SEQ ID NO:65或其等位基因变体,或是由其组成。
用于检测SLC3A2-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:15或由其组成的SLC3A2转录本6-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置53和54的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:15的多核苷酸(或SEQ ID NO:15的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置53和54的核酸。
优选地,该用于检测SLC3A2转录本6与NRG1的融合物的核酸探针、引物或引物对特异性地与由所述SLC3A2的外显子1组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子1的5’处的序列和/或由NRG1的外显子5组成的序列、或位于外显子5的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测所述SLC3A2与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:103组成的序列(或SEQ IDNO:103的等位基因变体)、和/或SEQ ID NO:157组成的序列(或SEQ ID NO:157的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自SLC3A2转录本6的外显子1包含SEQ ID NO:103或其等位基因变体,或是由其组成。
本公开提供一种用于检测包含SEQ ID NO:454或由其组成的SLC3A2转录本6-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置93和94的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:454的多核苷酸(或SEQ ID NO:454的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置93和94的核酸。
优选地,该用于检测SLC3A2转录本3与NRG1的融合物的核酸探针、引物或引物对特异性地与由所述SLC3A2的外显子2组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子2的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测所述SLC3A2与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:482组成的序列(或SEQ IDNO:482的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自SLC3A2转录本3的外显子2包含SEQ ID NO:457或其等位基因变体,或是由其组成。
用于检测VTCN1-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:166或由其组成的VTCN1-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置65和66的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:166的多核苷酸(或SEQ ID NO:166的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置65和66的核酸。
优选地,该用于检测VTCN1与NRG1的融合物的核酸探针、引物或引物对特异性地与由VTCN1的外显子2组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子2的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测VTCN1与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:181组成的序列(或SEQ ID NO:181的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自VTCN1的外显子2包含SEQ ID NO:169或其等位基因变体,或是由其组成。
用于检测CDH1-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:186或由其组成的CDH1-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置119和120的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:186的多核苷酸(或SEQ ID NO:186的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置119和120的核酸。
优选地,该用于检测CDH1与NRG1的融合物的核酸探针、引物或引物对特异性地与由CDH1的外显子11组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子11的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测CDH1与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:213组成的序列(或SEQ ID NO:213的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自CDH1的外显子11包含SEQ ID NO:198或其等位基因变体,或是由其组成。
用于检测CXADR-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:217或由其组成的CXADR-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置43和44的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:217的多核苷酸(或SEQ ID NO:217的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置43和44的核酸。
优选地,该用于检测CXADR与NRG1的融合物的核酸探针、引物或引物对特异性地与由CXADR的外显子1组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子1的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测CXADR与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:219组成的序列(或SEQ ID NO:219的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自CXADR的外显子1包含SEQ ID NO:219或其等位基因变体,或是由其组成。
用于检测GTF2E2-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:233或由其组成的GTF2E2-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置141和142的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:233的多核苷酸(或SEQ ID NO:233的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置141和142的核酸。
优选地,该用于检测GTF2E2与NRG1的融合物的核酸探针、引物或引物对特异性地与由GTF2E2的外显子2组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子2的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测GTF2E2与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:252组成的序列(或SEQ ID NO:252的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自GTF2E2的外显子2包含SEQ ID NO:236或其等位基因变体,或是由其组成。
用于检测CSMD1-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:255或由其组成的CSMD1-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置88和89的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:255的多核苷酸(或SEQ ID NO:255的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置88和89的核酸。
优选地,该用于检测CSMD1与NRG1的融合物的核酸探针、引物或引物对特异性地与由CSMD1的外显子23组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子23的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测CSMD1与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:309组成的序列(或SEQ ID NO:309的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自CSMD1的外显子23包含SEQ ID NO:279或其等位基因变体,或是由其组成。
用于检测PTN-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:313或由其组成的PTN-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置102和103的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:313的多核苷酸(或SEQ ID NO:313的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置102和103的核酸。
优选地,该用于检测PTN与NRG1的融合物的核酸探针、引物或引物对特异性地与由PTN的外显子4组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子4的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测PTN与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:326组成的序列(或SEQ ID NO:326的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自PTN的外显子4包含SEQ ID NO:318或其等位基因变体,或是由其组成。
用于检测ST14-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:330或由其组成的ST14-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置95和96的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:330的多核苷酸(或SEQ ID NO:330的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置95和96的核酸。
优选地,该用于检测ST14与NRG1的融合物的核酸探针、引物或引物对特异性地与由ST14的外显子11组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子11的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测ST14与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:372组成的序列(或SEQ ID NO:372的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自ST14的外显子11包含SEQ ID NO:362或其等位基因变体,或是由其组成。
用于检测THBS1-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:376或由其组成的THBS1-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置56和57的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:376的多核苷酸(或SEQ ID NO:376的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置56和57的核酸。
优选地,该用于检测THBS1与NRG1的融合物的核酸探针、引物或引物对特异性地与由THBS1的外显子9组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子9的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测THBS1与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:399组成的序列(或SEQ ID NO:399的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自THBS1的外显子9包含SEQ ID NO:386或其等位基因变体,或是由其组成。
用于检测AGRN-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:403或由其组成的AGRN-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置106和107的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:403的多核苷酸(或SEQ ID NO:403的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置106和107的核酸。
优选地,该用于检测AGRN与NRG1的融合物的核酸探针、引物或引物对特异性地与由AGRN的外显子12组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子12的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测AGRN与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:433组成的序列(或SEQ ID NO:433的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自AGRN的外显子12包含SEQ ID NO:416或其等位基因变体,或是由其组成。
用于检测PVALB-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含PVALB核酸序列(或PVALB核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部份)融合的多核苷酸融合物的核酸引物、引物对或探针。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:444的多核苷酸(或SEQID NO:444的等位基因变体)和根据SEQ ID NO:138的多核苷酸(或SEQ ID NO:138的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。
此外,本公开提供一种用于检测包含SEQ ID NO:437或由其组成的PVALB-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置102和103的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:437的多核苷酸(或SEQ ID NO:437的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置102和103的核酸。
优选地,该用于检测PVALB与NRG1的融合物的核酸探针、引物或引物对特异性地与由PVALB的外显子4组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子4的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测PVALB与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:450组成的序列(或SEQ ID NO:450的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自PVALB的外显子4包含SEQ ID NO:442或其等位基因变体,或是由其组成。
用于检测APP-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:486或由其组成的APP-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置54和55的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:486的多核苷酸(或SEQ ID NO:486的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置54和55的核酸。
优选地,该用于检测APP与NRG1的融合物的核酸探针、引物或引物对特异性地与由APP的外显子14组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子14的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测APP与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:524组成的序列(或SEQ ID NO:524的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自APP的外显子14包含SEQ ID NO:501或其等位基因变体,或是由其组成。
用于检测WRN-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:528或由其组成的WRN-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置96和97的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:528的多核苷酸(或SEQ ID NO:528的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置96和97的核酸。
优选地,该用于检测WRN与NRG1的融合物的核酸探针、引物或引物对特异性地与由WRN的外显子33组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子33的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测WRN与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:601组成的序列(或SEQ ID NO:601的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自WRN的外显子33包含SEQ ID NO:562或其等位基因变体,或是由其组成。
用于检测DAAM1-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:605或由其组成的DAAM1-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置75和76的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:605的多核苷酸(或SEQ ID NO:605的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置75和76的核酸。
优选地,该用于检测DAAM1与NRG1的融合物的核酸探针、引物或引物对特异性地与由DAAM1的外显子1组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子1的5’处的序列和/或由NRG1的外显子1组成的序列、或位于外显子1的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测DAAM1与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:606组成的序列(或SEQ ID NO:606的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自DAAM1的外显子1包含SEQ ID NO:606或其等位基因变体,或是由其组成。
用于检测ASPH-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含ASPH核酸序列(或ASPH核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部份)融合的多核苷酸融合物的核酸引物、引物对或探针。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:662的多核苷酸(或SEQ IDNO:662的等位基因变体)和根据SEQ ID NO:138的多核苷酸(或SEQ ID NO:138的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。
此外,本公开提供一种用于检测包含SEQ ID NO:635或由其组成的ASPH-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置75和76的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:635的多核苷酸(或SEQ ID NO:635的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置75和76的核酸。
优选地,该用于检测ASPH与NRG1的融合物的核酸探针、引物或引物对特异性地与由ASPH的外显子22组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子22的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测ASPH与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:689组成的序列(或SEQ ID NO:689的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自ASPH的外显子22包含SEQ ID NO:658或其等位基因变体,或是由其组成。
用于检测NOTCH2-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:693或由其组成的NOTCH2-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置75和76的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:693的多核苷酸(或SEQ ID NO:693的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置75和76的核酸。
优选地,该用于检测NOTCH2与NRG1的融合物的核酸探针、引物或引物对特异性地与由NOTCH2的外显子6组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子6的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测NOTCH2与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:713组成的序列(或SEQ ID NO:713的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自NOTCH2的外显子6包含SEQ ID NO:700或其等位基因变体,或是由其组成。
用于检测CD74-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:717或由其组成的CD74-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置75和76的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:717的多核苷酸(或SEQ ID NO:717的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置75和76的核酸。
优选地,该用于检测CD74与NRG1的融合物的核酸探针、引物或引物对特异性地与由CD74的外显子2组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子2的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测CD74与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:739组成的序列(或SEQ ID NO:739的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自CD74的外显子2包含SEQ ID NO:720或其等位基因变体,或是由其组成。
用于检测SDC4-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:743或由其组成的SDC4-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置75和76的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:743的多核苷酸(或SEQ ID NO:743的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置75和76的核酸。
优选地,该用于检测SDC4与NRG1的融合物的核酸探针、引物或引物对特异性地与由SDC4的外显子2组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子2的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测SDC4与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:757组成的序列(或SEQ ID NO:757的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自SDC4的外显子2包含SEQ ID NO:746或其等位基因变体,或是由其组成。
本公开提供一种用于检测包含SEQ ID NO:824或由其组成的SDC4-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置75和76的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:824的多核苷酸(或SEQ ID NO:824的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置75和76的核酸。
优选地,该用于检测SDC4与NRG1的融合物的核酸探针、引物或引物对特异性地与由SDC4的外显子4组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子4的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测SDC4与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:940组成的序列(或SEQ ID NO:940的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自SDC4的外显子2包含SEQ ID NO:748或其等位基因变体,或是由其组成。
用于检测SLC4A4-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含SEQ ID NO:765或由其组成的SLC4A4-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置75和76的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:765的多核苷酸(或SEQ ID NO:765的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置75和76的核酸。
优选地,该用于检测SLC4A4与NRG1的融合物的核酸探针、引物或引物对特异性地与由SLC4A4的外显子14组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子14的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测SLC4A4与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:820组成的序列(或SEQ ID NO:820的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自SLC4A4的外显子14包含SEQ ID NO:780或其等位基因变体,或是由其组成。
用于检测ZFAT-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含ZFAT核酸序列(或ZFAT核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部份)融合的多核苷酸融合物的核酸引物、引物对或探针。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:846的多核苷酸(或SEQ IDNO:846的等位基因变体)和根据SEQ ID NO:138的多核苷酸(或SEQ ID NO:138的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。
此外,本公开提供一种用于检测包含SEQ ID NO:828或由其组成的ZFAT-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置75和76的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:828的多核苷酸(或SEQ ID NO:828的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置75和76的核酸。
优选地,该用于检测ZFAT与NRG1的融合物的核酸探针、引物或引物对特异性地与由ZFAT的外显子12组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子12的5’处的序列和/或由NRG1的外显子6组成的序列、或位于外显子6的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测ZFAT与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:864组成的序列(或SEQ ID NO:864的等位基因变体)、和/或SEQ ID NO:155组成的序列(或SEQ ID NO:155的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自ZFAT的外显子12包含SEQ ID NO:841或其等位基因变体,或是由其组成。
用于检测DSCAML1-NRG1融合物的测定法中的引物或探针
本公开提供一种用于检测包含DSCAML1核酸序列(或DSCAML1核酸序列的一部分)与NRG1核酸序列(或NRG1核酸序列的一部份)融合的多核苷酸融合物的核酸引物、引物对或探针。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:903的多核苷酸(或SEQ ID NO:903的等位基因变体)和根据SEQ ID NO:138的多核苷酸(或SEQ ID NO:138的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。
此外,本公开提供一种用于检测包含SEQ ID NO:868或由其组成的DSCAML1-NRG1多核苷酸融合物的核酸引物、引物对或探针,且该序列包括位置75和76的核酸。优选地,该核酸探针、引物或引物对特异性地与根据SEQ ID NO:868的多核苷酸(或SEQ ID NO:868的等位基因变体)杂合,或是与该序列有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至40个核苷酸,且该序列优选地包括位置75和76的核酸。
优选地,该用于检测DSCAML1与NRG1的融合物的核酸探针、引物或引物对特异性地与由DSCAML1的外显子3组成的序列(诸如用于获得等位基因检测测定法中的序列)、位于外显子3的5’处的序列和/或由NRG1的外显子2组成的序列、或位于外显子2的3’处的序列(诸如NRG1的基因序列)杂合(或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸)。优选地,该用于检测DSCAML1与NRG1的融合物的核酸探针、引物或引物对特异性地与SEQ ID NO:938组成的序列(或SEQ ID NO:938的等位基因变体)、和/或SEQ ID NO:153组成的序列(或SEQ ID NO:153的等位基因变体)杂合,或是与其具有95%、96%、97%、98%、99%或优选地有100%的序列一致性且长度超过约12至约40个核苷酸。也提供了用于检测涉及所述外显子任一者的等位基因变体的融合物的核酸探针、引物或引物对。
优选地,来自DSCAML1的外显子3包含SEQ ID NO:872或其等位基因变体,或是由其组成。
用于原位杂交的探针
也提用于原位杂交(ISH)测定法的探针以检测涉及VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的任何基因重排。特别地,该探针用于荧光原位杂交(FISH)或断裂分离FISH。该基因重排优选为VAPB、CADM1、CD44、SLC3A2、VTCN1 CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1与NRG1的基因融合物,但因为这些ISH测定法靶向本文所公开的融合接点的5’和3’侧,可使用该ISH测定法来检测涉及所述基因的任何基因重排。
因此,特别提供第一核酸探针和第二核酸探针,其用于原位杂交测定法中,以检测VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的基因重排,其中:
-用于检测VAPB的基因重排的第一探针特异性地与位于SEQ ID NO:1的位置42或43的核酸5’处的VAPB序列杂交,且该第二探针特异性地与位于SEQ ID NO:1的位置42或43的核酸3’处的VAPB序列杂交;
-用于检测CADM1的基因重排的第一探针特异性地与位于SEQ ID NO:5的位置53的核酸5’处的CADM1序列杂交,且该第二探针特异性地与位于SEQ ID NO:5的位置53的核酸3’处的CADM1序列杂交;
-用于检测CD44的基因重排的第一探针特异性地与位于SEQ ID NO:9的位置52的核酸5’处的CD44序列杂交,且该第二探针特异性地与位于SEQ ID NO:9的位置52的核酸3’处的CD44序列杂交;
-用于检测CD44的基因重排的第一探针特异性地与位于SEQ ID NO:759的位置75的核酸5’处的CD44序列杂交,且该第二探针特异性地与位于SEQ ID NO:759的位置75的核酸3’处的CD44序列杂交;
-用于检测SLC3A2的基因重排的第一探针特异性地与位于SEQ ID NO:13的位置53的核酸5’处的SLC3A2序列杂交,且该第二探针特异性地与位于SEQ ID NO:13的位置53的核酸3’处的SLC3A2序列杂交;
-用于检测VTCN1的基因重排的第一探针特异性地与位于SEQ ID NO:164的位置65的核酸5’处的VTCN1序列杂交,且该第二探针特异性地与位于SEQ ID NO:164的位置65的核酸3’处的VTCN1序列杂交;
-用于检测CDH1的基因重排的第一探针特异性地与位于SEQ ID NO:184的位置119的核酸5’处的CDH1序列杂交,且该第二探针特异性地与位于SEQ ID NO:184的位置119的核酸3’处的CDH1序列杂交;
-用于检测CXADR的基因重排的第一探针特异性地与位于SEQ ID NO:215的位置43的核酸5’处的CXADR序列杂交,且该第二探针特异性地与位于SEQ ID NO:215的位置43的核酸3’处的CXADR序列杂交;
-用于检测GTF2E2的基因重排的第一探针特异性地与位于SEQ ID NO:231的位置141的核酸5’处的GTF2E2序列杂交,且该第二探针特异性地与位于SEQ ID NO:231的位置141的核酸3’处的GTF2E2序列杂交;
-用于检测CSMD1的基因重排的第一探针特异性地与位于SEQ ID NO:253的位置88的核酸5’处的CSMD1序列杂交,且该第二探针特异性地与位于SEQ ID NO:253的位置88的核酸3’处的CSMD1序列杂交;
-用于检测PTN的基因重排的第一探针特异性地与位于SEQ ID NO:311的位置102的核酸5’处的PTN序列杂交,且该第二探针特异性地与位于SEQ ID NO:311的位置102的核酸3’处的PTN序列杂交;
-用于检测ST14的基因重排的第一探针特异性地与位于SEQ ID NO:328的位置95的核酸5’处的ST14序列杂交,且该第二探针特异性地与位于SEQ ID NO:328的位置95的核酸3’处的ST14序列杂交;
-用于检测THBS1的基因重排的第一探针特异性地与位于SEQ ID NO:374的位置56的核酸5’处的THBS1序列杂交,且该第二探针特异性地与位于SEQ ID NO:374的位置56的核酸3’处的THBS1序列杂交;
-用于检测AGRN的基因重排的第一探针特异性地与位于SEQ ID NO:401的位置106的核酸5’处的AGRN序列杂交,且该第二探针特异性地与位于SEQ ID NO:401的位置106的核酸3’处的AGRN序列杂交;
-用于检测PVALB的基因重排的第一探针特异性地与位于SEQ ID NO:435的位置102的核酸5’处的PVALB序列杂交,且该第二探针特异性地与位于SEQ ID NO:435的位置102的核酸3’处的PVALB序列杂交;
-用于检测SLC3A2的基因重排的第一探针特异性地与位于SEQ ID NO:452的位置93的核酸5’处的SLC3A2序列杂交,且该第二探针特异性地与位于SEQ ID NO:452的位置93的核酸3’处的SLC3A2序列杂交;
-用于检测APP的基因重排的第一探针特异性地与位于SEQ ID NO:484的位置54的核酸5’处的APP序列杂交,且该第二探针特异性地与位于SEQ ID NO:484的位置54的核酸3’处的APP序列杂交;
-用于检测WRN的基因重排的第一探针特异性地与位于SEQ ID NO:526的位置96的核酸5’处的WRN序列杂交,且该第二探针特异性地与位于SEQ ID NO:526的位置96的核酸3’处的WRN序列杂交;
-用于检测DAAM1的基因重排的第一探针特异性地与位于SEQ ID NO:603的位置75的核酸5’处的DAAM1序列杂交,且该第二探针特异性地与位于SEQ ID NO:603的位置75的核酸3’处的DAAM1序列杂交;
-用于检测ASPH的基因重排的第一探针特异性地与位于SEQ ID NO:633的位置75的核酸5’处的ASPH序列杂交,且该第二探针特异性地与位于SEQ ID NO:633的位置75的核酸3’处的ASPH序列杂交;
-用于检测NOTCH2的基因重排的第一探针特异性地与位于SEQ ID NO:691的位置75的核酸5’处的NOTCH2序列杂交,且该第二探针特异性地与位于SEQ ID NO:691的位置75的核酸3’处的NOTCH2序列杂交;
-用于检测CD74的基因重排的第一探针特异性地与位于SEQ ID NO:715的位置75的核酸5’处的CD74序列杂交,且该第二探针特异性地与位于SEQ ID NO:715的位置75的核酸3’处的CD74序列杂交;
-用于检测SDC4的基因重排的第一探针特异性地与位于SEQ ID NO:741的位置75的核酸5’处的SDC4序列杂交,且该第二探针特异性地与位于SEQ ID NO:741的位置75的核酸3’处的SDC4序列杂交;
-用于检测SDC4的基因重排的第一探针特异性地与位于SEQ ID NO:822的位置75的核酸5’处的SDC4序列杂交,且该第二探针特异性地与位于SEQ ID NO:822的位置75的核酸3’处的SDC4序列杂交;
-用于检测SLC4A4的基因重排的第一探针特异性地与位于SEQ ID NO:763的位置75的核酸5’处的SLC4A4序列杂交,且该第二探针特异性地与位于SEQ ID NO:763的位置75的核酸3’处的SLC4A4序列杂交;
-用于检测ZFAT的基因重排的第一探针特异性地与位于SEQ ID NO:826的位置75的核酸5’处的ZFAT序列杂交,且该第二探针特异性地与位于SEQ ID NO:826的位置75的核酸3’处的ZFAT序列杂交;或
-用于检测DSCAML1的基因重排的第一探针特异性地与位于SEQ ID NO:866的位置75的核酸5’处的DSCAML1序列杂交,且该第二探针特异性地与位于SEQ ID NO:866的位置75的核酸3’处的DSCAML1序列杂交。
替代性地,提供了一种优选的ISH测定法,其中检测选自VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、DAAM1-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1或DSCAML1-NRG1的任一多核苷酸融合物。所述测定法使用第一探针和第二探针,其中若该第一探针与该融合接点5’侧的序列杂交,该第二探针则与另一侧的序列杂交,或者是若该第一探针与该融合接点3’侧的序列杂交,该第二探针则与另一侧的序列杂交,且其中该第一探针与选自VAPB,CADM1,CD44,SLC3A2,VTCN1,CDH1,CXADR,GTF2E2,CSMD1,PTN,ST14,THBS1,AGRN,PVALB,APP,WRN,DAAM1,ASPH,NOTCH2,CD74,SDC4,SLC4A4,ZFAT或DSCAML1的序列杂交,而该第二探针系与NRG1序列杂交且优选为诸如本文所提及的EGF样结构域序列。包括与EGF样结构域杂交的探针时,将所述结构域置于该NRG1融合配偶体序列的附近。
特别提供了一种用于原位杂交测定法以检测VAPB-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:3的位置42或43的核酸5’处的VAPB序列杂交,且该第二探针特异性地与位于SEQ ID NO:3的位置43或44的核酸3’处的NRG1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测CADM1-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:7的位置53的核酸5’处的CADM1序列杂交,且该第二探针特异性地与位于SEQ ID NO:7的位置54的核酸3’处的NRG1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测CD44-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:11的位置52的核酸5’处的CD44序列杂交,且该第二探针特异性地与位于SEQ ID NO:11的位置53的核酸3’处的NRG1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测CD44-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:761的位置75的核酸5’处的CD44序列杂交,且该第二探针特异性地与位于SEQ ID NO:761的位置76的核酸3’处的NRG1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测SLC3A2-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:15的位置53的核酸5’处的SLC3A2序列杂交,且该第二探针特异性地与位于SEQ ID NO:15的位置54的核酸3’处的NRG1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测VTCN1-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:166的位置65的核酸5’处的VTCN1序列杂交,且该第二探针特异性地与位于SEQ ID NO:166的位置66的核酸3’处的VTCN1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测CDH1-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:186的位置119的核酸5’处的CDH1序列杂交,且该第二探针特异性地与位于SEQ ID NO:186的位置120的核酸3’处的CDH1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测CXADR-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:217的位置43的核酸5’处的CXADR序列杂交,且该第二探针特异性地与位于SEQ ID NO:217的位置44的核酸3’处的CXADR序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测GTF2E2-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:233的位置141的核酸5’处的GTF2E2序列杂交,且该第二探针特异性地与位于SEQ ID NO:233的位置142的核酸3’处的GTF2E2序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测CSMD1-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:255的位置88的核酸5’处的CSMD1序列杂交,且该第二探针特异性地与位于SEQ ID NO:255的位置89的核酸3’处的CSMD1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测PTN-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:313的位置102的核酸5’处的PTN序列杂交,且该第二探针特异性地与位于SEQ ID NO:313的位置103的核酸3’处的PTN序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测ST14-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:330的位置95的核酸5’处的ST14序列杂交,且该第二探针特异性地与位于SEQ ID NO:330的位置96的核酸3’处的ST14序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测THBS1-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:376的位置56的核酸5’处的THBS1序列杂交,且该第二探针特异性地与位于SEQ ID NO:376的位置57的核酸3’处的THBS1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测AGRN-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:403的位置106的核酸5’处的AGRN序列杂交,且该第二探针特异性地与位于SEQ ID NO:403的位置107的核酸3’处的AGRN序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测PVALB-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:437的位置102的核酸5’处的PVALB序列杂交,且该第二探针特异性地与位于SEQ ID NO:437的位置103的核酸3’处的PVALB序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测SLC3A2-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:454的位置93的核酸5’处的SLC3A2序列杂交,且该第二探针特异性地与位于SEQ ID NO:454的位置94的核酸3’处的SLC3A2序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测APP-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:486的位置54的核酸5’处的APP序列杂交,且该第二探针特异性地与位于SEQ ID NO:486的位置55的核酸3’处的NRG1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测WRN-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:528的位置96的核酸5’处的WRN序列杂交,且该第二探针特异性地与位于SEQ ID NO:528的位置97的核酸3’处的NRG1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测DAAM1-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:605的位置75的核酸5’处的DAAM1序列杂交,且该第二探针特异性地与位于SEQ ID NO:605的位置76的核酸3’处的NRG1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测ASPH-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:635的位置75的核酸5’处的ASPH序列杂交,且该第二探针特异性地与位于SEQ ID NO:635的位置76的核酸3’处的NRG1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测NOTCH2-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:693的位置75的核酸5’处的NOTCH2序列杂交,且该第二探针特异性地与位于SEQ ID NO:693的位置76的核酸3’处的NRG1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测CD74-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:717的位置75的核酸5’处的CD74序列杂交,且该第二探针特异性地与位于SEQ ID NO:717的位置76的核酸3’处的NRG1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测SDC4-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:743的位置75的核酸5’处的SDC4序列杂交,且该第二探针特异性地与位于SEQ ID NO:743的位置76的核酸3’处的NRG1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测SDC4-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:824的位置75的核酸5’处的SDC4序列杂交,且该第二探针特异性地与位于SEQ ID NO:824的位置76的核酸3’处的NRG1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测SLC4A4-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:765的位置75的核酸5’处的SLC4A4序列杂交,且该第二探针特异性地与位于SEQ ID NO:765的位置76的核酸3’处的NRG1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测ZFAT-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:828的位置75的核酸5’处的ZFAT序列杂交,且该第二探针特异性地与位于SEQ ID NO:828的位置76的核酸3’处的NRG1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
也特别提供了一种用于原位杂交测定法以检测DSCAML1-NRG1融合物的第一核酸探针和第二核酸探针,其中该第一探针特异性地与位于SEQ ID NO:868的位置75的核酸5’处的DSCAML1序列杂交,且该第二探针特异性地与位于SEQ ID NO:868的位置76的核酸3’处的NRG1序列杂交,诸如本公开的EGF样结构域所包含的序列,特别是SEQ ID NO:163的序列。
本文所提及的核酸探针、引物或引物对中的任一者优选地用于以下鉴定或检测方法中,以检测选自VAPB-NRG1、CADM1-NRG1 CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、DAAM1-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1和DSCAML1-NRG1的多核苷酸、多肽融合物、其部分或等位基因变体中的任一者。
用于检测NRG多核苷酸融合物的测定法
根据本公开,其提供一种在样本中鉴定如本文所提及的多核苷酸融合物、或由其所编码的多肽的方法,所述方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。
也提供一种在样本中检测多核苷酸融合物、或由其所编码的多肽是否存在的方法,所述方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。
也提供一种确定来自受试者的异常细胞是否包含多核苷酸融合物、或由其所编码的多肽的方法,所述方法包括检验获自该受试者的异常细胞的多核苷酸或多肽内容物是否在样本中存在该融合物。
也提供一种鉴定受试者携带多核苷酸融合物、或由其所编码的多肽的方法,所述方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。优选地在该检验之后为是将该样本中检测到的融合物与携带该融合物的受试者联系在一起的步骤。
优选地,所述检验包含利用结合剂特异性地结合所述多核苷酸,诸如本文所提及的任一核酸探针、引物或引物对,或特异性地与本文所提及的任一多核苷酸融合物所编码的多肽结合,或是替代性地利用结合剂与包含该多核苷酸融合物的多核苷酸结合,来检测本文所提及的任一多核苷酸或多肽融合物。该结合剂被利用作为检测步骤的一部分或是使检测成为后续步骤。因此,在本公开的任一方法中的检验优选地包含利用结合剂特异性地结合任一多核苷酸融合物或由其所编码的任一多肽,以检测这类融合物。所述结合剂优选地包含引物、引物对、探针或抗体或是由其组成。此外,该结合剂优选地包含可检测标记。
替代性地,所述检验包含利用结合剂与包含该多核苷酸融合物的多核苷酸结合以检测该融合物。在此替代例中,该结合剂与位于该多核苷酸接点5’和/或3’处的多核苷酸结合且该多核苷酸接点含有NRG1与其融合配偶体之间的实际接点。该结合剂退火或杂交的多核苷酸系作为转接子来连接或以其他方式附接到该多核苷酸融合物,之后检测该融合物。这类转接子优选地含有标签或分子条形码(barcode),诸如在测序方法学(包括下一代测序)中所用的。优选地包含条形码或标签的这类转接子附接至该多核苷酸融合物,以在扩增之后可检测所述融合物。特别地,该结合剂可使用在Anchored Multiplex PCR(或AMP)中,其中在从mRNA产生cDNA之后获得用于NGS的富含目标样本库。
优选地,所述结合剂特异性地与根据SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:164、SEQ ID NO:165、SEQ ID NO:166、SEQ ID NO:184、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:215、SEQ ID NO:216、SEQ IDNO:217、SEQ ID NO:231、SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:253、SEQ ID NO:254、SEQ ID NO:255、SEQ ID NO:311、SEQ ID NO:312、SEQ ID NO:313、SEQ ID NO:328、SEQ IDNO:329、SEQ ID NO:330、SEQ ID NO:374、SEQ ID NO:375、SEQ ID NO:376、SEQ ID NO:401、SEQ ID NO:402、SEQ ID NO:403、SEQ ID NO:435、SEQ ID NO:436、SEQ ID NO:437、SEQ IDNO:452、SEQ ID NO:453、SEQ ID NO:454、SEQ ID NO:484、SEQ ID NO:485、SEQ ID NO:486、SEQ ID NO:526、SEQ ID NO:527、SEQ ID NO:528、SEQ ID NO:603、SEQ ID NO:604、SEQ IDNO:605、SEQ ID NO:633、SEQ ID NO:634、SEQ ID NO:635、SEQ ID NO:691、SEQ ID NO:692、SEQ ID NO:693、SEQ ID NO:715、SEQ ID NO:716、SEQ ID NO:717、SEQ ID NO:741、SEQ IDNO:742、SEQ ID NO:743、SEQ ID NO:759、SEQ ID NO:760、SEQ ID NO:761、SEQ ID NO:763、SEQ ID NO:764、SEQ ID NO:765、SEQ ID NO:822、SEQ ID NO:823、SEQ ID NO:824、SEQ IDNO:826、SEQ ID NO:827、SEQ ID NO:828、SEQ ID NO:866、SEQ ID NO:867或SEQ ID NO:868中的任一者的多核苷酸序列结合。这些序列致使在感兴趣的融合接点紧靠进行特异性杂交,或甚至含有该融合接点,使其成为被所述结合剂结合的良好候选序列。
替代性地,该结合剂特异性地与包含根据SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:164、SEQ ID NO:165、SEQ ID NO:166、SEQ ID NO:184、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:215、SEQ ID NO:216、SEQID NO:217、SEQ ID NO:231、SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:253、SEQ ID NO:254、SEQ ID NO:255、SEQ ID NO:311、SEQ ID NO:312、SEQ ID NO:313、SEQ ID NO:328、SEQID NO:329、SEQ ID NO:330、SEQ ID NO:374、SEQ ID NO:375、SEQ ID NO:376、SEQ ID NO:401、SEQ ID NO:402、SEQ ID NO:403、SEQ ID NO:435、SEQ ID NO:436、SEQ ID NO:437、SEQID NO:452、SEQ ID NO:453、SEQ ID NO:454、SEQ ID NO:484、SEQ ID NO:485、SEQ ID NO:486、SEQ ID NO:526、SEQ ID NO:527、SEQ ID NO:528、SEQ ID NO:603、SEQ ID NO:604、SEQID NO:605、SEQ ID NO:633、SEQ ID NO:634、SEQ ID NO:635、SEQ ID NO:691、SEQ ID NO:692、SEQ ID NO:693、SEQ ID NO:715、SEQ ID NO:716、SEQ ID NO:717、SEQ ID NO:741、SEQID NO:742、SEQ ID NO:743、SEQ ID NO:759、SEQ ID NO:760、SEQ ID NO:761、SEQ ID NO:763、SEQ ID NO:764、SEQ ID NO:765、SEQ ID NO:822、SEQ ID NO:823、SEQ ID NO:824、SEQID NO:826、SEQ ID NO:827、SEQ ID NO:828、SEQ ID NO:866、SEQ ID NO:867或SEQ ID NO:868中的任一者的序列的多核苷酸序列。在此替代例的一个优选方面中,该结合剂优选地退火或杂交至转接子序列来附接(优选地以连接方式)至该多核苷酸融合序列。优选地包含条形码或标签的这类转接子附接至该多核苷酸融合物,以在扩增之后可检测所述融合物。另外地或替代性地,该结合剂包含基因特异性引物、引物对、或探针,其任一者结合至位于融合断点5’或3’处的核苷酸序列,而可扩增NRG1与VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的接点。
此外,检验任何本公开的多核苷酸融合物是否存在优选地包含扩增带有NRG1融合物或其一部分的多核苷酸,且优选地使用DNA聚合酶,更优选地使用热稳定DNA聚合酶或Taq聚合酶。
优选地,该结合剂包含第一引物和第二引物以扩增包含NRG1序列与VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1序列的核苷酸序列,进而检测本文所提及的任一多核苷酸融合物。更优选地,提供了与对于该融合物的NRG1序列部分具有特异性的核苷酸序列杂交或退火的第一引物,以及与对于选自VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的融合配偶体具有特异性的核苷酸序列杂交或退火的第二引物。优选地,该第一和第二引物紧靠融合接点结合,以扩增包含NRG1序列的一部分与VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1序列的一部分的序列。该第一或第二引物也可结合至跨越了该融合接点的位点。一般地,经扩增的序列包含多达1000、900、800、700、600、500、400或300个碱基对。一般地,经扩增的序列会跨越该NRG1融合接点。
因此也提供一种结合剂,其是或包含长度为10-40个核苷酸的核酸探针或引物以用于检测本公开的VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1与NRG1的多核苷酸融合物,其中该融合物分别包含SEQ ID NO:3位置43和44的核酸、SEQ ID NO:7位置53和54的核酸、SEQ ID NO:11位置52和53的核酸、SEQ ID NO:15位置53和54的核酸、SEQ ID NO:166位置65和66的核酸、SEQ ID NO:186位置119和120的核酸、SEQ ID NO:217位置43和44的核酸、SEQ ID NO:233位置141和142的核酸、SEQ ID NO:255位置88和89的核酸、SEQ ID NO:313位置102和103的核酸、SEQ ID NO:330位置95和96的核酸、SEQ ID NO:376位置56和57的核酸、SEQ ID NO:403位置106和107的核酸、SEQ ID NO:437位置102和103的核酸、或SEQ ID NO:454位置93和94的核酸、SEQ ID NO:486位置54和55的核酸、SEQ ID NO:528位置96和97的核酸、SEQ ID NO:605位置75和76的核酸、SEQ ID NO:635位置75和76的核酸、SEQ ID NO:693位置75和76的核酸、SEQ ID NO:717位置75和76的核酸、SEQ ID NO:743位置75和76的核酸、SEQ ID NO:761位置75和76的核酸、SEQ ID NO:765位置75和76的核酸、SEQ ID NO:824位置75和76的核酸、SEQ ID NO:828位置75和76的核酸、SEQID NO:868位置75和76的核酸。这些位置的核酸界定了NRG1与其融合配偶体之间的断点或融合接点。
优选地,本文所提及的所述检验包含扩增或检测用于区别该多核苷酸融合物或由其所编码的多肽是否存在的序列。
在一个优选实施方式中,该结合剂为多肽且优选地通过流式细胞仪(FC)、荧光原位杂交法(FISH)、免疫细胞化学染色法(ICC)、免疫荧光染色法(IF)来检测其是否存在。技术人员可采用多种不同技术,使用FC、IHC、FISH、ICC或IF在样本中检测本公开的NRG1融合物。例如,可使用靶向NRG1的第一抗体以及靶向选自VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的NRG1融合配偶体的第二抗体来进行ICC。该第一与第二抗体的信号共定位,或是使用蛋白大小为基础的区别测定法来检测具有期望大小的多肽产物是否存在,可显示出各别NRG1融合产物是否存在。优选地,该抗NRG1抗体靶向NRG1的EGF样结构域,而该第二抗体靶向诸如VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的融合配偶体的细胞外结构域。Frithiof等人于OncoTargets andtherapy第9卷,7095-7103,2016年11月16日中提供了FISH实验方案的一个例子。另外,可使用两种不同的荧光检测系统并结合在荧光显微镜中使用两种不同通道来检测抗体。基于两个荧光信号的重叠或未重叠外观来说明结果。针对已知结构及序列的多肽来开发抗体,这完全属于技术人员的工作范围内。
优选地,所要检测的多核苷酸或多肽融合物获自于表达包含多核苷酸融合物的NRG1EGF样结构域的异常细胞。优选地,本公开的任何检测方法包含从受试者获得样本的步骤,以及随后从该样本分离该多核苷酸或其所编码的多肽的步骤。此外,所述方法优选地包含从该样本纯化或分离出该核苷酸或多肽的步骤。
优选地,该样本获自罹患癌症或肿瘤、或是怀疑罹患癌症或肿瘤并且带有异常细胞的受试者。该样本可为液态活检样本,或是采自实体癌或实体瘤的样本。该实体样本优选为经福尔马林包埋及石蜡固定的含有异常细胞、一部分癌症或一部分肿瘤中的任一者的样本。从实体癌或实体瘤采取样本会严重破坏皮肤的物理完整性,可能还有内部器官,以触及被调查的肿瘤。使用诸如选自血液、血清、血浆、胸腔积液、唾液、尿液、精液、痰、阴道液、羊水、腹膜液、脑脊液、骨髓、无细胞灌洗液或另一生物流体的液态活检,可以有比这些方法更实惠、更快速、更可靠且侵入性更小的采样。因此,优选地,该样本为液态活检样本。
检测或鉴定NRG1融合物的基于抗体的测定法
也提供一种以多肽为基础的检测测定法以及用于其中的抗体。该检测测定法的目标在于检测本公开的多肽NRG1融合物,特别是本公开的VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1和DSCAML1-NRG1融合物。
特别提供了一种适于检测本文所提到的任何多肽融合物(优选为本文所提到的任何多核苷酸融合物所编码的任何多肽融合物)的第一抗体或第一与第二抗体组。技术人员完全有能力设计、研发及生产能够且适于与本文所公开的多肽融合物特异性地结合的抗体。
在使用第一抗体而没有第二抗体的情况下,该第一抗体会特异性地检测NRG1多肽融合物的独特表位。这类表位包括跨越了介于NRG1与其融合配偶体之间的多肽融合物的表位。替代性地,在使用第一抗体而不使用第二抗体、并且在检测测定法中使用该第一抗体(诸如下文进一步讨论)的情况下,所述测定法包括辨别出非融合多肽的步骤(例如基于大小或电荷之分离步骤,诸如CIEX或HPLC)。在使用第一和第二抗体的情况下,该第一抗体会检测该多肽融合物的一部分(即VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1),而该第二抗体会检测该多肽融合物中包含NRG1的部分。
更特别是本公开提供一种第一抗体或第一和第二抗体组,用于检测由多核苷酸融合物所编码的多肽,且该多核苷酸融合物包含编码VAPB(或VAPB的等位基因变体)蛋白序列的核酸与编码NRG1(或NRG1的等位基因变体)蛋白序列的核酸融合。
优选地,该第一抗体、或第一与第二抗体组用于检测包含VAPB外显子1或外显子1的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测涉及VAPB和NRG1的多核苷酸融合物所编码的多肽的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合VAPB-NRG1多肽融合物,而该第一与第二抗体组优选地结合VAPB和NRG1。
也提供一种第一抗体、或第一与第二抗体组,用于检测包含CADM1外显子7或外显子7的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含CADM1外显子7或外显子7的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合CADM1-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合CADM1和NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含CD44外显子5或外显子5的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含CD44外显子5或外显子5的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合CD44-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合CD44和NRG1。
也提供一种第一抗体、或第一与第二抗体组,用于检测包含CD44外显子5或外显子5的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含CD44外显子5或外显子5的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合CD44-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合CD44和NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含SLC3A2的转录本6的外显子1或外显子1的等位基因变体所编码的多肽的一部分与NRG1外显子5或外显子5的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含所述SLC3A2外显子1或外显子1的等位基因变体所编码的多肽的一部分与NRG1外显子5或外显子5的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合SLC3A2转录本6的SLC3A2-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合所述SLC3A2和NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含VTCN1外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含VTCN1外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合VTCN1-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合VTCN1和NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含CDH1外显子11或外显子11的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含CDH1外显子11或外显子11的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合CDH1-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合CDH1和NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含CXADR外显子1或外显子1的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含CXADR外显子1或外显子1的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合CXADR-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合CXADR和NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含GFT2E2外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含GFT2E2外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合GFT2E2-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合GFT2E2和NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含CSMD1外显子23或外显子23的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含CSMD1外显子23或外显子23的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合CSMD1-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合CSMD1和NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含PTN外显子4或外显子4的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含PTN外显子4或外显子4的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合PTN-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合PTN和NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含ST14外显子11或外显子11的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含ST14外显子11或外显子11的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合ST14-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合ST14和NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含THBS1外显子9或外显子9的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含THBS1外显子9或外显子9的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合THBS1-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合THBS1和NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含AGRN外显子12或外显子12的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含AGRN外显子12或外显子12的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合AGRN-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合AGRN和NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含PVALB外显子4或外显子4的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含PVALB外显子4或外显子4的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合PVALB-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合PVALB和NRG1。
也提供一种第一抗体、或第一与第二抗体组,用于检测包含SLC3A2的转录本3的外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含所述SLC3A2外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合转录本3的SLC3A2-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合所述SLC3A2和NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含APP外显子14或外显子14的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含APP外显子14或外显子14的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合APP-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合APP和NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含WRN外显子33或外显子33的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含WRN外显子33或外显子33的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合WRN-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合WRN和NRG1。
本公开也提供一种第一抗体或第一和第二抗体组,用于检测由多核苷酸融合物所编码的多肽,且该多核苷酸融合物包含编码ASPH(或ASPH的等位基因变体)蛋白序列的核酸与编码NRG1(或NRG1的等位基因变体)蛋白序列的核酸融合。
更特别的是提供了一种用于检测多肽融合物的第一抗体或第一与第二抗体组,且该多肽融合物包含一部分由ASPH的外显子22或外显子22的等位基因变体所编码的多肽与一部分由NRG1的外显子2或外显子2的等位基因变体所编码的多肽融合。也提供了一种包含第一抗体或第一与第二抗体组的检测测定法,用于检测是否存在有包含一部分由ASPH的外显子22或外显子22的等位基因变体所编码的多肽与一部分由NRG1的外显子2或外显子2的等位基因变体所编码的多肽融合的多肽融合物,其中该第一抗体优选地结合该ASPH-NRG1多肽融合物,而该第一与第二抗体组分别优选地结合ASPH与NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含NOTCH2外显子6或外显子6的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含NOTCH2外显子6或外显子6的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合NOTCH2-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合NOTCH2和NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含CD74外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含CD74外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合CD74-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合CD74和NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含SDC4外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含SDC4外显子2或外显子2的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合SDC4-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合SDC4和NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含SDC4外显子4或外显子4的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含SDC4外显子4或外显子4的等位基因变体所编码的多肽的一部分与NRG1外显子2或外显子2的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合SDC4-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合SDC4和NRG1。
也提供一种第一抗体或第一与第二抗体组,用于检测包含SLC4A4外显子14或外显子14的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物。也提供一种包含用于检测包含SLC4A4外显子14或外显子14的等位基因变体所编码的多肽的一部分与NRG1外显子6或外显子6的等位基因变体所编码的多肽的一部分所融合的多肽融合物的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体优选地结合SLC4A4-NRG1多肽融合物,而该第一与第二抗体组优选地分别结合SLC4A4和NRG1。
本公开也提供一种第一抗体或第一和第二抗体组,用于检测由多核苷酸融合物所编码的多肽,且该多核苷酸融合物包含编码ZFAT(或ZFAT的等位基因变体)蛋白序列的核酸与编码NRG1(或NRG1的等位基因变体)蛋白序列的核酸融合。
更特别的是提供了一种用于检测多肽融合物的第一抗体或第一与第二抗体组,且该多肽融合物包含一部分由ZFAT的外显子12或外显子12的等位基因变体所编码的多肽与一部分由NRG1的外显子6或外显子6的等位基因变体所编码的多肽融合。也提供了一种包含第一抗体或第一与第二抗体组的检测测定法,用于检测是否存在有包含一部分由ZFAT的外显子12或外显子12的等位基因变体所编码的多肽与一部分由NRG1的外显子6或外显子6的等位基因变体所编码的多肽融合的多肽融合物,其中该第一抗体优选地结合该ZFAT-NRG1多肽融合物,而该第一与第二抗体组分别优选地结合ZFAT与NRG1。
本公开也提供一种第一抗体或第一和第二抗体组,用于检测由多核苷酸融合物所编码的多肽,且该多核苷酸融合物包含编码DSCAML1(或DSCAML1的等位基因变体)蛋白序列的核酸与编码NRG1(或NRG1的等位基因变体)蛋白序列的核酸融合。
更特别的是提供了一种用于检测多肽融合物的第一抗体或第一与第二抗体组,且该多肽融合物包含一部分由DSCAML1的外显子3或外显子3的等位基因变体所编码的多肽与一部分由NRG1的外显子或外显子2的等位基因变体所编码的多肽融合。也提供了一种包含第一抗体或第一与第二抗体组的检测测定法供检测是否存在有包含一部分由DSCAML1的外显子3或外显子3的等位基因变体所编码的多肽与一部分由NRG1的外显子2或外显子2的等位基因变体所编码的多肽融合的多肽融合物,其中该第一抗体优选地结合该DSCAML1-NRG1多肽融合物,而该第一与第二抗体组分别优选地结合DSCAML1与NRG1。
优选地,该抗NRG1抗体优选地与NRG1的EGF样结构域结合。在本公开的多肽融合物中检测EGF样结构域的存在是有利的,因为其显示出EGF样结构域被翻译并因此是与作为融合配偶体的VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1框内融合部分。
本文所提及的抗NRG1、VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的抗体系可使用在流式细胞仪(FC)、荧光原位杂交法(FISH)、免疫细胞化学染色法(ICC)、免疫组织化学染色法(IHC)或免疫荧光染色法(IF)中。
治疗方法
本公开的融合物存在于具有异常细胞的人类患者中或已在其中鉴定出,特别是已诊断患有癌症的患者。本公开的癌症尤其为胰脏癌,更特别是胰脏导管腺癌、肉瘤、膀胱癌、大肠癌、直肠癌、大肠直肠癌、胆囊癌、头颈癌、前列腺癌、子宫癌、乳癌、卵巢癌、肝癌、子宫内膜癌、肺癌,特别是非小细胞肺癌或浸润性黏液腺癌。
一般地,本公开也提供治疗具有像癌症、肿瘤的异常细胞的受试者的方法,其中所述癌症、肿瘤或异常细胞,其细胞、癌症或肿瘤包含本公开的NRG1多核苷酸融合物或表达如本公开的NRG1多肽融合物。
目前的NRG1融合物已确定为称为eNRGy的临床试验及早期准入计划(EarlyAccess Program,分别为NCT02912949和NCT04100694)的一部分。截至2022年4月12日的截止日期,在整个融合配偶体和多种不同癌症类型中,根据RECIST 1.1标准观察到总共约有70%的已登记且未被排除的经鉴定有NRG1融合物的患者表现出调查员评估反应。在表1的每个类别中都观察到调查员评估反应。观察到反应的适应症包括胰腺导管腺癌、非小细胞肺癌、乳癌及胆管癌。
NRG1融合配偶体的盛行率
NRG1融合配偶体类别 | 占总数的百分比 |
CD74 | 31% |
SLC3A2 | 16% |
SDC4 | 9% |
RBPMS | 4% |
CDH1 | 2% |
VTCN1 | 2% |
其他 | 23% |
表1:发现的NRG1融合配偶体的百分比概述,2022年4月12日截止前的临床试验NCT02912949的受试者中,以已鉴定的所指融合配偶体占融合物总数的百分比的方式表示。在截止日期前鉴定为其他包含NRG1融合物者占总数为小于2%。
优选地,该异常细胞、癌(或癌细胞)或肿瘤(或肿瘤细胞)包含本公开的多核苷酸融合物,且该多核苷酸融合物进一步包含编码NRG1的EGF样结构域的编码序列的框内融合物。
本公开也提供一种治疗患有包含本文所提及的NRG1多核苷酸融合物或表达本文所提及的NRG1多肽融合物的ErbB-2和/或ErbB-3阳性异常细胞、癌细胞或肿瘤细胞的受试者的方法,所述方法包括检测本文所提及的任一多核苷酸或多肽融合物是否存在,随后向该受试者施用有效量的ErbB-2和/或ErbB-3靶向剂,从而治疗该受试者的癌症。存在本公开的NRG1融合物中的任一者时,无论是多核苷酸或由其翻译的多肽,都表示了癌症。
也提供一种抑制患有包含本文所提及的NRG1多核苷酸融合物或表达本文所提及的NRG1多肽融合物的ErbB-2和ErbB-3阳性癌症的受试者进程的方法,所述方法包括检测本文所提及的任一多核苷酸或多肽融合物是否存在,随后向该受试者施用有效量的ErbB-2和/或ErbB-3靶向剂。
也提供一种ErbB-2和/或ErbB-3靶向剂,其用于治疗患有包含本文所提及的NRG1多核苷酸融合物或表达本文所提及的NRG1多肽融合物的ErbB-2和ErbB-3阳性癌症的受试者,所述治疗包含检测本文所提及的任一多核苷酸或多肽融合物是否存在,随后向该受试者施用有效量的ErbB-2和/或ErbB-3靶向剂。
也提供一种ErbB-2和/或ErbB-3靶向剂在制备用于治疗携带包含本文所提及的NRG1多核苷酸融合物或表达本文所提及的NRG1多肽融合物的ErbB-2和ErbB-3阳性癌症的受试者的药物中的用途,所述治疗包含检测本文所提及的任一多核苷酸或多肽融合物是否存在,随后向该受试者施用有效量的ErbB-2和/或ErbB-3靶向剂。
再进一步提供了一种评估受试者是否罹患癌症或是易于罹患癌症的方法,该方法包括检验获自受试者的样本以检测该样本中是否存在本文所提及的NRG1多核苷酸融合物或NRG1多肽融合物,且通过鉴定所述融合物是否存在来评估所述受试者罹患所述癌症或是易于罹患所述癌症。该检验优选地包含利用结合剂特异性地结合所述多核苷酸或是利用结合剂与包含所述多核苷酸融合物的多核苷酸结合来检测该融合物。对于与包含所述多核苷酸融合物的多核苷酸结合的结合剂的更多细节详见下述。
优选地,本文所提及的诊断方法包含将样本中NRG1融合物的检测与表达本文所提及NRG1多肽的癌症联系在一起的步骤,以诊断该受试者患有表达所述NRG1多肽融合物的癌症。NRG1融合分子的检测使得可鉴定受试者患有表达该NRG1融合多肽的癌症,且可诊断所述受试者有这类癌症。对癌症的潜在致癌性驱动因素有所了解使得可选择及指定改进或更好的特制治疗。因此,检测受试者样本中的融合分子,诸如融合多肽或多核苷酸,使得可改善患有NRG1相关癌症的受试者的存活机会。
本公开因此提供一种治疗癌症的方法。该癌症优选地为复发性癌症或转移性癌症。复发一般是指局部复发,且意指该癌症与原来的癌症在同一个地方或非常接近。当肿瘤已迁移到原来癌症附近的淋巴结或组织,或是扩散到远离原来癌症更远的器官或组织时,一般会说该肿瘤是转移性肿瘤。在这类情况下,两种表示均可使用。
该癌症尤其为胰脏癌、胰脏腺癌、胰脏导管腺癌、肉瘤、膀胱癌、大肠直肠癌、胆囊癌、头颈癌、前列腺癌、子宫癌、乳癌、卵巢癌、肝癌、子宫内膜癌、诸如非小细胞肺癌之肺癌,特别是非小细胞肺癌,更特别是浸润性黏液腺癌。优选地,该肿瘤基因组显示出在选自由EGFR、KRAS、cKIT-BRCA1-2、MET、ROS、RET、ALK、优选地KRAS所组成的组的一个或多个基因中是否存在突变。
本公开使用ErbB-2和/或ErbB-3靶向剂用于治疗表达NRG1融合多肽的癌症,其中所述癌症优选为ErbB-2和/或ErbB-3阳性癌症。所述靶向剂选自由以下所组成的组:包含结合ErbB-2的胞外部分的第一抗原结合位点和结合ErbB-3的胞外部分的第二抗原结合位点的多特异性抗体、ErbB-2的酪氨酸激酶抑制剂、包含结合ErbB-2的胞外部分的抗原结合位点的单特异性二价抗体、包含结合ErbB-3的胞外部分的抗原结合位点的单特异性二价抗体、或其任何组合。
还包含施用一种或多种选自以下组成的组中的化合物以治疗癌症:抑制PI3激酶路径中的组分的抑制剂、抑制MAPK路径中的组分的抑制剂、微管破坏药物、及组蛋白去乙酰酶(HDAC)的抑制剂。所述抑制剂优选地包含酪氨酸激酶抑制剂、PI3Ka抑制剂、Akt抑制剂、mTOR抑制剂或Src抑制剂。所述酪氨酸激酶抑制剂优选为阿法替尼(afatinib)、拉帕替尼(lapatinib)和/或来那替尼(neratinib)。所述PI3Ka抑制剂优选为BYL719。在一实施例中,所述Akt抑制剂为MK-2206。在一个优选实施方式中,所述mTOR抑制剂为维莫司(everolimus)。在一个优选实施方式中,所述Src抑制剂为塞卡替尼(saracatinib)。在一个优选实施方式中,所述微管破坏药物为紫杉醇。在一个优选实施方式中,所述HDAC抑制剂为伏立诺他(vorinostat)。在一实施例中,所述对ErbB 2和ErbB 3具有专一性的结合化合物为MM 111。
该ErbB-2靶向剂优选为具有单特异性二价抗体且其包含结合ErbB-2的细胞外部分的抗原结合位点。这类抗体优选为曲妥珠单抗、帕妥珠单抗(pertuzumab)或曲妥珠单抗艾坦辛(trastuzumab-emtansine)。ErbB-2的靶向治疗优选为ErbB-2TKI。该ErbB-2TKI优选为拉帕替尼、卡奈替尼(canertinib)、来那替尼、图卡替尼(tucatinib)(或厄滨替尼(irbinitinib))、CP-724714、达洛西替尼(tarloxitinib)、穆布里替尼(mubritinib)、阿法替尼、伐利替尼(varlitinib)及达科米替尼(dacomitinib)中的一或多者,优选为阿法替尼。ErbB-2TKI也可能影响ErbB-1信号传导,但与ErbB-1TKI的不同之处在于它对ErbB-2具有显著的活性。ErbB-3靶向治疗优选为带有单特异性二价抗体且其包含结合ErbB-3的细胞外部分的抗原结合位点。这类抗体优选为帕利珠单抗(patritumab)、瑟瑞妥单抗(seribantumab)、鲁妥珠单抗(lumretuzumab)、依更妥单抗(elgemtumab)、GSK2849330、KTN3379或AV-203。
优选地,该包含结合ErbB-3的细胞外部分的抗原结合位点的单特异性二价抗体包含帕利珠单抗、瑟瑞妥单抗、鲁妥珠单抗、依更妥单抗、GSK2849330、KTN3379或AV-203。
该酪氨酸激酶抑制剂优选为阿法替尼、拉帕替尼和/或来那替尼。
更优选地,该ErbB-2和/或ErbB-3靶向剂为多特异性抗体,或更优选地为双特异性抗体,且其包含与ErbB-2的细胞外部分结合的第一抗原结合位点以及与ErbB-3的细胞外部分结合的第二抗原结合位点。特别地,所述双特异性抗体为泽妥珠单抗(zenocutuzumab)。
该抗体优选地可在ErbB-2和ErbB-3阳性细胞中降低配体诱导的ErbB-3受体功能。此外,该抗体优选地可降低ErbB-2和ErbB-3阳性细胞中的配体诱导的生长。该抗体优选地为包含与ErbB-2的细胞外部分结合的第一抗原结合位点以及与ErbB-3的细胞外部分结合的第二抗原结合位点多特异性或双特异性抗体。
该受试者优选为人类受试者。该受试者优选为符合使用ErbB-2特异性抗体(诸如曲妥珠单抗)进行单克隆抗体疗法的受试者。在一个优选实施方式中,该受试者包含肿瘤/癌症,其优选为ErbB-2/ErbB-3阳性癌症,优选为具ErbB-2治疗抗性基因型和/或heregulin抗性基因型的肿瘤/癌症,优选为具单克隆抗体抗性基因型的肿瘤/癌症。涉及这类基因型的肿瘤可躲过当前抗HER2治疗方案(诸如(但不限于)抗ErbB-2的单克隆抗体疗法)的治疗。
特别地,该癌症包含属于转移性肿瘤的肿瘤,优选地其中该肿瘤已迁移到原来癌症附近的淋巴结或组织,或是扩散到远离原来癌症更远的器官或组织。
本公开也包括体内模型,诸如表达在其基因组内或是包含本文所提及的多核苷酸融合物的移植异常细胞的异种移植或基因转基因动物模型,和/或表达由其所编码的多肽融合物,以及使用ERB2和/或Erb3靶向剂或其他靶向剂的这类模型的治疗以评估这类试剂的治疗活性。优选地,该动物模型为非人类动物模型。
在所公开的实施方式中,所述体内动物模型包含如本公开的多核苷酸融合物和/或表达由其所编码的多肽融合物,其中由该动物模型所包含的多核苷酸融合物或多肽融合物优选地是由存在于该动物模型中的移植异常细胞所包含,或是由所述动物模型的基因组所包含。
在所公开的实施方式中,本公开提供一种使用ErbB-2和/或ErbB-3靶向剂的所述体内动物模型的治疗方法,该靶向剂选自由以下所组成的组:包含结合ErbB-2的胞外部分的第一抗原结合位点和结合ErbB-3的胞外部分的第二抗原结合位点的多特异性抗体、ErbB-2的酪氨酸激酶抑制剂、包含结合ErbB-2的胞外部分的抗原结合位点的单特异性二价抗体、包含结合ErbB-3的胞外部分的抗原结合位点的单特异性二价抗体、或其任何组合,所述方法包括向该动物施用所述Erb2和/或Erb3靶向剂。
在所公开的实施方式中,本公开提供一种ErbB-2和/或ErbB-3靶向剂,其选自由以下所组成的组:包含结合ErbB-2的胞外部分的第一抗原结合位点和结合ErbB-3的胞外部分的第二抗原结合位点的多特异性抗体、ErbB-2的酪氨酸激酶抑制剂、包含结合ErbB-2的胞外部分的抗原结合位点的单特异性二价抗体、包含结合ErbB-3的胞外部分的抗原结合位点的单特异性二价抗体、或其任何组合,用于所述体内动物模型的治疗中。所述方法优选地包含向该动物施用所述Erb2和/或Erb3靶向剂。
给药及施用
本公开的药物组合物中的活性成分或是任何治疗方法中所施用的实际剂量含量可变化以获得有效实现对特定患者、组合物和施用模式的所需治疗反应,而对患者不具有毒性的活性成分的量。所选剂量水平将依赖于多种药物动力学因素,包括所用的本公开的特定组合物的活性、施用途径、施用时间、所用特定化合物的排出速率、治疗持续时间;与所用特定组合物组合使用的其他药物、化合物和/或物质;所治疗患者的年龄、性别、体重、病状、一般健康状况及先前医疗病史;以及药学领域中所熟知的类似因素。所述活性成分优选为本公开的任一Erb2和/或Erb3靶向剂。任何经批准的活性成分或正在进行临床试验的药物,特别是一旦进入临床试验的第二期,可由医生考虑按照批准的剂量方案或临床试验剂量治疗方案施用。
待施用于患者的如本文中所提及的任一ErbB-2和/或ErbB-3靶向剂的量通常在治疗窗内,其意指使用足够量来获得治疗效果,同时该量不超过会导致副作用达到不可接受程度的阈值。用来获得所要治疗效果的治疗物质所需量越低,治疗窗一般会越大。所选剂量水平将取决于各种因素,包括施用途径、施用时间、所用特定化合物的排出速率、治疗持续期间、组合使用的其他药物、化合物和/或物质、所治疗受试者的年龄、性别、体重、病状、一般健康状况及先前医疗病史;以及药学领域中所熟知的类似因素。
关于泽妥珠单抗,其在相对高剂量下具有良好的安全性概况,因此比其他靶标或具有细胞毒性的化学治疗剂相比下提供了较大的治疗窗。本公开的双特异性抗体的施用遵循每周、每两周或每三周一次750mg的施用方案,优选为每两周一次750mg的剂量。给药优选地用于患有胰脏癌、NSCLC、或实体瘤的受试者,且其包括患有具NRG1融合物的实体瘤的任何受试者,其中此类受试者已在施用化疗照护标准、或ErbB-2或ErbB-3靶向剂、或TKI时有所进展。替代地,随后的给药方案包括每周一次400mg的固定剂量施用,优选为在单次施用800mg之后开始。在此替代给药方案之后,本公开的双特异性抗体优选地以每周一次400mg的剂量施用3周,接着1周没有给药。接着,遵循一个或多个由下列组成的四周期间循环:三次的每周一次400mg的固定剂量,随后一周不施用。优选为遵循此方式直到观察到治疗效果。
给药优选地涉及以静脉内注射进行本公开的双特异性抗体的两次输注以达到完整剂量,其优选为在给药>360mg抗体时。替代地,针对较低剂量可给予单次输注的完整剂量,例如在给药≤360mg抗体时。给药方案中可包括预备药物以减缓输注相关反应。
一般定义
冠词“一个”和“一种”在本文中是指冠词语法对象中的一个或多于一个(即,一个或至少一个)。
在整个本说明书及所附申请专利范围中,词语“包含”、“包括”及“具有”以及诸如“包含”、“包含有”、“包括”和“包括有”的变体将被解释为具有包容性。也就是说,在上下文允许的情况下,这些词语意欲表达可能包括未具体列举的其他元素或整数。
当提及核酸或氨基酸序列时,“一致性百分比(%)”的定义为在出于最佳比较目的而比对序列之后与经选择序列中的残基具有一致性的候选序列中的残基百分比。为了使比对优化,可以在两个序列之间在经比较的两个序列中的任一个中引入空隙。这模拟对可在所比较的全长序列上进行。替代性地,比对可在较短长度上进行,例如在约20个、约50个、约100个或更多个核酸/碱基或氨基酸上进行。序列一致性为报导的对齐区上方的两个序列之间的一致匹配百分比。
序列比较及两个序列之间的序列一致性百分比测定可使用数学算法实现。技术人员将了解以下事实:数个不同计算机程序可用于比对两个序列且测定两个序列之间的一致性(Kruskal,J.B.(1983)An overview of sequence comparison In D.Sankoff andJ.B.Kruskal,(编),Time warps,string edits and macromolecules:the theory andpractice of sequence comparison,第1-44页Addison Wesley)。两个氨基酸序列或核酸序列之间的序列一致性百分比可使用用于两个序列比对的尼-翁氏(Needleman andWunsch)算法来测定(Needleman,S.B.及Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。尼-翁氏算法已实施于计算机程序NEEDLE中。出于本公开的目的,使用来自EMBOSS软件包的NEEDLE程序以测定氨基酸和核酸序列的一致性百分比(版本2.8.0或更高版本,EMBOSS:TheEuropean Molecular Biology Open Software Suite(2000)Rice,P.LongdenJ.及Bleasby,A.Trends in Genetics 16,(6)第276-277页,http://emboss.bioinformatics.nl/)。对于蛋白质序列,使用EBLOSUM62以用于取代矩阵。对于DNA序列,使用DNAFULL。所用参数为10的空隙开放罚分及0.5的空隙扩展罚分。
在比对之后,通过如上文所描述的程序NEEDLE如下计算查询序列与本公开序列之间的序列一致性百分比:在两个序列中显示相同氨基酸或相同核苷酸的比对中的对应位置数目除以减除比对中的空隙总数目之后的比对总长度。
“等位基因变体”是指在源自患者的样本中所鉴定出的特定序列的天然发生的等位基因,其所鉴定出的序列已被指派SEQ ID NO,且其变体落入确定的变异范围内。该变异性的定义为与表示其为等位基因变体的序列有至少85%序列一致性,优选为90%一致性,或与其具有92%、94%、95%、96%或更佳为至少98%序列一致性。这类变体被认为是与之比较的序列的等位基因,因此仍有资格作为它的变体基因。如果在本文中没有明确提及与特定等位基因变体的关系,这些序列一致性百分比仍适用于所指的等位基因变体。
“双特异性抗体”是指一种抗体,其具有一个抗体可变域结合至第一抗原,而第二抗体可变域结合至第二抗原,其中所述第一和第二抗原是不相同的。术语“双特异性抗体”也涵盖二元抗体,其中一个抗体可变域结合至抗原的第一表位,而第二抗体可变域结合至相同抗原的第二表位。该术语进一步包括其中至少一个VH能够特异性地鉴定第一抗原与VL的抗体,与免疫球蛋白可变域中的至少一个VH配对,以能够特异性地鉴定第二抗原。所得VH/VL对将与抗原1或抗原2结合,且称为“二合一抗体”,例如在WO 2008/027236、WO 2010/108127及Schaefer等人(Cancer Cell 20,472-486,October 2011)中所描述。如本公开的双特异性抗体并不限于任何特定双特异性型式或是产生其的方法。
“可检测标记”是指化学、生物或其他修饰,包括但不限于荧光、质量、残基、染料、放射性同位素、标签或标记修饰等,其致使检测感兴趣的分子(在本文中优选为多核苷酸或多肽)是否存在。优选地,可检测标记为可见标记、荧光染料、淬灭体、紫外光可检测标记、显色标记、放射性标记、电化学标记、标签、当与对酶或分子条形码(barcode)具有特异性的基质接触时产生可检测标记的酶。示例性荧光染料包括水溶性罗丹明染料、荧光素、4,7-二氯荧光素、苯并蒽醌染料和能量转移染料,如以下参考文献中所公开的:Handbook ofMolecular Probes and Research Reagents,第8版(2002),Molecular Probes,Eugene,Oreg.;WO 2001/32783;美国专利公开号US2002-0081616,US2002-0086985;及Lee等人,1997,Nucleic Acids Research 25:2816-2822。
“分离的”或“纯化的”是指核酸或氨基酸序列被从其天然环境中移出而经分离或经纯化。“分离的”核酸分子包括从存在于该核酸分子的天然来源中的其他核酸分子分离出的核酸分子。此外,“分离的”核酸分子(诸如cDNA分子)在通过重组技术产生时包括不含其他细胞物质或培养基的状态,或在化学合成时实质上不含化学前驱物或其他化学品。
本文中的“样本”是指获自受试者或患者的样本。这类样本为生物样本或患者样本,这些术语在本文中可互换使用,因为本文所提及的样本为获自患者的生物样本。术语“样本”包括液态活检样本,采自实体癌或实体瘤的样本,且在向其应用任何处理之前将含有多核苷酸融合物和/或多肽融合物。特别地,该样本包含异常细胞,诸如肿瘤细胞或癌细胞。
措辞“不含其他细胞物质或培养基”包括核酸分子制剂,其中将该核酸分子自分离或重组产生核酸分子的细胞中的细胞成分分离出。
“引物”是指具有足够长度以特异性地与感兴趣的核苷酸序列杂交的单链核苷酸分子,以致使与界定了在聚合酶连锁反应(PCR)中被扩增的感兴趣区域的第二引物一起特异性结合(在本文中也称为杂交或退火)至目标或选定核苷酸序列。在本文中,第一和第二引物或引物对专门设计用于扩增跨越NRG1融合接点的核苷酸区域。特别地,使用了第一引物与第二引物的组合,该第一引物与对于在该融合接点一侧的NRG1序列部分具有特异性的核苷酸序列杂交,而该第二引物与对于在该融合接点另一侧的选自VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的融合配偶体具有特异性的核苷酸序列杂交。一般地,引物本身并不包含可检测标记。在NRG1融合多核苷酸的目标序列的全长上,引物通常与目标序列具有至少约80%、至少约85%、至少约90%、至少约95%、至少约97%、至少约98%或至少约99%的序列一致性。多核苷酸引物最优选地与其目标序列互补(在全长上具有100%序列一致性)。在本文中的所有实施例中,序列一致性通常在非变异/目标序列的全长上测得。
“探针”或“核酸探针”是指具有足够长度以特异性地与感兴趣的核苷酸序列杂交的单链核苷酸分子。特别地,在本公开的上下文中,该探针可检测发生在VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1中的融合物,特别是选自VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、DAAM1-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1和DSCAML1-NRG1的融合物。探针通常包含一种或两种可检测标记。在NRG1融合多核苷酸的目标序列的全长上,多核苷酸探针通常与目标序列具有至少约80%,至少约85%,至少约90%,至少约95%,至少约97%,至少约98%或至少约99%的序列一致性。该多核苷酸引物最优选地与其目标序列互补(在全长上具有100%序列一致性)。在本文中的所有实施例中,序列一致性通常在非变异/目标序列的全长上测得。
该多核苷酸探针优选为DNA探针、TaqMan探针、分子信标、蝎型探针(scorpionprobe)或于FISH中使用的探针。DNA探针通常与互补的目标序列杂交,且接着可使用(例如)可检测标记来检测。TaqMan探针在本领域中是已知的,且为具有附接至5'端的荧光染料及附接至3'端的淬灭体的多核苷酸。PCR中使用的聚合酶可裂解经杂交的探针,使荧光染料不受淬灭作用而使得可被检测到。分子信标探针在本领域是已知的,除了与目标序列杂交而将染料与淬灭体分开(而不是使用裂解将染料与淬灭体分离),其与TaqMan探针相似。Scorpion探针在本领域中是已知的且与分子信标相似,除了其3'端还包含一个与引物的延伸产物的5'端互补的序列以打开杂交中的探针而使染料可被检测到。该多核苷酸探针优选为TaqMan探针。该多核苷酸探针优选为TaqMan探针并用于上述任何PCR方法中。
用于像FISH或断裂分离FISH的技术中的探针具有适宜长度且包含单可检测标记。FISH涉及已与间期染色体或中期染色体杂交的高特异性DNA探针的检测且使之可见,以便使用荧光显微镜进行检测。断裂分离FISH特别适合检测融合断点。在这种情况下,感兴趣的基因的两端以不同的颜色标记,当发生易位而产生融合物时,两种单独的颜色不会共定位,而会观察到两种原色。在具有正常拷贝数的经标记感兴趣基因的正常细胞中,这两种颜色会共定位而产生融合信号。
用于鉴定由细胞构成的融合多核苷酸的探针或引物可使用标准分子生物学技术来分离或纯化,或基于本文所述数据库纪录中的序列信息来合成。如本文所述的这类核酸分子可使用标准杂交和克隆技术(例如,Sambrook等编,Molecular Cloning:A LaboratoryManual,第二版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989中所述者)来分离。此外,可使用任何适宜标准分子生物技术来分离、纯化或合成融合多核苷酸。在一些实施方式中,引物或探针对于cDNA具有特异性。例如,在一些实施方式中,引物或探针对于cDNA中的外显子-外显子接合具有特异性。
“多核苷酸融合物”是指两个多核苷酸之间的共价键结连接,其中在融合接点的一侧存在来自一个基因的核苷酸序列,而在另一侧存在来自另一个基因的核苷酸序列。在多核苷酸融合物的上下文中,该连接以允许转录成蛋白质的方式而可操作地连接。在融合接点的其中一侧上,所述核苷酸序列优选为来自VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1,且另一侧上优选为来自NRG1。
“多肽融合物”是指两个氨基酸之间的共价键结连接,其中在融合接点的一侧存在来自一个多肽的氨基酸序列,而在另一侧存在来自另一个多肽的氨基酸序列。在融合接点的其中一侧上,所述氨基酸序列优选为来自VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1,且另一侧上优选为来自NRG1。
“融合配偶体”是指由于基因重排而已与NRG1基因或多肽发生融合的基因或多肽。在本公开中,该融合配偶体为VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1中的一者。一般地,该融合配偶体位于该NRG1基因的上游处(在有义链的5’端),且框内融合而导致翻译为包含该融合配偶体的一部分与NRG1部分的嵌合蛋白。由于接合两个不同基因部分与融合多肽所导致的融合基因为来自这类融合基因的翻译产物。
“融合点”是指在氨基酸或核苷酸序列中有一侧出现NRG1序列且另一侧出现NRG1融合配偶体序列的位置。此为发生基因重排而形成嵌合基因、mRNA和/或蛋白序列的接点或位置。本文中的术语“融合点”可与“接点”或“融合接点”互换。
“位于3’处的基因序列”是指位于所指基因的下游或3’处且被认为是所述基因的一部分的任何组件(无论是否具调节性质)。本文中的调节组件包括增强子、沉默子、反应组件、内含子、外显子、内嵌启动子,且该组件对所涉基因具有特异性,使得可因为靠近该融合接点而以独特方式扩增及鉴定该融合物。此上下文中的位于3’处的基因序列也包括位于可用于独特地鉴定所涉融合物的任何调节组件之间的任何基因序列。
“位于5’处的基因序列”是指位于所指基因的下游或5’处且被认为是所述基因的一部分的任何组件(无论是否具调节性质)。本文中的调节组件包括启动子、增强子、沉默子、反应组件、内含子、外显子、内嵌启动子,且该组件对所涉基因具有特异性,使得可因为靠近该融合接点而以独特方式扩增及鉴定该融合物。此上下文中的位于5’处的基因序列也包括位于可用于独特地鉴定所涉融合物的任何调节组件之间的任何基因序列。
如本文中所使用,术语“ErbB-2”是指在人类中由ERBB-2基因编码的蛋白质。该基因或蛋白质的替代名称包括CD340;HER-2;HER-2/neu;MLN 19;NEU;NGL;TKR1。ERBB-2基因经常被称为HER2(出自人类表皮生长因子受体2)。当本文中引用ErbB-2时,该引用是指人类ErbB-2。包含结合ErbB-2的抗原结合部位的抗体与人类ErbB-2结合。ErbB-2抗原结合部位因在人类与其他哺乳动物异种同源物之间的序列及三级结构相似性而也可结合此类异种同源物,但不一定如此。人类ErbB-2蛋白及其编码基因的数据库登录号为(NP_001005862.1、NP_004439.2、NC_000017.10、NT_010783.15、NC_018928.2)。给予登录号主要是为了提供将ErbB-2识别为目标的进一步方法,结合抗体的ErbB-2蛋白的实际序列可有所变化,例如因为编码基因中的突变,诸如发生于一些癌症或类似者中的突变。ErbB-2抗原结合部位与ErbB-2及其各种变体结合,诸如由一些ErbB-2阳性肿瘤细胞所表达的。结合ErbB-2的抗原结合部位优选地与ErbB-2的结构域I结合。
如本文中所使用,术语“ErbB-3”是指在人类中由ERBB3基因编码的蛋白质。该基因或蛋白质的替代名称为HER3;LCCS2;MDA-BF-1;c-ErbB-3;c-ErbB3;ErbB3-S;p180-ErbB3;p45-sErbB3;和P85-sErbB3。当本文中引用ErbB-3时,该引用是指人类ErbB-3。包含结合ErbB-3的抗原结合部位的抗体与人类ErbB-3结合。ErbB-3抗原结合部位因在人类与其他哺乳动物异种同源物之间的序列及三级结构相似性而也可结合此类异种同源物,但不一定如此。人类ErbB-3蛋白及其编码基因之数据库登录号为(NP_001005915.1、NP_001973.2、NC_000012.11、NC_018923.2、NT_029419.12)。给予登录号主要是为了提供将ErbB-3识别为目标的进一步方法,抗体所结合的ErbB-3蛋白的实际序列可有所变化,例如因为编码基因中的突变,诸如发生于一些癌症或类似者中的突变。ErbB-3抗原结合部位与ErbB-3及其各种变体结合,诸如由一些ErbB-3阳性肿瘤细胞所表达的。结合ErbB-3的抗原结合部位优选地与ErbB-3的结构域III结合。
当引用ErbB-2或ErbB-3或其替代名称时,该引用是指人类ErbB-2或ErbB-3。本文中所引用的抗体结合至ErbB-2或ErbB-3及许多突变的ErbB-2或ErbB-3蛋白(如癌症中可发现的)。
本文所提及的SEQ ID NO的任意范围的数值明确包括落入相关范围内的全部的个别SEQ ID NO并包括其端值。因此,为避免疑虑,若(例如)引用SEQ ID NO:17-23,其意欲在所提及的SEQ ID NO范围的上下文中提及并公开SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22及SEQ ID NO:23。
条款
以下条款说明示例性实施方式。
1.一种多核苷酸,包含:VALB核酸序列或该VALB序列的等位基因变体,其与NRG1核酸序列或该NRG1序列的等位基因变体融合。
2.如条款1的多核苷酸,其中该VAPB核酸序列包含SEQ ID NO:17-23中的任一者或由其组成,或包含SEQ ID NO:17-23中的任一者的等位基因变体或由其组成,且该NRG1核酸序列包含SEQ ID NO:125-138中的任一者或由其组成。
3.如条款1或2的多核苷酸,其中该VALB核酸序列(或其等位基因变体)位于NRG1核酸序列(或其等位基因变体)的5’端。
4.如前述条款中的任一者的多核苷酸,其中该VAPB核酸序列的等位基因变体与SEQ ID NO:17-23中的任一者有至少85%的一致性,优选地至少90%的一致性,更优选地至少95%的序列一致性;且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85%的一致性,优选地至少90%的一致性,更优选地至少95%的序列一致性。
5.如前述条款中的任一者的多核苷酸,其中该VALB核酸与该NRG1核酸的融合物包含来自SEQ ID NO:3的2至约40个连续核酸,优选地包括位置102和103处的核酸
6.如前述条款中的任一者的多核苷酸,其中该编码NRG1蛋白序列(或其等位基因变体)的核酸包含或编码NRG1的EGF样结构域,优选为如SEQ ID NO:163的EGF样结构域。
7.一种多核苷酸,包含:
-PVALB核酸序列或该PVALB序列的等位基因变体,其与NRG1核酸序列或该NRG1序列的等位基因变体融合,或
-ASPH核酸序列或该ASPH序列的等位基因变体,其与NRG1核酸序列或该NRG1序列的等位基因变体融合,或
-DAAM1核酸序列或该DAAM1序列的等位基因变体,其与NRG1核酸序列或该NRG1序列的等位基因变体融合,或
-ZFAT核酸序列或该ZFAT序列的等位基因变体,其与NRG1核酸序列或该NRG1序列的等位基因变体融合,或
-DACAML1核酸序列或该DSCAML1序列的等位基因变体,其与NRG1核酸序列或该NRG1序列的等位基因变体融合。
8.如条款7的多核苷酸,其中
-该PVALB核酸序列包含SEQ ID NO:439-444中的任一者或由其组成,或包含SEQID NO:439-444中的任一者的等位基因变体或由其组成,且该NRG1核酸序列包含SEQ IDNO:125-138中的任一者或由其组成;
-该DAAM1核酸序列包含SEQ ID NO:606-631中的任一者或由其组成,或包含SEQID NO:606-631中的任一者的等位基因变体或由其组成,且该NRG1核酸序列包含SEQ IDNO:125-138中的任一者或由其组成;
-该ZFAT核酸序列包含SEQ ID NO:830-846中的任一者或由其组成,或包含SEQ IDNO:830-846中的任一者的等位基因变体或由其组成,且该NRG1核酸序列包含SEQ ID NO:125-138中的任一者或由其组成;或
-该DSCAML1核酸序列包含SEQ ID NO:870-903中的任一者或由其组成,或包含SEQID NO:870-903中的任一者的等位基因变体或由其组成,且该NRG1核酸序列包含SEQ IDNO:125-138中的任一者或由其组成。
9.如条款7或8的多核苷酸,其中该PVALB、DAAM1、ZFAT或DSCAML1核酸序列(或其等位基因变体)位于NRG1核酸序列(或其等位基因变体)的5’端。
10.如条款7-9中任一项的多核苷酸,其中
-该PVALB核酸序列的等位基因变体与SEQ ID NO:439-444中的任一者有至少85%的一致性,优选地至少90%的一致性,更优选地至少95%的序列一致性;且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85%的一致性,优选地至少90%的一致性,更优选地至少95%的序列一致性;
-该DAAM1核酸序列的等位基因变体与SEQ ID NO:606-631中的任一者有至少85%的一致性,优选地至少90%的一致性,更优选地至少95%的序列一致性;且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85%的一致性,优选地至少90%的一致性,更优选地至少95%的序列一致性;
-该ZFAT核酸序列的等位基因变体与SEQ ID NO:830-846中的任一者有至少85%的一致性,优选地至少90%的一致性,更优选地至少95%的序列一致性;且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85%的一致性,优选地至少90%的一致性,更优选地至少95%的序列一致性;或
-该DSCAML1核酸序列的等位基因变体与SEQ ID NO:870-903中的任一者有至少85%的一致性,优选地至少90%的一致性,更优选地至少95%的序列一致性;且该NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85%的一致性,优选地至少90%的一致性,更优选地至少95%的序列一致性。
11.如条款7至10中的任一项的多核苷酸,其中:
-该PVALB核酸与该NRG1核酸的融合物包含来自SEQ ID NO:437的2至约40个连续核酸,优选地包括位置102和103处的核酸;
-该DAAM1核酸与该NRG1核酸的融合物包含来自SEQ ID NO:605的2至约40个连续核酸,优选地包括位置75和76处的核酸;
-该ZFAT核酸与该NRG1核酸的融合物包含来自SEQ ID NO:828的2至约40个连续核酸,优选地包括位置75和76处的核酸;或
-该DSCAML1核酸与该NRG1核酸的融合物包含来自SEQ ID NO:868的2至约40个连续核酸,优选地包括位置75和76处的核酸。
12.如条款7至11中的任一项的多核苷酸,其中该编码NRG1蛋白序列(或其等位基因变体)的核酸包含或编码NRG1的EGF样结构域,优选为如SEQ ID NO:163的EGF样结构域。
13.一种多核苷酸,包含:
-VAPB的外显子1或外显子1的等位基因变体的一部分,其与NRG1的外显子2或外显子2的等位基因变体的一部分融合;
-CADM1的外显子7或外显子7的等位基因变体的一部分,与NRG1的外显子6或外显子6的等位基因变体的一部分;
-CD44的外显子5或外显子5的等位基因变体的一部分,与NRG1的外显子2或外显子2的等位基因变体的一部分;
-SLC3A2的转录本6的外显子1或外显子1的等位基因变体的一部分,与NRG1的外显子5或外显子5的等位基因变体的一部分;
-VTCN1的外显子2或外显子2的等位基因变体的一部分,与NRG1的外显子2或外显子2的等位基因变体的一部分;
-CDH1的外显子11或外显子11的等位基因变体的一部分,与NRG1的外显子2或外显子2的等位基因变体的一部分;
-CXADR的外显子1或外显子1的等位基因变体的一部分,与NRG1的外显子2或外显子2的等位基因变体的一部分;
-GTF2E2的外显子2或外显子2的等位基因变体的一部分,与NRG1的外显子2或外显子2的等位基因变体的一部分;
-CSMD1的外显子23或外显子23的等位基因变体的一部分,与NRG1的外显子6或外显子6的等位基因变体的一部分;
-PTN的外显子4或外显子4的等位基因变体的一部分,与NRG1的外显子2或外显子2的等位基因变体的一部分;
-ST14的外显子11或外显子11的等位基因变体的一部分,与NRG1的外显子6或外显子6的等位基因变体的一部分;
-THBS1的外显子9或外显子9的等位基因变体的一部分,与NRG1的外显子6或外显子6的等位基因变体的一部分;
-AGRN的外显子12或外显子12的等位基因变体的一部分,与NRG1的外显子6或外显子6的等位基因变体的一部分;
-PVALB的外显子4或外显子4的等位基因变体的一部分,与NRG1的外显子6或外显子6的等位基因变体的一部分;
-SLC3A2的转录本3的外显子2或外显子2的等位基因变体的一部分,与NRG1的外显子6或外显子6的等位基因变体的一部分;
-APP的外显子14或外显子14的等位基因变体的一部分,与NRG1的外显子6或外显子6的等位基因变体的一部分;
-WRN的外显子33或外显子33的等位基因变体的一部分,与NRG1的外显子6或外显子6的等位基因变体的一部分;
-DAAM1的外显子1或外显子1的等位基因变体的一部分,与NRG1的外显子1或外显子1的等位基因变体的一部分;
-ASPH的外显子22或外显子22的等位基因变体的一部分,与NRG1的外显子2或外显子2的等位基因变体的一部分;
-NOTCH2的外显子6或外显子6的等位基因变体的一部分,与NRG1的外显子6或外显子6的等位基因变体的一部分;
-CD74的外显子2或外显子2的等位基因变体的一部分,与NRG1的外显子2或外显子2的等位基因变体的一部分;
-SDC4的外显子2或外显子2的等位基因变体的一部分,与NRG1的外显子2或外显子2的等位基因变体的一部分;
-CD44的外显子5或外显子5的等位基因变体的一部分,与NRG1的外显子6或外显子6的等位基因变体的一部分;
-SLC4A4的外显子14或外显子14的等位基因变体的一部分,与NRG1的外显子6或外显子6的等位基因变体的一部分;
-SDC4的外显子4或外显子4的等位基因变体的一部分,与NRG1的外显子2或外显子2的等位基因变体的一部分;
-ZFAT的外显子12或外显子12的等位基因变体的一部分,与NRG1的外显子6或外显子6的等位基因变体的一部分;或
-DSCAML1的外显子3或外显子3的等位基因变体的一部分,与NRG1的外显子2或外显子2的等位基因变体的一部分。
14.如条款13的多核苷酸,其中VAPB的外显子1为SEQ ID NO:17的外显子;CADM1的外显子7为SEQ ID NO:39的外显子;CD44的外显子5为SEQ ID NO:65的外显子;SLC3A2的外显子1为SEQ ID NO:103的外显子;VTCN1的外显子2为SEQ ID NO:169的外显子;CDH1的外显子11为SEQ ID NO:198的外显子;CXADR的外显子1为SEQ ID NO:219的外显子;GTF2E2的外显子2为SEQ ID NO:236的外显子;CSMD1的外显子23为SEQ ID NO:279的外显子;PTN的外显子4为SEQ ID NO:318的外显子;ST14的外显子11为SEQ ID NO:342的外显子;THBS1的外显子9为SEQ ID NO:386的外显子;AGRN的外显子12为SEQ ID NO:416的外显子;PVALB的外显子4为SEQ ID NO:442的外显子;SLC3A2的外显子2为SEQ ID NO:457的外显子;APP的外显子14为SEQ ID NO:501的外显子;WRN的外显子33为SEQ ID NO:562的外显子;DAAM1的外显子1为SEQ ID NO:606的外显子;ASPH的外显子22为SEQ ID NO:658的外显子;NOTCH2的外显子6为SEQ ID NO:700的外显子;CD74的外显子2为SEQ ID NO:720的外显子;SDC4的外显子2为SEQ ID NO:746的外显子;CD44的外显子5为SEQ ID NO:65的外显子;SLC4A4的外显子14为SEQ ID NO:780的外显子;SDC4的外显子4为SEQ ID NO:748的外显子;ZFAT的外显子12为SEQ ID NO:841的外显子;DSCAML1的外显子3为SEQ ID NO:872的外显子,且NRG1的外显子1、2、5及6分别为SEQ ID NO:125、126、129和130的外显子。
15.如条款13或14中的任一项的多核苷酸,其中:
-该VAPB的外显子1或其等位基因变体的一部分位于该NRG1的外显子2或其等位基因变体的一部分的5’端;
-该CADM1的外显子7或其等位基因变体的一部分位于该NRG1的外显子6或其等位基因变体的一部分的5’端;
-该CD44的外显子5或其等位基因变体的一部分位于该NRG1的外显子2或其等位基因变体的一部分的5’端;
-该SLC3A2的外显子1或其等位基因变体的一部分位于该NRG1的外显子5或其等位基因变体的一部分的5’端;
-该VTCN1的外显子2或其等位基因变体的一部分位于该NRG1的外显子2或其等位基因变体的一部分的5’端;
-该CDH1的外显子11或其等位基因变体的一部分位于该NRG1的外显子2或其等位基因变体的一部分的5’端;
-该CXADR的外显子1或其等位基因变体的一部分位于该NRG1的外显子2或其等位基因变体的一部分的5’端;
-该GTF2E2的外显子2或其等位基因变体的一部分位于该NRG1的外显子2或其等位基因变体的一部分的5’端;
-该CSMD1的外显子23或其等位基因变体的一部分位于该NRG1的外显子6或其等位基因变体的一部分的5’端;
-该PTN的外显子4或其等位基因变体的一部分位于该NRG1的外显子2或其等位基因变体的一部分的5’端;
-该ST14的外显子11或其等位基因变体的一部分位于该NRG1的外显子6或其等位基因变体的一部分的5’端;
-该THBS1的外显子9或其等位基因变体的一部分位于该NRG1的外显子6或其等位基因变体的一部分的5’端;
-该AGRN的外显子12或其等位基因变体的一部分位于该NRG1的外显子6或其等位基因变体的一部分的5’端;
-该PVALB的外显子4或其等位基因变体的一部分位于该NRG1的外显子6或其等位基因变体的一部分的5’端;
-该SCL3A2的外显子2或其等位基因变体的一部分位于该NRG1的外显子6或其等位基因变体的一部分的5’端;
-该APP的外显子14或其等位基因变体的一部分位于该NRG1的外显子6或外显子6的等位基因变体部分的5’端;
-该WRN的外显子33或其等位基因变体的一部分位于该NRG1的外显子6或外显子6的等位基因变体部分的5’端;
-该DAAM1的外显子1或其等位基因变体的一部分位于该NRG1的外显子1或外显子1的等位基因变体部分的5’端;
-该ASPH的外显子22或其等位基因变体的一部分位于该NRG1的外显子2或外显子2的等位基因变体部分的5’端;
-该NOTCH2的外显子6或其等位基因变体的一部分位于该NRG1的外显子6或外显子6的等位基因变体部分的5’端;
-该CD74的外显子2或其等位基因变体的一部分位于该NRG1的外显子2或外显子2的等位基因变体部分的5’端;
-该SDC4的外显子2或其等位基因变体的一部分位于该NRG1的外显子2或外显子2的等位基因变体部分的5’端;
-该CD44的外显子5或其等位基因变体的一部分位于该NRG1的外显子6或外显子6的等位基因变体部分的5’端;
-该SLC4A4的外显子14或其等位基因变体的一部分位于该NRG1的外显子6或外显子6的等位基因变体部分的5’端;
-该SDC4的外显子4或其等位基因变体的一部分位于该NRG1的外显子2或外显子2的等位基因变体部分的5’端;
-该ZFAT的外显子12或其等位基因变体的一部分位于该NRG1的外显子6或外显子6的等位基因变体部分的5’端;及
-该DSCAML1的外显子3或其等位基因变体的一部分位于该NRG1的外显子2或外显子2的等位基因变体部分的5’端。
16.如条款13至15中的任一项的多核苷酸,其中:
-该VAPB的外显子1的等位基因变体与SEQ ID NO:17有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-CADM1该的外显子7的等位基因变体与SEQ ID NO:39有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该CD44的外显子5的等位基因变体与SEQ ID NO:65有至少85%的一致性,优选地与其有至少90%的一致性,更优选地有至少95%的一致性,或优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该SLC3A2的外显子1的等位基因变体与SEQ ID NO:103有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-VTCN1该的外显子2的等位基因变体与SEQ ID NO:169有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该CDH1的外显子11的等位基因变体与SEQ ID NO:198有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该NRG1的外显子2的等位基因变体与SEQ ID NO:126有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该NRG1的外显子5的等位基因变体与SEQ ID NO:129有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该NRG1的外显子6的等位基因变体与SEQ ID NO:130有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该CXADR的外显子1的等位基因变体与SEQ ID NO:219有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该GTF2E2的外显子2的等位基因变体与SEQ ID NO:236有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该CSMD1的外显子23的等位基因变体与SEQ ID NO:279有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该PTN的外显子4的等位基因变体与SEQ ID NO:318有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该ST14的外显子11的等位基因变体与SEQ ID NO:342有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该THBS1的外显子9的等位基因变体与SEQ ID NO:386有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该AGRN的外显子12的等位基因变体与SEQ ID NO:416有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该PVALB的外显子4的等位基因变体与SEQ ID NO:442有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该SCL3A2的外显子2的等位基因变体与SEQ ID NO:457有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该APP的外显子14的等位基因变体与SEQ ID NO:501有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该WRN的外显子33的等位基因变体与SEQ ID NO:562有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该DAAM1的外显子1的等位基因变体与SEQ ID NO:606有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该NRG1的外显子1的等位基因变体与SEQ ID NO:125有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该ASPH的外显子22的等位基因变体与SEQ ID NO:658有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该NOTCH2的外显子6的等位基因变体与SEQ ID NO:700有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该CD74的外显子2的等位基因变体与SEQ ID NO:720有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该SDC4的外显子2的等位基因变体与SEQ ID NO:746有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该CD44的外显子5的等位基因变体与SEQ ID NO:65有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该SLC4A4的外显子14的等位基因变体与SEQ ID NO:780有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该SDC4的外显子4的等位基因变体与SEQ ID NO:748有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-该ZFAT的外显子12的等位基因变体与SEQ ID NO:841有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;及
-该DSCAML1的外显子3的等位基因变体与SEQ ID NO:872有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
17.如条款13至16中的任一项的多核苷酸,其中:
-该VAPB与NRG1的融合物包含来自SEQ ID NO:3的2至约40个连续核酸,包括位置43和44处的核酸;
-该CADM1与NRG1的融合物包含来自SEQ ID NO:7的2至约40个连续核酸,包括位置53和54处的核酸;
-该CD44与NRG1的融合物包含来自SEQ ID NO:11的2至约40个连续核酸,包括位置52和53处的核酸;
-该SLC3A2与NRG1的融合物包含来自SEQ ID NO:15的2至约40个连续核酸,包括位置53和54处的核酸;
-该VTCN1与NRG1的融合物包含来自SEQ ID NO:166的2至约40个连续核酸,包括位置65和66处的核酸;
-该CDH1与NRG1的融合物包含来自SEQ ID NO:186的2至约40个连续核酸,包括位置119和120处的核酸;
-该CXADR与NRG1的融合物包含来自SEQ ID NO:217的2至约40个连续核酸,包括位置43和44处的核酸;
-该GTF2E2与NRG1的融合物包含来自SEQ ID NO:233的2至约40个连续核酸,包括位置141和142处的核酸;
-该CSMD1与NRG1的融合物包含来自SEQ ID NO:255的2至约40个连续核酸,包括位置88和89处的核酸;
-该PTN与NRG1的融合物包含来自SEQ ID NO:313的2至约40个连续核酸,包括位置102和103处的核酸;
-该ST14与NRG1的融合物包含来自SEQ ID NO:330的2至约40个连续核酸,包括位置95和96处的核酸;
-该THBS1与NRG1的融合物包含来自SEQ ID NO:376的2至约40个连续核酸,包括位置56和57处的核酸;
-该AGRN与NRG1的融合物包含来自SEQ ID NO:403的2至约40个连续核酸,包括位置106和107处的核酸;
-该PVALB与NRG1的融合物包含来自SEQ ID NO:437的2至约40个连续核酸,包括位置102和103处的核酸;
-该SLC3A2与NRG1的融合物包含来自SEQ ID NO:454的2至约40个连续核酸,包括位置93和94处的核酸;
-该APP与NRG1的融合物包含来自SEQ ID NO:486的2至约40个连续核酸,包括位置54和55处的核酸;
-该WRN与NRG1的融合物包含来自SEQ ID NO:528的2至约40个连续核酸,包括位置96和97处的核酸;
-该DAAM1与NRG1的融合物包含来自SEQ ID NO:605的2至约40个连续核酸,包括位置75和76处的核酸;
-该ASPH与NRG1的融合物包含来自SEQ ID NO:635的2至约40个连续核酸,包括位置75和76处的核酸;
-该NOTCH2与NRG1的融合物包含来自SEQ ID NO:693的2至约40个连续核酸,包括位置75和76处的核酸;
-该CD74与NRG1的融合物包含来自SEQ ID NO:717的2至约40个连续核酸,包括位置75和76处的核酸;
-该SDC4与NRG1的融合物包含来自SEQ ID NO:743的2至约40个连续核酸,包括位置75和76处的核酸;
-该CD44与NRG1的融合物包含来自SEQ ID NO:761的2至约40个连续核酸,包括位置75和76处的核酸;
-该SLC4A4与NRG1的融合物包含来自SEQ ID NO:765的2至约40个连续核酸,包括位置75和76处的核酸;
-该SDC4与NRG1的融合物包含来自SEQ ID NO:824的2至约40个连续核酸,包括位置75和76处的核酸;
-该ZFAT与NRG1的融合物包含来自SEQ ID NO:828的2至约40个连续核酸,包括位置75和76处的核酸;以及
-该DSCAML1与NRG1的融合物包含来自SEQ ID NO:868的2至约40个连续核酸,包括位置75和76处的核酸。
18.如条款13至17中的任一项的多核苷酸,其中:
-该VAPB与NRG1的融合物包含SEQ ID NO:3或其等位基因变体;
-该CAD1与NRG1的融合物包含SEQ ID NO:7或其等位基因变体;
-该CD44与NRG1的融合物包含SEQ ID NO:11或其等位基因变体;
-该SLC3A2与NRG1的融合物包含SEQ ID NO:15或其等位基因变体;
-该VTCN1与NRG1的融合物包含SEQ ID NO:166或其等位基因变体;
-该CDH1与NRG1的融合物包含SEQ ID NO:186或其等位基因变体;
-该CXADR与NRG1的融合物包含SEQ ID NO:217或其等位基因变体;
-该GTF2E2与NRG1的融合物包含SEQ ID NO:233或其等位基因变体;
-该CSMD1与NRG1的融合物包含SEQ ID NO:255或其等位基因变体;
-该PTN与NRG1的融合物包含SEQ ID NO:313或其等位基因变体;
-该ST14与NRG1的融合物包含SEQ ID NO:330或其等位基因变体;
-该THBS1与NRG1的融合物包含SEQ ID NO:376或其等位基因变体;
-该AGRN与NRG1的融合物包含SEQ ID NO:403或其等位基因变体;
-该PVALB与NRG1的融合物包含SEQ ID NO:437或其等位基因变体;
-该SLC3A2与NRG1的融合物包含SEQ ID NO:454或其等位基因变体;
-该APP与NRG1的融合物包含SEQ ID NO:486或其等位基因变体;
-该WRN与NRG1的融合物包含SEQ ID NO:528或其等位基因变体;
-该DAAM1与NRG1的融合物包含SEQ ID NO:605或其等位基因变体;
-该ASPH与NRG1的融合物包含SEQ ID NO:635或其等位基因变体;
-该NOTCH2与NRG1的融合物包含SEQ ID NO:693或其等位基因变体;
-该CD74与NRG1的融合物包含SEQ ID NO:717或其等位基因变体;
-该SDC4与NRG1的融合物包含SEQ ID NO:743或其等位基因变体;
-该CD44与NRG1的融合物包含SEQ ID NO:761或其等位基因变体;
-该SLC4A4与NRG1的融合物包含SEQ ID NO:765或其等位基因变体;
-该SDC4与NRG1的融合物包含SEQ ID NO:824或其等位基因变体;
-该ZFAT与NRG1的融合物包含SEQ ID NO:828或其等位基因变体;及
-该DSCAML1与NRG1的融合物包含SEQ ID NO:868或其等位基因变体。
19.如条款13至18中的任一项的多核苷酸,其中:
-该VAPB的外显子1的一部分是或包含SEQ ID NO:1或SEQ ID NO:1的等位基因变体;
-该CADM1的外显子7的一部分是或包含SEQ ID NO:5或SEQ ID NO:5的等位基因变体;
-该CD44的外显子5的一部分是或包含SEQ ID NO:9或SEQ ID NO:9的等位基因变体;
-该SLC3A2的外显子1的一部分是或包含SEQ ID NO:13或SEQ ID NO:13的等位基因变体;
-该VTCN1的外显子2的一部分是或包含SEQ ID NO:164或SEQ ID NO:164的等位基因变体;
-该CDH1的外显子11的一部分是或包含SEQ ID NO:184或SEQ ID NO:184的等位基因变体;
-该CXADR的外显子1的一部分是或包含SEQ ID NO:219或SEQ ID NO:219的等位基因变体;
-该GTF2E2的外显子2的一部分是或包含SEQ ID NO:236或SEQ ID NO:236的等位基因变体;
-该CXADR的外显子23的一部分是或包含SEQ ID NO:279或SEQ ID NO:279的等位基因变体;
-该PTN的外显子4的一部分是或包含SEQ ID NO:318或SEQ ID NO:318的等位基因变体;
-该ST14的外显子11的一部分是或包含SEQ ID NO:342或SEQ ID NO:342的等位基因变体;
-该THBS1的外显子9的一部分是或包含SEQ ID NO:385或SEQ ID NO:386的等位基因变体;
-该AGRN的外显子12的一部分是或包含SEQ ID NO:416或SEQ ID NO:416的等位基因变体;
-该PVALB的外显子4的一部分是或包含SEQ ID NO:442或SEQ ID NO:442的等位基因变体;
-该SLC3A2的外显子2的一部分是或包含SEQ ID NO:457或SEQ ID NO:457的等位基因变体;
-该NRG1的外显子2的一部分是或包含SEQ ID NO:165或SEQ ID NO:165的等位基因变体;
-该NRG1的外显子5的一部分是或包含SEQ ID NO:14或SEQ ID NO:14的等位基因变体;
-该NRG1的外显子6的一部分是或包含SEQ ID NO:6或其等位基因变体;
-该APP的外显子14的一部分是或包含SEQ ID NO:484或其等位基因变体;
-该WRN的外显子33的一部分是或包含SEQ ID NO:526或其等位基因变体;
-该DAAM1的外显子1的一部分是或包含SEQ ID NO:603或其等位基因变体;
-该ASPH的外显子22的一部分是或包含SEQ ID NO:633或其等位基因变体;
-该NOTCH2的外显子6的一部分是或包含SEQ ID NO:691或其等位基因变体;
-该CD74的外显子2的一部分是或包含SEQ ID NO:715或其等位基因变体;
-该SDC4的外显子2的一部分是或包含SEQ ID NO:741或其等位基因变体;
-该CD44的外显子5的一部分是或包含SEQ ID NO:759或其等位基因变体;
-该SLC4A4的外显子14的一部分是或包含SEQ ID NO:763或其等位基因变体;
-该SDC4的外显子4的一部分是或包含SEQ ID NO:822或其等位基因变体;
-该ZFAT的外显子12的一部分是或包含SEQ ID NO:826或其等位基因变体;
-该DSCAML1的外显子3的一部分是或包含SEQ ID NO:866或其等位基因变体;及
-该NRG1的外显子1的一部分是或包含SEQ ID NO:604或其等位基因变体。
20.如条款13至18中的任一项的多核苷酸,其中:
-VAPB与NRG1的融合物包含在VAPB的外显子1与NRG1的外显子2之间的融合接点,优选为SEQ ID NO:3的VAPB位置43的核酸与NRG1位置44的核酸之间的接点;
-CADM1与NRG1的融合物包含在CADM1的外显子7与NRG1的外显子6之间的融合接点,优选为SEQ ID NO:7的CADM1位置53的核酸与NRG1位置54的核酸之间的接点;
-CD44与NRG1的融合物包含在CD44的外显子5与NRG1的外显子2之间的融合接点,优选为SEQ ID NO:11的CD44位置52的核酸与NRG1位置53的核酸之间的接点;
-SLC3A2与NRG1的融合物包含在SLC3A2的外显子1与NRG1的外显子5之间的融合接点,优选为SEQ ID NO:15的SLC3A2位置53的核酸与NRG1位置54的核酸之间的接点;
-VTCN1与NRG1的融合物包含在VTCN1的外显子2与NRG1的外显子2之间的融合接点,优选为SEQ ID NO:166的VTCN1位置65的核酸与NRG1位置66的核酸之间的接点;
-CDH1与NRG1的融合物包含在CDH1的外显子11与NRG1的外显子2之间的融合接点,优选为SEQ ID NO:186的CDH1位置119的核酸与NRG1位置120的核酸之间的接点;
-CXADR与NRG1的融合物包含在CXADR的外显子1与NRG1的外显子2之间的融合接点,优选为SEQ ID NO:217的CXADR位置43的核酸与NRG1位置44的核酸之间的接点;
-GTF2E2与NRG1的融合物包含在GTF2E2的外显子2与NRG1的外显子2之间的融合接点,优选为SEQ ID NO:233的GTF2E2位置141的核酸与NRG1位置142的核酸之间的接点;
-CSMD1与NRG1的融合物包含在CSMD1的外显子23与NRG1的外显子6之间的融合接点,优选为SEQ ID NO:255的CSMD1位置88的核酸与NRG1位置89的核酸之间的接点;
-PTN与NRG1的融合物包含在PTN的外显子4与NRG1的外显子2之间的融合接点,优选为SEQ ID NO:313的PTN位置102的核酸与NRG1位置103的核酸之间的接点;
-ST14与NRG1的融合物包含在ST14的外显子11与NRG1的外显子6之间的融合接点,优选为SEQ ID NO:330的ST14位置95的核酸与NRG1位置96的核酸之间的接点;
-THBS1与NRG1的融合物包含在THBS1的外显子9与NRG1的外显子6之间的融合接点,优选为SEQ ID NO:376的THBS1位置56的核酸与NRG1位置57的核酸之间的接点;
-AGRN与NRG1的融合物包含在AGRN的外显子12与NRG1的外显子6之间的融合接点,优选为SEQ ID NO:403的AGRN位置106的核酸与NRG1位置107的核酸之间的接点;
-PVALB与NRG1的融合物包含在PVALB的外显子4与NRG1的外显子6之间的融合接点,优选为SEQ ID NO:437的PVALB位置102的核酸与NRG1位置103的核酸之间的接点;
-SLC3A2与NRG1的融合物包含在SLC3A2的外显子2与NRG1的外显子6之间的融合接点,优选为SEQ ID NO:454的SLC3A2位置93的核酸与NRG1位置94的核酸之间的接点;
-APP与NRG1的融合物包含在APP的外显子14与NRG1的外显子6之间的融合接点,优选为SEQ ID NO:486的APP位置54的核酸与NRG1位置55的核酸之间的接点;
-WRN与NRG1的融合物包含在WRN的外显子33与NRG1的外显子6之间的融合接点,优选为SEQ ID NO:528的WRN位置96的核酸与NRG1位置97的核酸之间的接点;
-DAAM1与NRG1的融合物包含在DAAM1的外显子1与NRG1的外显子1之间的融合接点,优选为SEQ ID NO:605的DAAM1位置的核酸75与NRG1位置的核酸76之间的接点;
-ASPH与NRG1的融合物包含在ASPH的外显子22与NRG1的外显子2之间的融合接点,优选为SEQ ID NO:635的ASPH位置75的核酸与NRG1位置76的核酸之间的接点;
-NOTCH2与NRG1的融合物包含在NOTCH2的外显子6与NRG1的外显子6之间的融合接点,优选为SEQ ID NO:693的NOTCH2位置75的核酸与NRG1位置76的核酸之间的接点;
-CD74与NRG1的融合物包含在CD74的外显子2与NRG1的外显子2之间的融合接点,优选为SEQ ID NO:717的CD74位置75的核酸与NRG1位置76的核酸之间的接点;
-SDC4与NRG1的融合物包含在SDC4的外显子2与NRG1的外显子2之间的融合接点,优选为SEQ ID NO:743的SDC4位置75的核酸与NRG1位置76的核酸之间的接点;
-CD44与NRG1的融合物包含在CD44的外显子5与NRG1的外显子6之间的融合接点,优选为SEQ ID NO:761的VAPB位置75的核酸与NRG1位置76的核酸之间的接点;
-SLC4A4与NRG1的融合物包含在SLC4A4的外显子14与NRG1的外显子6之间的融合接点,优选为SEQ ID NO:765的SLC4A4位置75的核酸与NRG1位置76的核酸之间的接点;
-SDC4与NRG1的融合物包含在SDC4的外显子4与NRG1的外显子2之间的融合接点,优选为SEQ ID NO:824的SDC4位置75的核酸与NRG1位置76的核酸之间的接点;
-ZFAT与NRG1的融合物包含在ZFAT的外显子12与NRG1的外显子6之间的融合接点,优选为SEQ ID NO:828的ZFAT位置75的核酸与NRG1位置76的核酸之间的接点;及
-DSCAML1与NRG1的融合物包含在DSCAML1的外显子3与NRG1的外显子2之间的融合接点,优选为SEQ ID NO:868的DSCAML1位置75的核酸与NRG1位置76的核酸之间的接点。
21.如前述条款中的任一者的多核苷酸,其中该多核苷酸被分离或纯化。
22.如前述条款中的任一者的多核苷酸,其中融合物中的任一者为框内融合。
23.如前述条款中的任一者的多核苷酸,其中该多核苷酸为哺乳动物多核苷酸,优选为人类多核苷酸。
24.一种由如前述条款中的任一者的多核苷酸所编码的多肽融合物。
25.一种包含如条款1至23中任一项的多核苷酸的载体。
26.一种包含如条款1至23中任一项的多核苷酸或如条款25的载体的重组宿主细胞。
27.一种制造如条款24的多肽融合物的方法,包含将如条款26的宿主细胞维持在适合该宿主细胞所包含的多核苷酸表达的条件下,从而表达该多核苷酸且产生多肽融合物,随后分离或纯化该多肽融合物。
28.一种制造重组宿主细胞的方法,包含将如条款25的载体导入宿主细胞内。
29.一种检测测定法,其包含用于检测如条款1至23中的任一项的多核苷酸融合物的存在的核酸探针、引物或引物对。
30.一种用于检测如条款1至23中任一项的多核苷酸融合物的核酸探针、引物或引物对。
31.如条款30的核酸探针、引物或引物对,其长度为10至40个核苷酸。
32.如条款30或31的核酸探针、引物或引物对,其中所检测到的融合物包含:
-VAPB与NRG1的融合物,包含SEQ ID NO:3或由其组成,且优选地包括位置43或44的核酸;
-CADM1与NRG1的融合物,包含SEQ ID NO:7或由其组成,且优选地包括位置53或54的核酸;
-CD44与NRG1的融合物,包含SEQ ID NO:11或由其组成,且优选地包括位置52或53的核酸;
-SLC3A2与NRG1的融合物,包含SEQ ID NO:15或由其组成,且优选地包括位置53或54的核酸;
-VTCN1与NRG1的融合物,包含SEQ ID NO:166或由其组成,且优选地包括位置65或66的核酸;
-CDH1与NRG1的融合物,包含SEQ ID NO:186或由其组成,且优选地包括位置119或120的核酸;
-CXADR与NRG1的融合物,包含SEQ ID NO:217或由其组成,且优选地包括位置43或44的核酸;
-GTF2E2与NRG1的融合物,包含SEQ ID NO:233或由其组成,且优选地包括位置141或142的核酸;
-CSMD1与NRG1的融合物,包含SEQ ID NO:255或由其组成,且优选地包括位置88或89的核酸;
-PTN与NRG1的融合物,包含SEQ ID NO:313或由其组成,且优选地包括位置102或103的核酸;
-ST14与NRG1的融合物,包含SEQ ID NO:330或由其组成,且优选地包括位置95或96的核酸;
-THBS1与NRG1的融合物,包含SEQ ID NO:376或由其组成,且优选地包括位置56或57的核酸;
-AGRN与NRG1的融合物,包含SEQ ID NO:403或由其组成,且优选地包括位置106或107的核酸;
-PVALB与NRG1的融合物,包含SEQ ID NO:437或由其组成,且优选地包括位置102或103的核酸;
-SLC3A2与NRG1的融合物,包含SEQ ID NO:454或由其组成,且优选地包括位置93或94的核酸;
-APP与NRG1的融合物,包含SEQ ID NO:486或由其组成,且优选地包括位置54或55的核酸;
-WRN与NRG1的融合物,包含SEQ ID NO:528或由其组成,且优选地包括位置96或97的核酸;
-DAAM1与NRG1的融合物,包含SEQ ID NO:605或由其组成,且优选地包括位置75或76的核酸;
-ASPH与NRG1的融合物,包含SEQ ID NO:635或由其组成,且优选地包括位置75或76的核酸;
-NOTCH2与NRG1的融合物,包含SEQ ID NO:693或由其组成,且优选地包括位置75或76的核酸;
-CD74与NRG1的融合物,包含SEQ ID NO:717或由其组成,且优选地包括位置75或76的核酸;
-SDC4与NRG1的融合物,包含SEQ ID NO:743或由其组成,且优选地包括位置75或76的核酸;
-CD44与NRG1的融合物,包含SEQ ID NO:761或由其组成,且优选地包括位置75或76的核酸;
-SLC4A4与NRG1的融合物,包含SEQ ID NO:765或由其组成,且优选地包括位置75或76的核酸;
-SDC4与NRG1的融合物,包含SEQ ID NO:824或由其组成,且优选地包括位置75或76的核酸;
-ZFAT与NRG1的融合物,包含SEQ ID NO:828或由其组成,且优选地包括位置75或76的核酸;以及
-DSCAML1与NRG1的融合物,包含SEQ ID NO:868或由其组成,且优选地包括位置75或76的核酸。
33.如条款30至32中任一项的核酸探针、引物或引物对,其中:
-用于检测VAPB与NRG1的融合物的探针、引物或引物对特异性地与由VAPB的外显子1所组成的序列或位于外显子1的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测CADM1与NRG1的融合物的探针、引物或引物对特异性地与由CADM1的外显子7所组成的序列或位于外显子7的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测CD44与NRG1的融合物的探针、引物或引物对特异性地与由CD44的外显子5所组成的序列或位于外显子5的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测SLC3A2的转录本6与NRG1的融合物的探针、引物或引物对特异性地与由SLC3A2的外显子1所组成的序列或位于外显子1的5’处的序列杂交,和/或特异性地与由NRG1的外显子5所组成的序列或位于外显子5的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测VTCN1与NRG1的融合物的探针、引物或引物对特异性地与由VTCN1的外显子2所组成的序列或位于外显子2的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测CDH1与NRG1的融合物的探针、引物或引物对特异性地与由CDH1的外显子11所组成的序列或位于外显子11的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测CXADR与NRG1的融合物的探针、引物或引物对特异性地与由CXADR的外显子1所组成的序列或位于外显子1的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测GTF2E2与NRG1的融合物的探针、引物或引物对特异性地与由GTF2E2的外显子2所组成的序列或位于外显子2的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测CSMD1与NRG1的融合物的探针、引物或引物对特异性地与由CSMD1的外显子23所组成的序列或位于外显子23的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测PTN与NRG1的融合物的探针、引物或引物对特异性地与由PTN的外显子4所组成的序列或位于外显子4的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测ST14与NRG1的融合物的探针、引物或引物对特异性地与由ST14的外显子11所组成的序列或位于外显子11的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测THBS1与NRG1的融合物的探针、引物或引物对特异性地与由THBS1的外显子9所组成的序列或位于外显子9的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测AGRN与NRG1的融合物的探针、引物或引物对特异性地与由AGRN的外显子12所组成的序列或位于外显子12的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测PVALB与NRG1的融合物的探针、引物或引物对特异性地与由PVALB的外显子4所组成的序列或位于外显子4的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测SLC3A2的转录本3与NRG1的融合物的探针、引物或引物对特异性地与由SLC3A2的外显子2所组成的序列或位于外显子2的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测APP与NRG1的融合物的探针、引物或引物对特异性地与由APP的外显子14所组成的序列或位于外显子14的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测WRN与NRG1的融合物的探针、引物或引物对特异性地与由WRN的外显子33所组成的序列或位于外显子33的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测DAAM1与NRG1的融合物的探针、引物或引物对特异性地与由DAAM1的外显子1所组成的序列或位于外显子1的5’处的序列杂交,和/或特异性地与由NRG1的外显子1所组成的序列或位于外显子1的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测ASPH与NRG1的融合物的探针、引物或引物对特异性地与由ASPH的外显子22所组成的序列或位于外显子22的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测NOTCH2与NRG1的融合物的探针、引物或引物对特异性地与由NOTCH2的外显子6所组成的序列或位于外显子6的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测CD74与NRG1的融合物的探针、引物或引物对特异性地与由CD74的外显子2所组成的序列或位于外显子2的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测SDC4与NRG1的融合物的探针、引物或引物对特异性地与由SDC4的外显子2所组成的序列或位于外显子2的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测CD44与NRG1的融合物的探针、引物或引物对特异性地与由CD44的外显子5所组成的序列或位于外显子5的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测SLC4A4与NRG1的融合物的探针、引物或引物对特异性地与由SLC4A4的外显子14所组成的序列或位于外显子14的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测SDC4与NRG1的融合物的探针、引物或引物对特异性地与由SDC4的外显子4所组成的序列或位于外显子4的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测ZFAT与NRG1的融合物的探针、引物或引物对特异性地与由ZFAT的外显子12所组成的序列或位于外显子12的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;或
-用于检测DSCAML1与NRG1的融合物的探针、引物或引物对特异性地与由DSCAML1的外显子3所组成的序列或位于外显子3的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性。
34.如条款33的核酸探针、引物或引物对,其中:
-来自VAPB的外显子1包含SEQ ID NO:17或其等位基因变体,或是由其组成;
-来自CADM1的外显子7包含SEQ ID NO:39或其等位基因变体,或是由其组成;
-来自CD44的外显子5包含SEQ ID NO:65或其等位基因变体,或是由其组成;
-来自SLC3A2的外显子1包含SEQ ID NO:103或其等位基因变体,或是由其组成;
-来自VTCN1的外显子2包含SEQ ID NO:169或其等位基因变体,或是由其组成;
-来自CDH1的外显子11包含SEQ ID NO:198或其等位基因变体,或是由其组成;
-来自CXADR的外显子1包含SEQ ID NO:219或其等位基因变体,或是由其组成;
-来自GTF2E2的外显子2包含SEQ ID NO:236或其等位基因变体,或是由其组成;
-来自CSMD1的外显子23包含SEQ ID NO:279或其等位基因变体,或是由其组成;
-来自PTN的外显子4包含SEQ ID NO:318或其等位基因变体,或是由其组成;
-来自ST14的外显子11包含SEQ ID NO:342或其等位基因变体,或是由其组成;
-来自THBS1的外显子9包含SEQ ID NO:386或其等位基因变体,或是由其组成;
-来自AGRN的外显子12包含SEQ ID NO:416或其等位基因变体,或是由其组成;
-来自PVALB的外显子4包含SEQ ID NO:442或其等位基因变体,或是由其组成;
-来自SLC3A2的外显子2包含SEQ ID NO:457或其等位基因变体,或是由其组成;
-来自APP的外显子14包含SEQ ID NO:501或其等位基因变体,或是由其组成;
-来自WRN的外显子33包含SEQ ID NO:562或其等位基因变体,或是由其组成;
-来自DAAM1的外显子1包含SEQ ID NO:606或其等位基因变体,或是由其组成;
-来自ASPH的外显子22包含SEQ ID NO:658或其等位基因变体,或是由其组成;
-来自NOTCH2的外显子6包含SEQ ID NO:700或其等位基因变体,或是由其组成;
-来自CD74的外显子2包含SEQ ID NO:720或其等位基因变体,或是由其组成;
-来自SDC4的外显子2包含SEQ ID NO:746或其等位基因变体,或是由其组成;
-来自CD44的外显子5包含SEQ ID NO:65或其等位基因变体,或是由其组成;
-来自SLC4A4的外显子14包含SEQ ID NO:780或其等位基因变体,或是由其组成;
-来自SDC4的外显子4包含SEQ ID NO:748或其等位基因变体,或是由其组成;
-来自ZFAT的外显子12包含SEQ ID NO:841或其等位基因变体,或是由其组成;
-来自DSCAML1的外显子3包含SEQ ID NO:872或其等位基因变体,或是由其组成;以及
-来自NRG1的外显子1、2、5及6分别包含SEQ ID NO:125、126、129和130或其等位基因变体,或是由其组成。
35.如条款33的核酸探针、引物或引物对,其中:
-用于检测VAPB与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:17所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测CADM1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:57所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测CD44与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:99所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测SLC3A2与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:103所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:157所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测VTCN1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:181所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测CDH1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:213所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测CXADR与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:219所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测GTF2E2与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:252所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测CSMD1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:309所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测PTN与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:326所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测ST14与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:372所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测THBS1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:399所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测AGRN与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:433所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测PVALB与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:450所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测SLC3A2与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:482所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测APP与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:524所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测WRN与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:601所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测DAAM1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:606所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:138所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测ASPH与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:689所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测NOTCH2与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:713所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测CD74与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:739所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测SDC4与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:757所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测CD44与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:99所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测SLC4A4与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:820所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测SDC4与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:940所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测ZFAT与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:864所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;及
-用于检测DSCAML1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:938所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性。
36.一种用于原位杂交测定法以检测如条款1至23中任一项的多核苷酸融合物的第一核酸探针和第二核酸探针,
-其中该第一探针特异性地与位于SEQ ID NO:3的位置43的核酸5’处的VAPB序列杂交,且该第二探针特异性地与位于SEQ ID NO:3的位置44的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:7的位置53的核酸5’处的CADM1序列杂交,且该第二探针特异性地与位于SEQ ID NO:7的位置54的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:11的位置52的核酸5’处的CD44序列杂交,且该第二探针特异性地与位于SEQ ID NO:11的位置53的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:15的位置53的核酸5’处的SLC3A2序列杂交,且该第二探针特异性地与位于SEQ ID NO:15的位置54的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:166的位置65的核酸5’处的VTCN1序列杂交,且该第二探针特异性地与位于SEQ ID NO:166的位置66的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:186的位置119的核酸5’处的CDH1序列杂交,且该第二探针特异性地与位于SEQ ID NO:186的位置120的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:217的位置43的核酸5’处的CXADR序列杂交,且该第二探针特异性地与位于SEQ ID NO:217的位置44的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:233的位置141的核酸5’处的GTF2E2序列杂交,且该第二探针特异性地与位于SEQ ID NO:233的位置142的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:255的位置88的核酸5’处的CSMD1序列杂交,且该第二探针特异性地与位于SEQ ID NO:255的位置89的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:313的位置102的核酸5’处的PTN序列杂交,且该第二探针特异性地与位于SEQ ID NO:313的位置103的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:330的位置95的核酸5’处的ST14序列杂交,且该第二探针特异性地与位于SEQ ID NO:330的位置96的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:376的位置56的核酸5’处的THBS1序列杂交,且该第二探针特异性地与位于SEQ ID NO:376的位置57的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:403的位置106的核酸5’处的AGRN序列杂交,且该第二探针特异性地与位于SEQ ID NO:403的位置107的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:437的位置102的核酸5’处的PVALB序列杂交,且该第二探针特异性地与位于SEQ ID NO:437的位置103的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:454的位置93的核酸5’处的SLC3A2序列杂交,且该第二探针特异性地与位于SEQ ID NO:454的位置94的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:486的位置54的核酸5’处的APP序列杂交,且该第二探针特异性地与位于SEQ ID NO:486的位置55的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:528的位置96的核酸5’处的WRN序列杂交,且该第二探针特异性地与位于SEQ ID NO:528的位置97的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:605的位置75的核酸5’处的DAAM1序列杂交,且该第二探针特异性地与位于SEQ ID NO:605的位置76的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:635的位置75的核酸5’处的ASPH序列杂交,且该第二探针特异性地与位于SEQ ID NO:635的位置76的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:693的位置75的核酸5’处的NOTCH2序列杂交,且该第二探针特异性地与位于SEQ ID NO:693的位置76的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:717的位置75的核酸5’处的CD74序列杂交,且该第二探针特异性地与位于SEQ ID NO:717的位置76的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:743的位置75的核酸5’处的SDC4序列杂交,且该第二探针特异性地与位于SEQ ID NO:743的位置76的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:761的位置75的核酸5’处的CD44序列杂交,且该第二探针特异性地与位于SEQ ID NO:761的位置76的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:765的位置75的核酸5’处的SLC4A4序列杂交,且该第二探针特异性地与位于SEQ ID NO:765的位置76的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:824的位置75的核酸5’处的SDC4序列杂交,且该第二探针特异性地与位于SEQ ID NO:824的位置76的核酸3’处的NRG1序列杂交;
-其中该第一探针特异性地与位于SEQ ID NO:828的位置75的核酸5’处的ZFAT序列杂交,且该第二探针特异性地与位于SEQ ID NO:828的位置76的核酸3’处的NRG1序列杂交;或
-其中该第一探针特异性地与位于SEQ ID NO:868的位置75的核酸5’处的DSCAML1序列杂交,且该第二探针特异性地与位于SEQ ID NO:868的位置76的核酸3’处的NRG1序列杂交。
37.一种用于检测如条款1至23中任一项的多核苷酸融合物所编码的多肽的第一抗体或第一与第二抗体组。
38.一种包含用于检测如条款1至23中任一项的多核苷酸融合物所编码的多肽的存在的第一抗体或第一与第二抗体组的检测测定法,其中该第一抗体或第一与第二抗体组优选为如条款34的第一抗体或第一与第二抗体组。
39.如条款38的第一抗体或第一与第二抗体组,或如条款32的检测测定法,其中该第一抗体结合选自VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1或DSCAML1-NRG1的多肽融合物,而该第一与第二抗体组分别结合VAPB与NRG1或CADM1与NRG1、或CD44与NRG1、SLC3A2与NRG1、CDH1与NRG1、CXADR与NRG1、GTF2E2与NRG1、CSMD1与NRG1、PTN与NRG1、ST14与NRG1、THBS1与NRG1、AGRN与NRG1、PVALB与NRG1、APP与NRG1、WRN与NRG1、ASPH与NRG1、NOTCH2与NRG1、CD74与NRG1、SDC4与NRG1、SLC4A4与NRG1、ZFAT与NRG1、或DSCAML1与NRG1。
40.一种用于鉴定样本中的如条款1至23中任一项的多核苷酸融合物、或由其所编码的多肽的方法,所述方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。
41.一种用于检测样本中的如条款1至23中任一项的多核苷酸融合物、或由其所编码的多肽是否存在的方法,所述方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。
42.一种用于确定来自受试者的异常细胞是否包含如条款1至23中任一项的融合物、或由其所编码的多肽的方法,所述方法包括检验获自该受试者的异常细胞的多核苷酸或多肽内容物是否在样本中存在该融合物。
43.一种鉴定受试者携带如条款1至23中任一项的多核苷酸融合物、或由其所编码的多肽的方法,所述方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。
44.如条款37至40中任一项的方法,其中该检验包含利用诸如条款31至36中任一项的核酸探针、引物或引物对的结合剂特异性地结合该多核苷酸或由其所编码的多肽以检测该融合物,或利用结合包含该多核苷酸融合物的多核苷酸的结合剂以检测该融合物。
45.如条款40至44中任一项的方法,其中该检验包含扩增或检测用于区别该多核苷酸融合物或由其所编码的多肽是否存在的序列。
46.如条款41至45中任一项的方法,其中该多核苷酸融合物获自一会表达包含NRG1的EGF样结构域的多核苷酸融合物的异常细胞。
47.如条款40至46中任一项的方法,其中该方法包括从受试者获得样本的步骤,随后为从该样本中分离该多核苷酸或由其所编码的多肽的步骤。
48.如条款40至47中任一项的方法,其中该方法包括从该样本纯化或分离该多核苷酸的步骤。
49.如条款40至48中任一项的方法,其中该结合剂是或包含引物、引物对、探针或抗体。
50.如条款40至49中任一项的方法,其中该检验为离体(ex vivo)方法,优选为体外(in vitro)方法。
51.如条款40至50中任一项的方法,其中该结合剂包含或与可检测标记相关联。
52.如条款40至51中任一项的方法,其中该样本为液态活检样本或固态样本,诸如经福尔马林固定的石蜡包埋组织(FFPE)样本。
53.如条款40至52中任一项的方法,其中该样本包含血液、血清、血浆、胸水、尿液、精液、羊水或腹水。
54.如条款40至53中任一项的方法,其中该样本包含变异细胞,诸如肿瘤细胞或癌细胞,或其多核苷酸或多肽内容物。
55.一种治疗患有包含多核苷酸融合物和/或表达由其所编码的融合多肽的ErbB-2和/或ErbB-3阳性癌症或肿瘤的受试者的方法,所述方法包括向该受试者施用有效量的ErbB-2和/或ErbB-3靶向剂,其中该融合物为如条款1至23中任一项的融合物。
56.一种抑制患有包含多核苷酸融合物和/或表达由其所编码的融合多肽的ErbB-2和ErbB-3阳性癌症或肿瘤的受试者进程的方法,所述方法包括向该受试者施用有效量的ErbB-2和/或ErbB-3靶向剂,其中所述融合物为如条款1至23中任一项的融合物。
57.一种用于治疗患有包含多核苷酸融合物和/或表达由其所编码的融合多肽的ErbB-2和ErbB-3阳性癌症或肿瘤的受试者中的ErbB-2和/或ErbB-3靶向剂,所述治疗包含向该受试者施用有效量的ErbB-2和/或ErbB-3靶向剂,其中所述融合物为如条款1至23中任一项的融合物。
58.一种诊断受试者是否有包含如条款1至23中任一项的多核苷酸融合物或由其所编码的多肽的异常细胞的方法,该方法包括检验获自受试者的样本以检测该样本中是否存在该融合物。
59.如条款58的方法,其中该检验包含利用诸如条款30至35中任一项的核酸探针、引物或引物对的结合剂特异性地结合该多核苷酸或由其所编码的多肽以检测该融合物,或利用结合包含该多核苷酸融合物的多核苷酸的结合剂以检测该融合物。
60.一种评估受试者是否罹患癌症或肿瘤或是易于罹患癌症或肿瘤的方法,该方法包括检验获自受试者的样本以检测该样本中是否存在如条款1至23中任一项的多核苷酸融合物或由其所编码的多肽,且通过鉴定所述多核苷酸或多肽融合物是否存在来评估所述受试者罹患所述癌症或肿瘤或是易于罹患所述癌症或肿瘤。
61.如条款55至58中任一项的方法或用途,其中该ErbB-2和/或ErbB-3靶向剂选自由以下所组成的组:包含结合ErbB-2的胞外部分的第一抗原结合位点和结合ErbB-3的胞外部分的第二抗原结合位点的多特异性抗体、ErbB-2的酪氨酸激酶抑制剂、包含结合ErbB-2的胞外部分的抗原结合位点的单特异性二价抗体、包含结合ErbB-3的胞外部分的抗原结合位点的单特异性二价抗体、或其任何组合。
62.如条款55至58或61中任一项的方法或用途,其中该ErbB-2和/或ErbB-3靶向剂为泽妥珠单抗(zenocutuzumab)。
63.如条款41至62中任一项的方法或用途,其中该异常细胞、癌细胞或肿瘤细胞包含如条款1至23中任一项的多核苷酸融合物或由其编码的多肽,且其中该细胞所包含的多核苷酸融合物进一步包含编码NRG1的EGF样结构域的编码序列的框内融合物。
64.如条款41至63中任一项的方法或用途,其中该异常细胞系来自癌症,尤其所述癌症为腺癌,更特别是黏液腺癌、胰脏癌,更特别是胰脏腺癌,更特别是胰脏导管腺癌、肾细胞癌、肉瘤、膀胱癌、大肠癌、直肠癌、大肠直肠癌、胆囊癌、头颈癌、前列腺癌、子宫癌、乳癌、卵巢癌、肝癌、子宫内膜癌、肺癌,优选为非小细胞肺癌,优选地、更优选地为浸润性黏液腺癌、或是原发性癌或转移性癌。
65.一种包含如条款1至23中任一项的多核苷酸融合物和/或表达由其所编码的多肽融合物的体内动物模型,其中由该动物模型所包含的多核苷酸融合物或多肽融合物优选地是由存在于该动物模型中的移植异常细胞所包含,或是由所述动物模型的基因组所包含。
66.一种以Erb2和/或Erb3靶向剂治疗如条款66的体内动物模型的方法,该靶向剂选自由以下所组成的组:包含结合ErbB-2的胞外部分的第一抗原结合位点和结合ErbB-3的胞外部分的第二抗原结合位点的多特异性抗体、ErbB-2的酪氨酸激酶抑制剂、包含结合ErbB-2的胞外部分的抗原结合位点的单特异性二价抗体、包含结合ErbB-3的胞外部分的抗原结合位点的单特异性二价抗体、或其任何组合,所述方法包括向该动物施用所述Erb2和/或Erb3靶向剂。
67.一种用于原位杂交测定法以检测VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的基因重排的第一核酸探针和第二核酸探针,其中:
-用于检测VAPB的基因重排的第一探针特异性地与SEQ ID NO:1的位置43的核酸5’处的VAPB序列杂交,且该第二探针特异性地与位于SEQ ID NO:1的位置43的核酸3’处的VAPB序列杂交;
-用于检测CADM1的基因重排的第一探针特异性地与SEQ ID NO:5的位置53的核酸5’处的CADM1序列杂交,且该第二探针特异性地与位于SEQ ID NO:5的位置53的核酸3’处的CADM1序列杂交;
-用于检测CD44的基因重排的第一探针特异性地与SEQ ID NO:9的位置52的核酸5’处的CD44序列杂交,且该第二探针特异性地与位于SEQ ID NO:9的位置52的核酸3’处的CD44序列杂交;
-用于检测SLC3A2的基因重排的第一探针特异性地与SEQ ID NO:13的位置53的核酸5’处的SLC3A2序列杂交,且该第二探针特异性地与位于SEQ ID NO:13的位置53的核酸3’处的SLC3A2序列杂交;
-用于检测VTCN1的基因重排的第一探针特异性地与SEQ ID NO:164的位置65的核酸5’处的VTCN1序列杂交,且该第二探针特异性地与位于SEQ ID NO:164的位置65的核酸3’处的VTCN1序列杂交;
-用于检测CDH1的基因重排的第一探针特异性地与SEQ ID NO:184的位置119的核酸5’处的CDH1序列杂交,且该第二探针特异性地与位于SEQ ID NO:184的位置119的核酸3’处的CDH1序列杂交;
-用于检测CXADR的基因重排的第一探针特异性地与SEQ ID NO:215的位置43的核酸5’处的CXADR序列杂交,且该第二探针特异性地与位于SEQ ID NO:215的位置43的核酸3’处的CXADR序列杂交;
-用于检测GTF2E2的基因重排的第一探针特异性地与SEQ ID NO:231的位置141的核酸5’处的GTF2E2序列杂交,且该第二探针特异性地与位于SEQ ID NO:231的位置141的核酸3’处的GTF2E2序列杂交;
-用于检测CSMD1的基因重排的第一探针特异性地与SEQ ID NO:253的位置88的核酸5’处的CSMD1序列杂交,且该第二探针特异性地与位于SEQ ID NO:253的位置88的核酸3’处的CSMD1序列杂交;
-用于检测PTN的基因重排的第一探针特异性地与SEQ ID NO:311的位置102的核酸5’处的PTN序列杂交,且该第二探针特异性地与位于SEQ ID NO:311的位置102的核酸3’处的PTN序列杂交;
-用于检测ST14的基因重排的第一探针特异性地与SEQ ID NO:328的位置95的核酸5’处的ST14序列杂交,且该第二探针特异性地与位于SEQ ID NO:328的位置95的核酸3’处的ST14序列杂交;
-用于检测AGRN的基因重排的第一探针特异性地与SEQ ID NO:401的位置106的核酸5’处的AGRN序列杂交,且该第二探针特异性地与位于SEQ ID NO:401的位置106的核酸3’处的AGRN序列杂交;
-用于检测THBS1的基因重排的第一探针特异性地与SEQ ID NO:374的位置56的核酸5’处的THBS1序列杂交,且该第二探针特异性地与位于SEQ ID NO:374的位置56的核酸3’处的THBS1序列杂交;
-用于检测PVALB的基因重排的第一探针特异性地与SEQ ID NO:435的位置102的核酸5’处的PVALB序列杂交,且该第二探针特异性地与位于SEQ ID NO:435的位置102的核酸3’处的PVALB序列杂交;
-用于检测SLC3A2的基因重排的第一探针特异性地与SEQ ID NO:452的位置93的核酸5’处的SLC3A2序列杂交,且该第二探针特异性地与位于SEQ ID NO:452的位置93的核酸3’处的SLC3A2序列杂交;
-用于检测APP的基因重排的第一探针特异性地与SEQ ID NO:484的位置54的核酸5’处的APP序列杂交,且该第二探针特异性地与位于SEQ ID NO:484的位置54的核酸3’处的APP序列杂交;
-用于检测WRN的基因重排的第一探针特异性地与SEQ ID NO:526的位置96的核酸5’处的WRN序列杂交,且该第二探针特异性地与位于SEQ ID NO:526的位置96的核酸3’处的WRN序列杂交;
-用于检测DAAM1的基因重排的第一探针特异性地与SEQ ID NO:603的位置75的核酸5’处的DAAM1序列杂交,且该第二探针特异性地与位于SEQ ID NO:603的位置75的核酸3’处的DAAM1序列杂交;
-用于检测ASPH的基因重排的第一探针特异性地与SEQ ID NO:633的位置75的核酸5’处的ASPH序列杂交,且该第二探针特异性地与位于SEQ ID NO:633的位置75的核酸3’处的ASPH序列杂交;
-用于检测NOTCH2的基因重排的第一探针特异性地与SEQ ID NO:691的位置75的核酸5’处的NOTCH2序列杂交,且该第二探针特异性地与位于SEQ ID NO:691的位置75的核酸3’处的NOTCH2序列杂交;
-用于检测CD74的基因重排的第一探针特异性地与SEQ ID NO:715的位置75的核酸5’处的CD74序列杂交,且该第二探针特异性地与位于SEQ ID NO:715的位置75的核酸3’处的CD74序列杂交;
-用于检测SDC4的基因重排的第一探针特异性地与SEQ ID NO:741的位置75的核酸5’处的SDC4序列杂交,且该第二探针特异性地与位于SEQ ID NO:741的位置75的核酸3’处的SDC4序列杂交;
-用于检测CD44的基因重排的第一探针特异性地与SEQ ID NO:759的位置75的核酸5’处的CD44序列杂交,且该第二探针特异性地与位于SEQ ID NO:759的位置75的核酸3’处的CD44序列杂交;
-用于检测SLC4A4的基因重排的第一探针特异性地与SEQ ID NO:763的位置75的核酸5’处的SLC4A4序列杂交,且该第二探针特异性地与位于SEQ ID NO:763的位置75的核酸3’处的SLC4A4序列杂交;
-用于检测SDC4的基因重排的第一探针特异性地与SEQ ID NO:822的位置75的核酸5’处的SDC4序列杂交,且该第二探针特异性地与位于SEQ ID NO:822的位置75的核酸3’处的SDC4序列杂交;
-用于检测ZFAT的基因重排的第一探针特异性地与SEQ ID NO:826的位置75的核酸5’处的ZFAT序列杂交,且该第二探针特异性地与位于SEQ ID NO:826的位置75的核酸3’处的ZFAT序列杂交;或
-用于检测DSCAML1的基因重排的第一探针特异性地与SEQ ID NO:866的位置75的核酸5’处的DSCAML1序列杂交,且该第二探针特异性地与位于SEQ ID NO:866的位置75的核酸3’处的DSCAML1序列杂交。
实施例
实施例1:检验样本制备
液态样本或活检包括血液、血清、血浆、胸腔积液、尿液、精液、阴道拭子、羊水、腹膜液、无细胞灌洗液或其他生物流体。
当使用血液作为起始材料时,可在以细胞稳定剂(诸如无细胞的DNA BCT管(Streck))处理过的管子中收集血液,该细胞稳定剂可防止血球细胞在收集后破裂,并将来自正常细胞的野生型DNA/RNA的污染降至最低。
实施例2:从血浆纯化循环DNA
虽然此实施例的实验方案描述了从1ml的血浆样本中分离cfDNA,但当期望有更高产量及其他样本类型(如尿液及血清)时,该实验方案也适合从其他体积中分离。该实验方案基于循环核酸套组(CNA)(Qiagen,产品编号#55114)及日期为10/2019的手册(HB-0202-006)。
在开始之前,允许来自人类受试者的血浆样本平衡至室温,无论是来自于适合冷藏温度储存的样本或是从患者抽取后直接使用。所有的离心步骤都是在室温下进行。必要时,用磷酸盐缓冲盐水(PBS)将体积低于1ml的样本调整到总共1ml。
缓冲液及试剂的制备
根据制造商的说明书来制备缓冲液ACB、ACW1和ACW2。简言之,在使用前,将200ml异丙醇(100v/v%)添加到300ml缓冲液ACB浓缩物中以得到500ml缓冲液ACB。在添加异丙醇之后,将所得缓冲液混合均匀。在使用前,将25ml乙醇96-100(v/v%)添加到19ml缓冲液ACW1浓缩物以得到44ml缓冲液ACW1。在添加乙醇之后将所得液体混合均匀。在使用前,将30ml乙醇(96-100%)添加到13ml缓冲液ACW2浓缩物中以得到43ml缓冲液,随后将其混合均匀。例如,要处理12个1ml血浆样本时,将10.6ml缓冲液ACL与67.5μl的含有载体的AVE缓冲液混合在一起。
从血浆分离cfDNA
流程:将100μl QIAGEN蛋白酶K抽吸到50ml离心管中,将1ml的血浆添加到该50ml离心管中。添加0.8ml ACL缓冲液(含有1.0μg载体RNA),之后关上盖子并用脉冲涡动混合30秒且同时在管内形成涡流。将样本和ACL缓冲液彻底混合以产生均质溶液。将样本在60℃下培育30分钟使其立即裂解。在离心管内向该裂解物添加1.8ml ACB缓冲液,之后关上盖子并用脉冲涡动彻底混合15至30秒。将该裂解物ACB缓冲混合液在离心管内在冰上培育5分钟。将QIAamp小型管柱(Mini column)插入QIAvac 24Plus上的真空接头(VacConnector)中,并根据制造商的说明书设定。将20ml延伸管插入敞开的QIAamp小型管柱中。将20ml延伸管紧紧插入QIAamp小型管柱中。
在冰上培育之后,将该裂解物-ACB缓冲混合液施加至QIAamp小型管柱的延伸管中。开启真空泵,且当所有裂解物已完全被抽吸通过管柱时,关闭真空泵且使压力释放至0毫巴。小心地移出且丢弃延伸管。如果为QIAvac连接系统(Connecting System)的一部分,则可使用真空调节器(Vacuum Regulator)。为了避免交叉污染,不要将延伸管在邻近的QIAamp小型管柱上方移动。将600μl ACW1缓冲液施加至QIAamp小型管柱中。将管柱的盖子打开且开启真空泵。在所有ACW1缓冲液已被抽吸通过QIAamp小型管柱之后,关闭真空泵且使压力释放至0毫巴。将750μl ACW2缓冲液施加至QIAamp小型管柱中。将管柱的盖子打开且开启真空泵。在所有ACW2缓冲液已被抽吸通过QIAamp小型管柱之后,关闭真空泵且使压力释放至0毫巴。将750μl乙醇(96v/v%)施加至QIAamp小型管柱中。将管柱的盖子打开且开启真空泵。在所有乙醇已被抽吸通过QIAamp离心层析管柱(spin column)之后,关闭真空泵且使压力释放至0毫巴。将QIAamp小型管柱的盖子盖紧,将该管柱自真空歧管中移出且抛弃真空接头。将QIAamp小型管柱置放于干净的2ml收集管中,且全速(20,000x g;14,000rpm)离心3分钟。将QIAamp小型管柱置放于新的2ml收集管中。打开盖子,且将总成在56℃下培育10分钟以使膜完全干燥。将QIAamp小型管柱置放于干净的1.5ml洗脱管中并丢弃最后使用的2ml收集管。将20μl AVE缓冲液小心地施加至QIAamp小型管柱膜(Mini membrane)之中心。盖紧盖子且在室温下培育3分钟。将洗脱缓冲液AVE平衡至室温。回收的洗脱液体积为约5μl,小于施加至QIAamp小型管柱的洗脱体积。在微型离心机中以全速(20,000x g;14,000rpm)将管柱离心1分钟以洗脱核酸,致使获得细胞游离DNA。
用AVE缓冲液洗脱游离的循环游离细胞DNA,即用于扩增反应或储存在-30℃至-15℃下。经纯化的核酸不含蛋白质、核酸酶及其他杂质。
接着,核酸浓度是在扩增NRG1融合物及检测分析之前,根据制造商的建议来测定,诸如定量扩增测定法。
用于QIAvac 24Plus系统的真空处理1-24QIAGEN离心层析管柱的材料清单。QIAvac24Plus:处理1-24离心层析管柱的真空歧管,包括QIAvac 24Plus真空歧管、LuerPlugs及快速联结管(Quick Couplings)(产品编号19413)。真空接头(500):500型抛弃式接头,供与鲁尔槽(luer slot)或真空阀(VacValve)上的QIAamp小型管柱一起使用(产品编号19407)。真空阀(24):24个阀,供与QIAvac 24Plus一起使用(产品编号19408)。真空调节器(Vacuum Regulator):供与QIAvac歧管一起使用(产品编号19530)。真空泵(230V,50Hz):通用真空泵(容量为34L/分钟,8mbar真空绝对值)(产品编号84020)。QIAvac连接系统(Connecting System):用以连接真空歧管与真空泵的系统:包括托盘、废液瓶、管路、联结管、阀门、压力计、24个真空阀(产品编号19419)。
实施例3:循环肿瘤RNA(cfRNA)
从血浆纯化循环RNA
虽然此实施例的实验方案描述了从4ml的血浆样本中分离循环RNA,但当期望有更高产量及其他样本类型(如尿液及血清)时,该实验方案也适合从其他体积中分离。该实验方案系基于循环核酸套组(CNA)(Qiagen,产品编号#55114)及日期为10/2019的手册(HB-0202-006)。
在开始之前,允许来自人类受试者的血浆样本平衡至室温,无论是来自于适合冷藏温度储存的样本或是从患者抽取后直接使用。所有的离心步骤都是在室温下进行。必要时,用磷酸盐缓冲盐水(PBS)将体积低于4ml的样本调整到总共4ml。
缓冲液及试剂的制备。
根据制造商的说明书来制备缓冲液ACB、ACW1和ACW2。简言之,在使用前,将200ml异丙醇(100v/v%)添加到300ml缓冲液ACB浓缩物中以得到500ml缓冲液ACB。在添加异丙醇之后,将所得缓冲液混合均匀。在使用前,将25ml乙醇96-100(v/v%)添加到19ml缓冲液ACW1浓缩物以得到44ml缓冲液ACW1。在添加乙醇之后将所得液体混合均匀。在使用前,将30ml乙醇(96-100%)添加到13ml缓冲液ACW2浓缩物中以得到43ml缓冲液,随后将其混合均匀。例如,要处理12个4ml血浆样本时,将43ml缓冲液ACL与67.5μl的含有载体的AVE缓冲液混合在一起。
从血浆分离cfRNA
流程:将400μl QIAGEN蛋白酶K抽吸到50ml离心管中,将4ml的血浆添加到该50ml离心管中。添加3.2ml ACL缓冲液(含有1.0μg载体RNA),之后关上盖子并用脉冲涡动混合30秒且同时在管内形成涡流。将样本和ACL缓冲液彻底混合以产生均质溶液。将样本在60℃下培育30分钟使其立即裂解。在离心管内向该裂解物添加7.2ml ACB缓冲液,之后关上盖子并用脉冲涡动彻底混合15至30秒。将该裂解物ACB缓冲混合液在离心管内在冰上培育5分钟。将QIAamp小型管柱(Mini column)插入QIAvac 24Plus上的真空接头(VacConnector)中,并根据制造商的说明书设定。将20ml延伸管插入敞开的QIAamp小型管柱中。将20ml延伸管紧紧插入QIAamp小型管柱中。
在冰上培育之后,将该裂解物-ACB缓冲混合液施加至QIAamp小型管柱的延伸管中。开启真空泵,且当所有裂解物已完全被抽吸通过管柱时,关闭真空泵且使压力释放至0毫巴。小心地移出且丢弃延伸管。如果为QIAvac连接系统(Connecting System)的一部分,则可使用真空调节器(Vacuum Regulator)。为了避免交叉污染,不要将延伸管在邻近的QIAamp小型管柱上方移动。将600μl ACW1缓冲液施加至QIAamp小型管柱中。将管柱的盖子打开且开启真空泵。在所有ACW1缓冲液已被抽吸通过QIAamp小型管柱之后,关闭真空泵且使压力释放至0毫巴。将750μl ACW2缓冲液施加至QIAamp小型管柱中。将管柱的盖子打开且开启真空泵。在所有ACW2缓冲液已被抽吸通过QIAamp小型管柱之后,关闭真空泵且使压力释放至0毫巴。将750μl乙醇(96v/v%)施加至QIAamp小型管柱中。将管柱的盖子打开且开启真空泵。在所有乙醇已被抽吸通过QIAamp离心层析管柱(spin column)之后,关闭真空泵且使压力释放至0毫巴。将QIAamp小型管柱的盖子盖紧,将该管柱自真空歧管中移出且抛弃真空接头。将QIAamp小型管柱置放于干净的2ml收集管中,且全速(20,000x g;14,000rpm)离心3分钟。将QIAamp小型管柱置放于新的2ml收集管中。打开盖子,且将总成在56℃下培育10分钟以使膜完全干燥。将QIAamp小型管柱置放于干净的1.5ml洗脱管中并丢弃最后使用的2ml收集管。将20μl AVE缓冲液小心地施加至QIAamp小型管柱膜(Mini membrane)之中心。盖紧盖子且在室温下培育3分钟。将洗脱缓冲液AVE平衡至室温。回收的洗脱液体积为约5μl,小于施加至QIAamp小型管柱的洗脱体积。在微型离心机中以全速(20,000x g;14,000rpm)将管柱离心1分钟以洗脱核酸,致使获得细胞游离RNA。
用AVE缓冲液洗脱游离的循环游离细胞RNA,即用于扩增反应或储存在-30℃至-15℃下。经纯化的核酸不含蛋白质、核酸酶及其他杂质。
接着,核酸浓度是在扩增NRG1融合物及检测分析之前,根据制造商的建议来测定,诸如定量扩增测定法。
用于QIAvac 24Plus系统的真空处理1-24QIAGEN离心层析管柱的材料清单。QIAvac24Plus:处理1-24离心层析管柱的真空歧管,包括QIAvac 24Plus真空歧管、LuerPlugs及快速联结管(Quick Couplings)(产品编号19413)。真空接头(500):500型抛弃式接头,供与鲁尔槽(luer slot)或真空阀(VacValve)上的QIAamp小型管柱一起使用(产品编号19407)。真空阀(24):24个阀,供与QIAvac 24Plus一起使用(产品编号19408)。真空调节器(Vacuum Regulator):供与QIAvac歧管一起使用(产品编号19530)。真空泵(230V,50Hz):通用真空泵(容量为34L/分钟,8mbar真空绝对值)(产品编号84020)。QIAvac连接系统(Connecting System):用以连接真空歧管与真空泵的系统:包括托盘、废液瓶、管路、联结管、阀门、压力计、24个真空阀(产品编号19419)。
为了避免在纯化期间和之后损失来自生物材料的RNA,首先彻底清洁任何塑料器皿或玻璃器皿,以消除可能的核糖核酸酶(RNase)污染。通过建立及维护无RNase的环境,可以避免无意中将RNase引入分离流程中。
实施例4:循环肿瘤细胞的分离
此实验方案描述从全血分离出循环肿瘤细胞,其使用Adna Test Breast CancerSelect套组(ADNAGEN,产品编号T-1-508)使得可经由上皮及肿瘤相关抗原产生富集免疫磁性的肿瘤细胞。抗上皮及肿瘤相关抗原的抗体与磁珠(Dynabeads)缀合以标记周边血中的肿瘤细胞。经标记的细胞以磁粒收集器(AdnaMag-L和AdnaMag-S)萃取且随后裂解。从所得裂解物分离出mRNA且用于检测NRG1融合物。
将全血(至少5ml,但也可能是10ml)收集在含有EDTA(例如,‘KaliumEDTA’,Sarstedt;‘BD/>K3EDTA’,Becton Dickinson)的管子中且立即置于冰上,之后在4小时内抽吸并进行处理。
选择磁珠(Select Bead)的制备:以抽吸方式使BreastSelect Beads(套组中所提供)彻底重新悬浮。计算全部样本所需的BreastSelect Beads体积且将计算出的体积转移到1.5ml反应管。将反应管置于AdnaMag-S磁力收集器(AdnaGen GmbH,产品编号T-1-800)中。在1分钟后移除上清液。将磁珠用1ml PBS(磷酸盐缓冲盐水;pH 7.0-7.3)洗涤三次。将反应管从AdnaMag-S移出并使其重新悬浮于100μl PBS中。
肿瘤细胞的选择:首先将5ml的血液样本抽吸到15ml管子内。将100μl的已重新悬浮的BreastSelect Beads添加至各血液样本中。使管子在可倾斜和旋转的设备上于室温下慢速旋转(大约5rpm)30分钟。接着将管子置于未置有磁性滑块的AdnaMag-L(AdnaGenGmbH,产品编号T-1-700)内,且向下摆动以释放盖子中获得的血滴。接着将磁性滑块插入且将管子在室温下培育3分钟。在不碰触到磁珠的情况下用10ml抽吸管将血液上清液完全移除。首先从AdnaMag-L将磁性滑块移开,向管子添加5ml的PBS,轻轻使磁珠/细胞复合物重新悬浮,以完成洗涤三次。将磁性滑块放回到AdnaMag-L内且将管子在室温下培育1分钟,随后用抽吸管移除上清液。洗涤之后,将磁性滑块移开,将磁珠/细胞复合物重新悬浮1ml PBS中并转移到1.5ml的反应管。将反应管置于已插入磁性滑块的AdnaMag-S内。1分钟之后,将上清液全部移除以进行后续的细胞裂解。
从AdnaMag-S将磁性滑块移开,向每个反应管添加200μl的经室温平衡的裂解/结合缓冲液(套组中所提供),随后通过抽吸五次使重新悬浮。将磁性滑块插入AdnaMag-S且培育1分钟。将含有细胞裂解物的上清液转移到新的1.5ml反应管,且将含有磁珠的管子丢弃。该细胞裂解物适于mRNA分离或储存在-20℃下。该裂解物的mRNA在反转录(RT-PCR)反应中使用寡聚胸腺嘧啶(Oligo(dT))引物来分离并转录成cDNA模板。随后通过PCR介导扩增来检测NRG1融合物。
实施例5:细胞外囊泡及外泌体
使用ExoRNeasy Maxi套组(产品编号77023,QIAGEN GmbH,Hilden,德国)而从血液获得总囊泡RNA,该套组基于以膜为基础的亲合性结合步骤而从无细胞的生物液体分离出外泌体及其他EV。
步骤1包括血浆分离与储存。将全血收集于含有EDTA的BD静脉采血管(Venous Blood Collection Tubes)(产品编号367525)(或是Streck公司的/>血液ccfDNA管[产品编号768115]和无细胞DNA/>管,但不是RNA BCT管)中。将管子储存在室温或4℃下且在1小时内处理。使用摆动式斗状转子将血液样本在初次采血管中以1900xg(3000rpm)及4℃离心10分钟。小心将上部(黄色)血浆相转移到新的管子(具有锥形底部)中且不搅乱中间的血沉棕黄层(含有白细胞和血小板)。将血浆样本在锥形管中以3000x g及4℃离心15分钟(或以16,000x g离心10分钟,见上文),或通过0.8μm过滤器(NML[Sartorius产品编号16592])。小心将澄清上清液转移到新的管子且不搅乱沉淀物。将血浆储存在2-8℃达6小时并在同一天处理。
步骤2描述从4ml的血浆获得及裂解外泌体及其他细胞外囊泡(EV)。将4ml的结合缓冲液XBP添加至4ml的血浆中并立即轻轻倒置管子5次混合均匀。将血浆/XBP混合物添加至exoEasy离心层析管柱(spin column)(将EV结合至膜上的膜亲合性管柱)且以500x g离心1分钟。将流出的液体丢弃,且将管柱放回同一个收集管中。将10ml洗涤缓冲液XWP添加至exoEasy Maxi离心层析管柱,且以5000x g离心5分钟。将流出的液体与收集管一起丢弃。将离心层析管柱转移至新的收集管。将700μl QIAzol添加至膜以裂解囊泡,以5000x g离心5分钟以收集裂解物,将完全转移至2ml管子。
步骤3描述从裂解物分离出总RNA。根据制造商的说明书制备缓冲液RWT及RPE。将含有裂解物的管子短暂地涡动且在室温下培育5分钟。接着添加90μl的氯仿至管子且剧烈摇动15秒。在室温下培育2至3分钟之后,在4℃下以12,000x g将管子离心15分钟。将上部水相转移至新的收集管,添加2倍体积的100%乙醇且彻底混合。将700μl样本抽吸至在2ml收集管中的RNeasy MinElute离心层析管柱中,且以≥8000x g(≥10,000rpm)离心15秒。丢弃流出的液体之后,使用剩余的样本重复此步骤。将700μl缓冲液RWT添加至RNeasy MinElute离心层析管柱且以≥8000x g(≥10,000rpm)离心15秒,随后添加500μl缓冲液RPE且以≥8000x g(≥10,000rpm)离心15秒。将每个步骤中流出的液体丢弃。最后将500μl缓冲液RPE添加至RNeasy MinElute离心层析管柱上且以≥8000x g(≥10,000rpm)离心2分钟。将收集管与流出的液体一起丢弃。
将RNeasy MinElute离心层析管柱置入新的2ml收集管且在盖子打开下以全速离心5分钟以使膜干燥。将收集管与流出的液体一起丢弃。通过添加14μl不含RNase的水来洗脱RNA,让管子静置1分钟,且以全速离心1分钟。
实施例6:经肿瘤教化的血小板(TEP)
已知肿瘤细胞将(突变的)RNA转移到血小板中,随后用于检测肿瘤相关的RNA标志物。此实验方案将血小板mRNA的降解程度降至最低,且将其他细胞类型(如红血球及白血球)的污染程度降至最低(Amisten S,Methods Mol Biol.2012)。接着将获自血小板RNA用来扩增及检测NRG1融合物。
抗体缀合磁珠的制备:将1ml Dynabead洗涤缓冲液(具0.1%(w/v)BSA的PBS,pH7.4)与250μl Dynabead浆料(Pan Mouse IgG,Invitrogen)一起混合并置于Dynamag磁铁(DynaMagTM-2或DynaMagTM-15,Invitrogen)中1分钟,随后将液体移除。在另一次洗涤之后,从磁铁移出磁珠且使其重新悬浮于250μL洗涤缓冲液中。将15μl的抗CD235a抗体(小鼠,抗人类CD235a,红血球表面标志物,BD Inc,NJ,USA)及15μl抗CD45抗体(小鼠抗人类CD45,白血球表面标志物,BD Inc,NJ,USA)添加至磁珠,在温和倾斜和旋转下混合且培育至少30分钟。将管子置于磁铁中1分钟以移除上清液,且将磁珠重新悬浮于250μl洗涤缓冲液,之后储存在4℃。
收集血球及纯化血小板:以18ml ACD(无菌抗凝剂:柠檬酸葡萄糖溶液,SigmaAldrich)、12μl的1mM PGE1(Prostaglandin E1,1mM于乙醇中的储备液,Sigma Aldrich)、120μl的30mM乙酰柳酸(30mM于乙醇中的储备液,Sigma Aldrich)、及480μl的0.5M EDTA(Sigma Aldrich)来制备血小板抑制混合物。在进一步含有1.5ml血小板抑制混合物的15ml管子的管内收集8.5ml的血。在室温下以200g离心20分钟之后,将上层上面85%的富含血小板(PRP)的血浆转移到新的15ml管子。在另一次离心(200g,10分钟,室温)移除白血球与红血球之后,将85%的PRP转移到50ml管子。接着以AutoStopTMBC高效过滤器(Pall公司,产品编号ATSBC1E)将PRP过滤以移除白血球,将滤液与抗体缀合磁珠混合培育,同时在室温下倾斜和旋转45分钟。将该PRP/磁珠混合物置于DynaMagTM-2内2分钟,且将上清液转移到新的管子以得到耗尽的PRP。在重复PRP耗尽步骤之后,将上清液在室温下以800g离心10分钟以收取上清液。将血小板沉淀物秤重并以每100mg沉淀物用1ml TRIzol(Invitrogen)来溶解,样本秤重小于100mg时用最低量1mL TRIzol。
分离血小板RNA:将溶解于TRIzol中的血小板样本在室温下培育5分钟,且向每管添加200μl氯仿(Sigma Aldrich)。在剧烈摇动15至30分钟之后,将管子在室温下培育2至3分钟,并在4℃下以12,000g离心15分钟。将10μg极纯肝醣(UltraPureTMGlycogen,Invitrogen,产品编号10814-010)添加至新的无RNase管子。将TRIzol/氯仿混合物的水相小心添加至含有肝醣的管子,随后添加500μl的冷异丙醇(Sigma Aldrich)。将管子混合并在-20℃下静置过夜。在4℃下以12,000g离心15分钟之后,移除上清液且将RNA沉淀物在1ml的75%乙醇中洗涤。将经干燥的RNA沉淀物溶解于无RNase水中,且可进一步用于反转录为cDNA。
实施例7:ddPCR核酸扩增及融合物检测
使用微滴式数字聚合酶连锁反应(ddPCR)来检测来自液态活检cfDNA及cfRNA样本中的目标核酸融合物。
使用Bio-Rad’s QX100TM或QX200TM微滴式数字PCR系统来进行微滴式数字聚合酶连锁反应(ddPCR),以致使检测来自液态活检DNA和/或RNA(cDNA)样本中的目标核酸融合物。
引物及探针:引物是设计在融合接点或断点附近,以扩增60-200bp大小的NRG1融合产物。使用Primer3程序(Whitehead Institute for Biomedical Research,麻省理工学院)来设计引物使其GC含量为50-60%且Tm介于50与65℃之间(在50mM盐浓度和300nM寡核苷酸浓度下),以避免二级结构及引物二聚物。
使用具序列特异性且用FAM、HEX或VIC染料荧光标记的TaqManTM水解探针。探针序列是在扩增子(amplicon)的两个引物之间选择。水解探针的Tm比GC含量为30-80%的引物高3-10℃。该探针的长度小于30个核苷酸。
样本制备:使用A260光谱仪来评估输入DNA/RNA的浓度,以确认所要装填的目标DNA/RNA浓度是在检测动态范围内。QX100或QX200系统建议的DNA动态范围为每20μl反应物120,000个拷贝数。也根据制造商的建议对基因组DNA使用4切酶或6切酶与每μg DNA10单位酶来进行限制酶消化切割。经消化切割的DNA系储存在-20℃下直至进一步使用。
当使用cfDNA做为起始材料进行实验时,该融合序列包括融合位点加上每一侧有足够长的毗邻序列以涵盖PCR扩增子。所得核苷酸序列介于50-250ntd。将T7启动子序列(5'-CAGAGATGCATAATACGACTCACTATAGGGAGA-3')加到目标序列的5'端。双链脱氧核醣核酸(DNA)片段形式的合成序列从IDT(www.idtdna.com)订购,且于Tris-EDTA(TE)缓冲液中恢复水分至最终浓度为10ng/μl。
当使用RNA作为起始材料时,首先使用RT-PCR来生成cDNA,例如使用针对寡聚胸腺嘧啶(oligo(dT))或基因特异性导引的Bio-Rad’s iScriptTM Select cDNA合成套组。cDNA浓度减至相等于约0.2ng/μl RNA,且每个微滴式数字PCR反应(总体积20μl)使用5μl。
为了生成cfRNA的阳性对照组,使用体外转录将60ng的合成DNA转成RNA且使用苯酚/胍基试剂将所得RNA转录物纯化。添加DNase I以移除残余模板DNA。以凝胶电泳来评估RNA的质量。基于输出到检验样本的所要拷贝数,将所得RNA稀释至范围为0.25至2.5fg的浓度。将用于阳性对照组的10μl的分析RNA等分储存在-80℃下。使用无核酸酶的水作为cfDNA及cfRNA的阴性对照组。
ddPCR反应:制备20μl PCR混合物,其含有样本核酸(1μg的DNA或cDNA,最终浓度为50ng/μl)、探针用的2x ddPCR supermix((Bio-Rad,产品编号1863023;不含2’-脱氧尿核苷5’-三磷酸盐)-10μl、20x融合特异性引物/探针组(450nmol/L引物,250nmol/L FAM探针)-1μl、20x对照目标引物/探针组(450nmol/L引物,250nmol/L HEX探针)-1μl及无核酸酶的水。建立稍微超过20μl(22-25μl)的初始反应物池,以确保能将20μl的混合物转移至DG8药筒(Bio-Rad,产品编号1864007)。将该等反应混合物合并且在一个单独的管子中(而非在微滴产生药筒中)混合均匀。接着将反应混合物转移至已预载于DG8药筒支架(Bio-Rad,产品编号1863051)中的DG8药筒。
装填20μl PCR反应物之后,将70μl的微滴产生油(Bio-Rad,产品编号1863005)装填入DG8药筒各孔底部。在DG8药筒顶部安装一个衬垫,将其置入QX200微滴产生仪。该微滴产生仪在约2.5分钟内对8个样本产生每样本约20,000个微油滴。接着轻轻将微油滴抽吸转移至96孔盘。使用Bio-Rad’s PX1TM PCR孔盘封膜仪(Plate Sealer)及可穿刺热封箔将PCR孔盘热封。接着将PCR孔盘置入具有96深孔反应模块的C1000 TouchTM热循环仪(ThermalCycler)中进行PCR。热循环条件如下:在95℃(10分钟,1循环)活化酵素;变性(94℃,30秒)及退火/延长(55℃,1分钟)40个循环;在98℃下酵素失活,10分钟,1循环。使用每秒2℃的变温速率。
在PCR扩增微油滴中的核酸目标之后,将含有微油滴的孔盘置入QX100或QX200微滴读取仪,其中使用软件QuantaSoft,使用双色检测系统(设定成检测FAM及HEX)个别分析每个微油滴。含有至少一个拷贝的目标DNA/RNA分子的阳性微油滴与阴性微油滴相比展现出荧光增强。其浓度以每μl最终1x ddPCR反应物中的拷贝数报告。使用阈值工具正确地指出微油滴群为双阴性(FAM及HEX均为阴性)、FAM阳性、HEC阳性、及双阳性(FAM及HEX均为阳性)。使用ABS分析,以每微升的拷贝数及每微滴的拷贝数得到目标物的绝对量化。
实施例8:锚定多重PCR
使用锚定多重PCR(AMP)来检测基因融合物及检测与感兴趣的基因的多重融合。以下实验方案基于Archer FusionPlex实体瘤(Solid Tumor)套组(ArcherDX,产品编号AB0005),且使用获自例如实施例6的液态活检的RNA来进行。
样本库制备:
包括一个含有至少数个已证实的基因融合的阳性对照组。包括一个非模板对照组作为每次运作时另外的样本。
随机导引、第一与第二链cDNA合成:该测定法所要输入的是200ng RNA,其稀释于pH8.0的10mM Tris HCl中。将20μl经稀释的RNA添加至预冷的随机导引试剂连排反应管中(套组中所提供)。在混合和短暂快速旋转之后,将混合物转移到96孔PCR孔盘,以RT膜(USAScientific,产品编号2921-7800)密封并在热循环仪铝块上以65℃培育5分钟(盖子加热下)。
将随机导引产物转移到第一链试剂连排反应管(置于预冷铝块中)且混合、短暂快速旋转,并转移到96孔PCR孔盘。使用以下热循环仪程序:25℃10分钟,42℃30分钟,80℃20分钟,保持4℃(盖子加热下)。
在一组新的PCR连排反应管中以无核酸酶的水制作1:10稀释的第一链产物,以用于Pre-Seq质量控制(QC)测定法中。QC测定法主要是用于验证非模板对照组中没有cDNA合成。根据制造商的实验方案进行QC测定法。
对于第二链cDNA合成,添加21μl无核酸酶的水至其余的第一链产物,且将40μl的此产物添加至第二链试剂连排反应管(套组中所提供,置于预冷铝块中)。在混合及短暂快速旋转之后,将混合物转移到96孔PCR孔盘并密封。将孔盘插入热循环仪铝块上,且使用以下热循环仪程序:16℃60分钟,75℃20分钟,保持4℃(盖子加热下)。
末端修复:将40μl的第二链产物转移到末端修复试剂连排反应管(套组中所提供,置于预冷铝块中)。在混合及短暂快速旋转之后,将连排反应管在热循环仪铝块中以25℃培育30分钟,随后保持4℃。在室温下将该末端修复产物添加至纯化珠粒(Agencourt AMPureXP Beads,Bechman Coulter,产品编号A63881)。在混合之后,将该混合物在室温下培育5分钟,随后在磁铁(Alpaqua,产品编号A32782)上培育5分钟。丢弃上清液,将珠粒用200μl70%乙醇以培育30秒及风干5分钟进行洗涤两次。使珠粒重新悬浮于22μl的pH 8.0的10mMTris HCl中,离开磁铁培育3分钟,随后在磁铁上培育2分钟。
接合步骤1:从末端修复珠粒纯化孔盘取出20μl转移入接合步骤1连排反应管(套组中所提供,置于预冷铝块中)。在混合及短暂快速旋转之后,将混合物于96孔PCR孔盘中在热循环仪铝块内以37℃培育15分钟,随后保持4℃(盖子加热下)。将全部体积的接合步骤1产物添加至50μl的经室温平衡的珠粒。在混合之后,将该混合物在室温下培育5分钟,随后在磁铁上培育5分钟。丢弃上清液,将珠粒用200μl 70%乙醇以培育30秒进行洗涤两次。在最终洗涤之后,移除全部的70%乙醇且将珠粒风干5分钟。将珠粒从磁铁移开且重新悬浮在42μl的pH 8.0的10mM Tris HCl中,离开磁铁培育3分钟,随后在磁铁上培育2分钟。
接合步骤2:从4℃储藏库中移出MBC适配连排反应管试剂(套组中所提供)并正确编号。为了测序目的,还记录了样本的特定索引。
从接合步骤1珠粒纯化孔盘取出40μl转移至MBC适配连排反应管(ArcherDX,产品编号AK0016-48,置于预冷铝块中)。在混合及短暂快速旋转之后,将混合物转移至接合步骤2试剂连排反应管(套组中所提供,也置于预冷铝块中)。在混合及短暂快速旋转之后,将混合物在热循环仪中以22℃培育5分钟,随后保持4℃。
将接合清理(Ligation Cleanup)珠粒(经室温平衡)涡动且将50μl添加至新的PCR连排反应管组。在磁铁上培育1分钟之后,丢弃上清液。将连排反应管从磁铁移开且重新悬浮于50μl的接合清理缓冲液中。
将接合步骤2产物添加至接合清理珠粒连排反应管,涡动混合且在室温下培育5分钟。重复进行混合及培育,之后将样本在磁铁上培育1分钟并丢弃上清液。添加200μl的接合清理缓冲液使其重新悬浮,且在快速旋转之后将该混合物置于磁铁上1分钟。重复用接合清理缓冲液进行洗涤。使用超纯水进行相同的洗涤动作,之后将珠粒重新悬浮于20μl的5mMNaOH中且于PCR孔盘中在热循环仪铝块内用以下条件培育:75℃10分钟,随后保持4℃(盖子加热下)。将PCR孔盘置于磁铁上至少3分钟。
第一次PCR:将2μl的NRG1特异性引物(GSP1引物)添加至第一次PCR试剂连排反应管中的每个孔(套组中所提供)并与18μl的接合步骤2清理产物混合。在短暂快速旋转之后,将混合物在热循环仪中用以下程序培育:95℃3分钟,15个循环;95℃30秒-65℃5分钟(变温速率100%);72℃3分钟,随后保持4℃(盖子加热下)。
将20μl的第一次PCR产物添加至24μl的经室温平衡的珠粒,混合并在室温下培育5分钟且在磁铁上培育2分钟。之后移除上清液,将珠粒用200μl 70%乙醇以培育30秒及风干进行洗涤两次,并使其重新悬浮于24μl的pH8.0的10mM Tris HCl。
第二次PCR及样本库量化
将2μl的另外的NRG1特异性引物(GSP2引物)添加至在冷铝块上的正确标记的第二次PCR试剂连排反应管中的每个孔(套组中所提供),且与18μl的第一次PCR清理产物混合。在短暂快速旋转之后,将混合物在热循环仪中用以下条件培育:95℃3分钟,18个循环;95℃30秒-65℃5分钟(变温速率100%);72℃3分钟,随后保持4℃(盖子加热下)。
将20μl的第二次PCR产物添加至24μl的经室温平衡的珠粒,混合并在室温下培育5分钟且在磁铁上培育2分钟。之后移除上清液,将珠粒用200μl 70%乙醇以培育30秒及风干进行洗涤两次。在磁铁上培育2分钟,将20μl的第二次PCR产物转移至新的PCR孔盘并进行定量。
每个样本库的浓度通过qPCR使用用于Illumina平台编码KK4973的KapaBiosystems样本库定量套组(Library Quantification Kit)根据制造商的说明书来测定。用pH8.0之10mM Tris HCl与0.05% Tween将第二次PCR产物连续稀释。以每孔6μl的样本库定量主混合液(library quantitation master mix)(Kapa Biosystems,产品编号KK4973)添加至96孔光学反应盘,随后添加4μl的合适稀释品或标准品(Kapa Biosystems,产品编号KK4906、KK4903)。使用以下qPCR程序:95℃5分钟1个循环;95℃30秒(变温速率4.4℃/秒)-60℃45秒(变温速率2.2℃/秒)35个循环。完成样本库定量的后,将所有的样本库均一化,且将10μl的每个经均一化的样本库合并到一个1.5ml微量离心管汇集。
样本库的测序:
从冷藏库中移出测序试剂药筒并置入去离子水直到填充线至少一小时。使测序试剂套组(MiSeq试剂套组v3-600循环;Illumina;产品编号MS-102-3003)与室温平衡。将10μl的样本库池与10μl的0.2N NaOH合并以制作变性扩增子样本库(DAL)池且在室温下培育5分钟。将10μl的pH 7.0的200mM Tris HCl添加至DAL,随后添加970μl的HT1缓冲液(套组中所提供)。
合并300μl的HT1、25μl的20pM PhiX及675μl的DAL池以制作最终装填管。在混合及短暂快速旋转之后,将装填管的全部体积添加至该测序试剂药筒的样本孔,且将该药筒装填到测序仪,以2×151bp读长与2×8索引测序数据(index reads)运行(MiSeqDx System-Illumina)。
RNA融合数据使用适合的生物信息数据分析软件来分析。
实施例9:下一代测序
下一代测序以DNA样本使用MI-Exome检验(Caris Molecular CarisLife Sciences)来进行,该检验使用DNA且使用定制人类外显体套组提供肿瘤突变剖析,以检测包括有单一核苷酸同质多形性、插入/缺失和DNA重排和融合事件等的变体。
以下定制外显子套组为使用五种套组的混合套组。套组使用Illumina NovaSeq6000仪器来进行验证。该混合套组包括两种获自Agilent的现成套组以及三种由Caris开发且优化的套组:
Agilent Human All Exon V7套组(48MB)
Agilent SNP Backbone套组(具1MB分辨率的3MB套组)
Caris 719-Gene Targeted Clinical套组(1MB)
Caris Intronic Fusion套组(0.1MB)
Caris Pathogenic套组(0.1MB)
对于以RNA作为起始材料时,使用全基因转录本测定法来进行下一代测序,例如MITranscriptomeTM测定组(Caris MolecularCaris Life Sciences)。当在Illumina NovaSeq仪器上测序时,该测定组使用Agilent SureSelect Human All Exon套组来检测基因融合物及剪接变体。
实施例10:荧光原位杂交(FISH)
对获自血浆或血液或其他液态活检样本上的循环肿瘤细胞(CTC)利用断裂分离探针进行FISH。例如,循环肿瘤细胞使用(Menarini silicon biosystems,意大利)或/>(Rarecells Diagnostics,巴黎,法国)系统而纯化自血浆、血清等,并固定在载玻片上。
简言之,将从全血中浓缩的CTC封固在独立的载玻片上(Frithiof,Henrik等人,OncoTargets and therapy第9卷,7095-7103,2016年11月16日)。将含有CTC的溶液(~900μL)转移至1.5mL Eppendorf管且置于磁性托盘中。培育10分钟之后,移除未附着的溶剂。使细胞重新悬浮于10μL的1倍磷酸盐缓冲盐水且封固在超冻载玻片(ThermoScientific,德国)且在37℃下培育30分钟。将载玻片浸入100%甲醇中5分钟完成固定。将样本储存在-20℃直至进一步评估。
使用FISH-组织实施套组(Tissue Implementation Kit)(ZytoVision,产品编号Z-2028-5)来完成细胞预处理。缓冲液PT1、ES1、WB1、WB2和MT7为套组中所提供。
将载玻片在70℃下培育10分钟,随后在二甲苯中培育2x 10分钟。接着使用一系列乙醇的100%、100%、90%、70%乙醇使载玻片再水合各5分钟,且最后在去离子水或蒸馏水中洗涤2x 2分钟。在98℃下在预加温的热预处理柠檬酸液(Heat Pretreatment SolutionCitric(PT1))中将载波片培育15分钟,且立即转移至去离子水或蒸馏水洗涤2x 2分钟。吸干水分之后,向样本施用胃蛋白酶溶液(Pepsin Solution(ES1))且在37℃之恒湿箱中培育15分钟,并用洗涤缓冲液SSC(WB1)洗涤5分钟。将载玻片于去离子水中洗涤1分钟,在一系列乙醇的70%、90%、100%乙醇中脱水各1分钟并风干。
ZytoLight SPEC NRG1双色断裂分离探针(PL140)是由标记有绿色荧光染料(ZyGreen)及橙色荧光染料(ZyOrange)的多核苷酸所组成。这些探针靶向感兴趣的基因(例如VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、AGRN、THBS1或PVALB)中所发生的映射至断点的远程与近端的序列。将10μl的探针抽吸到各个预处理的样本上,盖上22mm x 22mm盖玻片并密封。将载玻片置入75℃的杂交仪中10分钟以完成变性,随后将载玻片转移至恒湿箱中在37℃下杂交过夜。
次日,将载玻片浸入37℃之1x Wash缓冲液A(WB2)1至3分钟以移除盖玻片,且在37℃下用洗涤缓冲液A再洗涤2x 5分钟。将载玻片在70%、90%及100%乙醇中各培育1分钟且风干。将25μl的DAPI/DuraTect-溶液(MT7)抽吸到载玻片上,盖上盖玻片且在黑暗中培育15分钟。接着以荧光显微镜使用合适的ZyGreen(激发波503nm/发射波528nm)和ZyOrange(激发波580nm/发射波599nm)滤镜来评估样本荧光。基于绿色及橙色信号的重叠或未重叠外观来说明结果。
实施例11:免疫细胞化学染色法(ICC)
对获自血浆或血液或其他液态活检样本上的循环肿瘤细胞进行免疫细胞化学染色法,以检测NRG1融合蛋白的表达。例如,循环肿瘤细胞使用(Menarinisilicon biosystems,意大利)或/>(Rarecells Diagnostics,巴黎,法国)系统而纯化自血浆、血清等,并固定在载玻片上。
简言之,将从全血中浓缩的CTC封固在独立的载玻片上(Frithiof,Henrik等人,OncoTargets and therapy第9卷,7095-7103,2016年11月16日)。将含有CTC的溶液(~900μL)转移至1.5mL Eppendorf管且置于磁性托盘中。培育10分钟之后,移除未附着的溶剂。使细胞重新悬浮于10μL的1倍磷酸盐缓冲盐水且封固在超冻载玻片(ThermoScientific,德国)且在37℃下培育30分钟。将载玻片浸入100%甲醇中5分钟完成固定。将样本储存在-20℃直至进一步评估。
在固定之后,使用合适的免疫染色系统(例如Ventana Discovery自动免疫染色系统,Ventana Medical Systems,Tucson,AZ,USA)来进行载玻片上的蛋白质检测。简言之,将封固在超冻载玻片上的细胞在pH 8.0的EDTA基缓冲液中预处理。向本公开的NRG1融合物施用两种初级抗体。例如,抗NRG1抗体,其靶向位于融合接点(诸如NRG1的EGFR结构域)C端侧位置处的区域,以及另一种初级抗体,其靶向位于融合接点N端位置处的CD44表位或结构域。用合适的稀释剂进行抗体稀释。使用合适的次级抗体及两种不同荧光检测系统来检测抗体。在荧光显微镜中使用不同通道将免疫染色可视化。基于两种荧光信号的重叠或未重叠外观来说明结果。
实施例12:治疗实验方案
在经诊断带有以下融合物中各者的患者中用泽妥珠单抗进行治疗:VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、DAAM1-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SLC4A4-NRG1、SDC4-NRG1、ZFAT-NRG1和DSCAML1-NRG1,其治疗如下。
按照双周计划,第一次输注750毫克的泽妥珠单抗,用时4小时,随后每隔一周输注一次,用时2小时,以4周为一个周期。此外,还包括管理IRR(输液相关反应)的预备药物,其中包括所有输液的解热剂及抗组织胺。在第1天第1周期用药之前还包括皮质类固醇;此后,根据调查员的决定进行管理以管理IRR。
实施例13:源自患者的VAPB-NRG1融合数据
将获自经诊断患有肺腺癌的68岁男性病患的右体壁胸膜所得到的具有60%肿瘤性细胞的经石蜡固定的肿瘤性材料样本进行以下分子生物科技分析。
使用可检测一组14个基因(ALK、BRAF、EGFR、FGFR1、FGFR2、FGFR3、KRAS、MET、NRG1、NTRK1、NTRK2、NTRK3、RET、ROS1)的Archer FusionPlexTM套组。根据制造商的说明书制备建库,且在Illumina MiSeq测序仪上进行下一代测序(NGS),并使用Archer Analysis 6.0站点完成样本分析。
在此套组中检验是否为VAPB-NRG1融合物阳性的样本。对此样本进行测序以致使如SEQ ID NO:3的序列的鉴定。其显示出在VAPB的外显子1与NRG1的外显子2之间出现一个融合接点。带下划线序列(核苷酸1-43)与编码VAPB(NM_004738.4)的基因的外显子1的一部分对应。核苷酸44-94与编码NRG1的基因的一部分对应。
CAGGTCCTGAGCCTCGAGCCGCAGCACGAGCTCAAATTCCGAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTT(SEQ ID NO:3)。
实施例14:源自患者的CADM1-NRG1融合数据
将获自经诊断罹患转移性肺腺癌NOS的男性病患的具肿瘤性材料的经福尔马林固定石蜡块进行以下分子生物科技分析。
在以批准的显微解剖技术收取转移性脑组织之后进行分子检验。在显微镜下检查候选载玻片,并圈选含有肿瘤细胞(及在需要检验时圈选出单独的正常细胞)的区域。实验室技师使用解剖显微镜从标记区域收取目标组织并取出。所标记及取出的区域在显微解剖后的载玻片上重新进行显微镜检查,并复查显微解剖的妥适性。
对获自该样本的cDNA进行RNA-Seq(RNA测序)以致使如SEQ ID NO:7的序列的鉴定。其显示出存在框内融合且在CADM1基因的外显子7与NRG1基因的外显子6之间出现接点。下划线序列即核苷酸1-53对应CADM1基因(NM_001301045.1)的外显子7的一部分。核苷酸54-85对应编码NRG1的基因(NM_001159999.3)的一部分。
AGCTTCAAACATAGTGGGGAAAGCTCACTCGGATTATATGCTGTATGTATACGCTACATCTACATCCACCACTGGGACAAGCCAT(SEQ ID NO:7)。
使用Illumina NextSeq平台,基于下一代测序(NGS)分析将从经福尔马林固定及石蜡包埋的肿瘤样本分离出的基因组DNA进行肿瘤突变负荷分析。仅使用先前没有关于生殖细胞改变的报告的错义突变来计算肿瘤突变负荷。高突变负荷是免疫疗法反应的潜在指标(Hellman等人,NEJM,2018;Le等人,NEJM,2015;Rizvi等人,Science,2015;Rosenberg等人,Lancet 2016;Snyder等人,NEJM,2014)。NSCLC中的截止点基于大型第3期临床试验,其显示出每兆碱基中的TMB为10或有更多突变的患者在用免疫检查点抑制剂组合疗法治疗时,其无进展生存期比用化疗治疗时更长(Hellman等人,NEJM,2018)。高:每兆碱基大于或等于10个突变;低:每兆碱基小于或等于9个突变。该患者样本的TMB评分为9。
以NGS对样本进行微卫星不稳定性(MSI)分析,其显示出稳定的MSI特征。NGS(MSI-NGS)的MSI状态是通过直接分析一组592个已知基因中所测序的已知微卫星区域来测得。为了确定临床阈值,将MSI-NGS结果与来自于用传统PCR为基础的方法所分析的超过2,000个匹配临床病例的结果进行比较。使用如用于突变检测的相同深度与频率标准来检测微卫星基座中的基因组变体。此测定法中只会考虑到会造成串联重复序列数量改变的插入及缺失。计数每个样本中的微卫星变异总数量并分成三个类别:高度、模棱两可和稳定。低MSI的结果在稳定类别中报告。
在样本上进行的免疫组织化学染色显示出ALK和PD-L1的结果为阴性,MLH1、MSH2、MSH6、PMS2和PTEN的结果为阳性。
使用NGS或RNA-Seq分析,在所获得的样本中未检测到以下与癌症类型相关的生物标志物的融合物或突变:NTRK1、NTRK2、NTRK3、KRAS、ALK、DOR2、ErbB2、ErbB3、ErbB4、PIK3CA、TP53、MET、PD-L1、RET、ROS1、STKI1、TP53。
实施例15:源自患者的CD44-NRG1融合数据
将获自46岁男性病患肝脏的肿瘤性材料生物样本进行以下分子生物科技分析。
使用Archer FusionPlexTM Custom Solid套组来检测肿瘤样本中的基因融合物,该套组利用了Anchored Multiplex PCR(AMPTM)技术靶向先前报告过的染色体重排中的62个外显子。对这62个目标外显子设计出单向基因特异性引物(GSP)。将GPS与转接子特异性引物组合来扩增已知的且新型的融合转录物。在Illumina MiSeq测序仪上对富集的扩增子进行测序。
在此研究组中的样本经CD44-NRG1融合物检验为阳性。对该样本进行测序以致使如SEQ ID NO:11的序列的鉴定。其显示出存在框内融合且在CD44的外显子5与NRG1的外显子2之间出现融合接点。下划线序列即核苷酸1-52对应CD44基因(NM_000610)的外显子5的一部分。核苷酸53-110对应编码NRG1的基因的外显子2的一部分。
GACGAAGACAGTCCCTGGATCACCGACAGCACAGACAGAATCCCTGCTACCACCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACT(SEQ ID NO:11)。
该样本在此含有总数62个外显子目标的临床验证套组中检验为阴性,该目标为:ALK的外显子20(NM_004304)、ERG的外显子2,4,8(NM_004449)、EWSR1的外显子6,7,8,10,11(NM_005243)、FGFR3的外显子17,18(NM_00142)、FGFR2的外显子17(NM_00141.4)、FOXO1的外显子2(NM_002015)、NTRK3的外显子11,12,14,15(NM_002530)、RET的外显子12(NM_020975)、ROS的外显子34,35(NM_002944)、SS18的外显子10(NM_001007559)、STAT6的外显子16,17,19(NM_001178078)、TAF15的外显子6(NM_139215)、TFE3的外显子6(NM_006521)、BRAF的外显子7,9,11(NM_004333)、NTRK1的外显子12(NM_002529)、FUS的外显子5,8(NM_004960)、CIC的外显子20(NM_015125)。
实施例16:源自患者的SLC3A2-NRG1融合数据
将获自经诊断患有肺腺癌的女性病患的左下肺叶切除所得到的显示出原发性腺癌组织的肿瘤性材料进行以下分子生物科技分析。
在通过以下目标基因的测序获取肿瘤性细胞后,使用Archer Lung Fusion Plex,Illumina MiniSEQ进行分子检验:ALK、BRAF、FGFR1、FGFR2、FGFR3、KRAS、MET、NRG1、NTRK1、NTRK2、NTRK3、RET、ROS1。参考基因组为GRCh37/hg19。
对获自该样本的cDNA进行RNA-Seq(RNA测序)以致使如SEQ ID NO:15的序列的鉴定。其显示出存在出现在SLC3A2基因的外显子1与NRG1基因的外显子5之间的框内融合接点。下划线序列即核苷酸1-53对应编码SLC3A2的基因((NM_001013251)的外显子1的一部分。其余35个核苷酸,即核苷酸54-88,对应NRG1基因的外显子5的一部分。
CCGCATCGGCGACCTTCAGGCCTTCCAGGGCCACGGCGCGGGCAACCTGGCGGCATCTACATCTACATCCACCACTGGGACAAGCCAT(SEQ ID NO:15)。
实施例17:源自患者的VTCN1-NRG1融合数据
将获自经诊断罹患肺腺癌的病患右侧胸骨旁部位的包含肿瘤性细胞的选定组织块的转移性肿瘤性活检材料进行以下分子生物科技分析。
在通过测序获取肿瘤性细胞及TNA萃取后,对所获得的材料使用Archer FusionPlex RNACTL_V6(Archerdx)套组进行分子检验,所述测序经由Nextseq双端(pair end)使用流通槽N°HFFJFAFX2以及Sophia DDM版本5.7.4—b127-31a209c、流程(Pipeline)IDILL1AM1R2/v5.5.24.1/GEN1GN1FSQ2来实现。
所指的套组可检测以下目标区域(及括号内的外显子)中的突变:AKT1(3)、ALK(22,23,24,25)、AXL(5,11,15,17)、BRAF(11,15)、CTNNB1(3)、CYSLTR2(6)、DDR2(17)、EGFR(18,19,20,21)、ERBB2(20)、FGFR1(2,8,9,10,17)、FGFR2(2,5,7,8,9,10)、FGFR3(3,5,8,9,10)、GNA11(4,5)、GNAS(8,9)、GNAQ(4,5)、HRAS(2,3,4)、IDH1(4)、IDH2(4)、KEAP1(全部)、KIT(11,13,17)、KRAS(2,3,4)、MAP2K1(2,3)、MET(13à19)、NRAS(2,3,4)、PIK3CA(9,20)、POLE(9à14)、RAF1(4,5,6,7,9,10,11,12)、RET(11,13,14,15,16)、ROS1(38)、STK11(全部)、TP53(全部)。检测以下转录融合物:ALK、AXL、BRAF、CCND1、EGFR、FGFR1、FGFR2、FGFR3、MAP2K1、MET、NRG1、NTRK1、NTRK2、NTRK3、PPARG、RAF1、RET、ROS1。并检测以下表达:ALK、CCND1、EGFR、ERBB2、FGFR1、FGFR2、FGFR3、MET、NTRK1、NTRK2、NTRK3、RET、ROS1。
在EGFR基因的外显子18-21未观察到突变;在KRAS基因的外显子2和3未检测到突变;在BRAF基因的外显子11和15未检测到突变;在ERBB2基因的外显子20未检测到突变;在PIK3CA基因的外显子9和20未检测到突变;在MET基因的外显子14未检测到突变;在IDH1基因的外显子4检测到突变395G>T,导致R132L氨基酸改变且在VTCN1的外显子2与NRG1的外显子2之间检测到转录融合物。
未检测到涉及ALK、ROS1、RET、NTRK1、NTRK2、NTRK3、FGFR1、FGFR2及FGFR3基因的转录融合物。
未检测到ERBB2或MET过度表达。
对获自该样本的cDNA进行RNA-Seq(RNA测序)以致使如SEQ ID NO:166的序列的鉴定。其显示出存在出现在VTCN1基因的外显子2与NRG1基因的外显子2之间的框内融合接点。下划线序列即核苷酸1-65对应编码VTCN1的基因(访问代码NM_024626.4)的外显子2的一部分。其余28个核苷酸即核苷酸66-93对应NRG1的外显子2的一部分。
CATAATTAGCATCATCATTATTCTGGCTGGAGCAATTGCACTCATCATTGGCTTTGGTATTTCAGCCTTGCCTCCCCGATTGAAAGAGATGAA(SEQ ID NO:166)。
实施例18:源自患者的CDH1-NRG1融合数据
将获自经诊断罹患胰脏腺癌的女性病患的肿瘤性材料进行以下分子生物科技分析。以Maxwell(Promega)FFPE LEV套组进行自动RNA萃取。
使用Archer Fusion Plex NGS进行分子检验。在含有161个基因的OncomineComprehensive Assay V3(OCAV3)套组上进行NGS(S5XL-Life Technologies),其中81个被认为是具热突变点基因(hotspot gene)且48个为全长基因,以及47个拷贝数基因。对获自该样本的cDNA进行RNA-Seq(RNA测序)以致使如SEQ ID NO:186的序列的鉴定。
其显示出存在出现在CDH1基因的外显子11与NRG1基因的外显子2之间的框内融合接点。下划线序列即核苷酸1-119对应编码CDH1的基因(NM_001317185.2)的外显子11的一部分。其余30个核苷酸,即核苷酸120-149,对应NRG1基因的外显子2的一部分。此外,NGS显示出在FGFR3基因的外显子10存在有突变1172C>T,引起了氨基酸改变Ala391Val。
CTGGCTGGAGATTAATCCGGACACTGGTGCCATTTCCACTCGGGCTGAGCTGGACAGGGAGGATTTTG AGCACGTGAAGAACAGCACGTACACAGCCCTAATCATAGCTACAGACAATGCCTTGCCTCCCCGATTGAAAGAGATGAAA(SEQ ID NO:186)。
CCTTGCCTCCCCGATTGAAAGAGATGAAAA
实施例19:源自患者的CXADR-NRG1融合数据
将获自经诊断罹患大肠癌的男性病患的肿瘤性材料进行以下分子生物科技分析。所提交组织样本的肿瘤区域或从周围组织显微解剖的载玻片,使用标准方法分离总RNA。对分离出的RNA进行逆转录,且建构双链DNA。对该样本进行通用标签和条形码处理,并使用基因特异性引物及通用标记特异性引物(Archer FusionPlex化学公司)进行半巢式多重PCR。使用Illumina NextSeq v2化学品来制备产物及测序。使用Archer分析软件v4.1来分析序列数据。分析灵敏性为大约5RNA分子编码该融合物并取决于所出现的特异性融合事件。融合物与所报告的参考转录本比较。
分子分析显示存在出现在CXADR基因的外显子1与NRG1的外显子2之间的框内融合接点。下划线序列即核苷酸1-43对应编码CXADR的基因(NM_001207063.2)的外显子1的一部分。其余58个核苷酸,即核苷酸44-101对应NRG1基因的外显子2的一部分。
ATGGCGCTCCTGCTGTGCTTCGTGCTCCTGTGCGGAGTAGTGGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACT(SEQ ID NO:217)。
实施例20:源自患者的GTF2E2-NRG1融合数据
将获自经诊断罹患转移性乳腺癌NOS的女性病患之具肿瘤性材料的经福尔马林固定石蜡块进行以下分子生物科技分析。
在以批准的显微解剖技术获取组织之后进行分子检验。在显微镜下检查候选载玻片,并圈选含有肿瘤细胞(及在需要检验时圈选出单独的正常细胞)的区域。实验室技师使用解剖显微镜从标记区域收取目标组织并取出。所标记及取出的区域在显微解剖后的载玻片上重新进行显微镜检查,并复查显微解剖的妥适性。
基因融合物及变异转录的侦测在从经福尔马林固定及石蜡包埋的肿瘤样本分离出的mRNA上进行,其使用Agilent SureSelectXT的低起始量样本库制备化学品(Low InputLibrary prep chemistry),针对FFPE样本优化,并结合SureSelect Human All Exon V7捕获探针套组(bait panel)(48.2Mb)与Illumina NovaSeq。此测定法设计用于检测出现在基因内已知的且新的断点处的融合。此分析致使如SEQ ID NO:233的序列的鉴定。其显示出存在了框内融合且在GTF2E2基因的外显子2与NRG1基因的外显子2之间出现接点。下划线序列即核苷酸1-141对应GTF2E2基因(NM_002095.6)的外显子2的一部分。核苷酸142-268对应编码NRG1的基因(NM_001159999.3)的一部分。
GGGAGCTGTTCAAAAAACGAGCTCTTTCTACTCCTGTAGTAGAAAAACGTTCAGCATCTTCTGAGTCA TCATCATCATCGTCAAAGAAGAAGAAAACAAAGGTAGAACATGGAGGATCGTCAGGCTCTAAACAAAATTCTGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAACCAGTTCTGAATACTCCTCTCTCAGATTCAAGTGGTTCAAGAATGGGAATGA(SEQ ID NO:233)。
使用Illumina NextSeq平台,基于下一代测序(NGS)分析将从经福尔马林固定及石蜡包埋的肿瘤样本分离出的基因组DNA进行肿瘤突变负荷分析。仅使用先前没有关于生殖细胞变异的报告的错义突变来计算肿瘤突变负荷。使用以下所定义的肿瘤突变负荷阈值水平并建立截止点:
●高:每兆碱基大于或等于17个突变(≥17个突变/Mb)。
●中:每兆碱基大于或等于7个突变但小于17个突变(≥7个且<17个突变/Mb)。
●低:每兆碱基小于或等于6个突变(≤6个突变/Mb)。患者样本指出TMB评分为9。
通过NGS使用微卫星不稳定性(MSI)分析,未检测到微卫星不稳定性。
使用NGS分析,在GATA3的外显子6检测到框移突变(c.1305_1327del23,蛋白变异P436fs)及失能变体NTRK2(蛋白变异p.Q172 c.514C>T,(NM_006180.4)。
实施例21:源自患者的CSMD1-NRG1融合数据
将获自经诊断罹患大肠直肠癌的男性病患的肿瘤性材料进行以下分子生物科技分析。
使用由596个带有单核苷酸变异、插入与删除(indel)、易位的基因所组成的定制肿瘤学检验套组进行杂交捕获下一代测序。使用IDT xGen Exome研究套组v1.0杂交探针使得可从重排基因中无偏地检测所表达的融合转录本而进行全基因组转录本RNA测序。
其显示出存在出现在CSMD1基因的外显子23与NRG1的外显子6之间的框内融合接点。下划线序列,即核苷酸1-88,对应编码CSMD1的基因(NM_033225.6)的外显子23的一部分。其余的核苷酸,即核苷酸89-150,对应NRG1基因的外显子6的一部分。相关的患者报告提及阿法替尼(Afatinib)及厄洛替尼(Erlotinib)为经FDA批准与此CSMD1-NRG1融合物相关的疗法,同时提及GSK2849330作为调查性研究。此外,提到了与CSMD1-NRG1融合物相关的临床试验TAPUR(NCT02693535)。
在患者的材料中未鉴定出致病性生殖细胞突变,在KRAS或NRAS中也未鉴定出致病性单一核苷酸同质多形性。在患者的材料中鉴定出以下四种体细胞基因组变体:在TP53中的Y220C错义突变、在APC中的R564*终止突变(stop gain mutation)、在APC中的N1455fs框移突变、及在BRAF中的G469A错义突变。确定MSI状态为稳定的且肿瘤突变负荷为4.6m/MB。
鉴定出意义不明的变体,包括:在APOB(NM_000384)中的c.3332+1G>A剪接区变体、在GATA3(NM_001002295)中的c.425C>T p.S142L误义变体、在LZTR1(NM_006767)中的c.352C>T p.R118C误义变体、在CTC1(NM_025099)中的c.227A>T p.H76L误义变体、在CYP1B1(NM_000104)中的c.239G>A p.R80H误义变体、在RECQL4(NM_004260)中的c.1099C>Tp.R367W误义变体、在SOX2(NM_003106)中的c.871A>G p.R291G误义变体、及在TCF7L2(NM_001146274)中的c85_87del pE29del框内缺失。
该患者先前的治疗包括氟脲嘧啶、菊白叶酸、伊立替康(Irinotecan)、贝伐单抗(Bevacizumab)及奥沙利铂(Oxaliplatin)。
ATCCTAAACAGCACATCCAATCACCTGTGGCTAGAGTTCAACACCAATGGATCTGACACCGACCAAGG TTTTCAACTCACCTATACCACTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACT(SEQ ID NO:255)。
实施例22:源自患者的PTN-NRG1融合数据
将获自经诊断罹患转移性乳房恶性肿瘤NOS的女性病患之具肿瘤性材料的经福尔马林固定石蜡块进行以下分子生物科技分析。
在以批准的显微解剖技术收取组织之后进行分子检验。在显微镜下检查候选载玻片,并圈选含有肿瘤细胞(及在需要检验时圈选出单独的正常细胞)的区域。实验室技师使用解剖显微镜从标记区域收取目标组织并取出。所标记及取出的区域在显微解剖后的载玻片上重新进行显微镜检查,并复查显微解剖的妥适性。
基因融合物及变异转录的侦测在从经福尔马林固定及石蜡包埋的肿瘤样本分离出的mRNA上进行,其使用Agilent SureSelectXT的低起始量样本库制备化学品(Low InputLibrary prep chemistry),针对FFPE样本优化,并结合SureSelect Human All Exon V7捕获探针套组(bait panel)(48.2Mb)与Illumina NovaSeq。此测定法设计用于检测出现在基因内已知的且新的断点处的融合。此分析致使如SEQ ID NO:313的序列的鉴定。其显示出存在了框内融合且在PTN基因的外显子4与NRG1基因的外显子2之间出现接点。下划线序列,即核苷酸1-102,对应PTN基因(NM_001321386.2)的外显子2的一部分。核苷酸103-205对应编码NRG1的基因(NM_001159999.3)的一部分。
CCAGAACTGGAAGTCTGAAGCGAGCCCTGCACAATGCCGAATGCCAGAAGACTGTCACCATCTCCAAG CCCTGTGGCAAACTGACCAAGCCCAAACCTCAAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAACCAGTTCTGAATACTCCTCTCTCAGATT(SEQ ID NO:313)。
使用Illumina NextSeq平台,基于下一代测序(NGS)分析将从经福尔马林固定及石蜡包埋的肿瘤样本分离出的基因组DNA进行肿瘤突变负荷分析。仅使用先前没有关于生殖细胞变异的报告的错义突变来计算肿瘤突变负荷。使用以下所定义的肿瘤突变负荷阈值水平并建立截止点:
●高:每兆碱基大于或等于17个突变(≥17个突变/Mb)。
●中:每兆碱基大于或等于7个突变但小于17个突变(≥7个且<17个突变/Mb)。
●低:每兆碱基小于或等于6个突变(≤6个突变/Mb)。患者样本显示出低TMB评分。
通过NGS使用微卫星不稳定性(MSI)分析,未检测到微卫星不稳定性。
使用NGS分析,在TP53的外显子10检测到p.E336*,c.1006G>T突变(NM_000546.5)。在NTRK1/2/3、AKT1、BRCA1/2、ERBB2、ESR1、PIK3CA、PTEN中未检测到变异,且对于PD-L1系得到阴性IHC结果(基于22c3及SP142)。
实施例23:源自患者的ST14-NRG1融合数据
从经诊断出罹患非小细胞肺癌的患者所获得的肿瘤性材料上进行的分子分析显示出存在了出现在如SEQ ID NO:330序列所包含的ST14基因的外显子11与NRG1的外显子6之间的框内融合接点。下划线序列,即核苷酸1-95,对应编码ST14的基因(NM_021978.4)的外显子11的一部分。其余87个核苷酸,即核苷酸96-182,对应NRG1基因的外显子6的一部分。
CAACAGCAACAAGATCACAGTTCGCTTCCACTCAGATCAGTCCTACACCGACACCGGCTTCTTAGCTG AATACCTCTCCTACGACTCCAGTGACCCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCT(SEQ ID NO:330)。
实施例24:源自患者的THBS1-NRG1融合数据
从经诊断出罹患胰脏腺癌的患者所获得之具有肿瘤性材料之新鲜的、冷冻的、或经福尔马林固定的石蜡块中萃取肿瘤DNA,并进行以下分子生物技术分析。
调查萃取的DNA是否存有447个癌症基因的外显子DNA序列且在60个基因中的191个区域进行重排检测。从含有至少20%肿瘤细胞核的组织中分离出DNA,且使用溶液相Agilent SureSelect杂交捕获套组及Illumina HiSeq 2500测序仪来进行大规模平行测序分析。
分子分析显示出存在了出现在THBS1基因的外显子9与NRG1的外显子6之间的框内融合接点。下划线序列即核苷酸1-56对应编码THBS1的基因(NM_003246.4)的外显子9的一部分。核苷酸57-145对应NRG1基因的外显子6的一部分。
ACCCTGTGAAGGCGAAGCGCGGGAGACCAAAGCCTGCAAGAAAGACGCCTGCCCCACTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCTTC(SEQ ID NO:376)。
进一步的分子分析并未显露出有ALK、NTRK1、NTRK2、NTRK3、ROS1的融合物,且未检测到涉及BRCA1、BRCA2或PALB2的致病性突变、拷贝数改变或结构变体。已对鉴定以下突变:TP53中的c.783-10_787delinsCCTG、TP53在17p13.1的单拷贝缺失、c.*178T>A,CDKN1B的外显子3、在ERCC2外显子12中的c.1205A>C(p.N402T)、在FANCD2外显子21中的c.1858T>C(p.C620R)、在KIF1B外显子5中的c.398A>C(p.N133T)、在NAB2中的c.1092-7T>C、在NOTCH1外显子20中的c.3245G>A(p.R1082H)、在PTPN14外显子13中的c.1798C>T(p.R600W)、及在RASA1外显子9中的c.1273C>A(p.H425N)。
在KRAS或NRAS中也未鉴定出致病性单一核苷酸同质多形性。在患者的材料中鉴定出以下四种体细胞基因组变体:在TP53中的Y220C错义突变、在APC中的R564*终止突变(stop gain mutation)、在APC中的N1455fs框移突变、及在BRAF中的G469A错义突变。确定MSI状态为稳定的且肿瘤突变负荷为4.6m/MB。
实施例25:源自患者的AGRN-NRG1融合数据
将获自经诊断罹患胰脏癌(PDAC)的男性病患的肿瘤性材料进行以下分子生物科技分析。
使用由648个带有单核苷酸变异、插入与删除(indel)、易位的基因所组成的定制肿瘤学检验套组进行杂交捕获下一代测序。可从重排基因中无偏地检测所表达的融合转录本来进行全基因组转录本RNA测序。该测定法的限度为对于单核苷酸变体的变异等位基因分数(VAF)为5%且灵敏度为98.2%,对于插入与删除的VAF为5%且灵敏度为91.8%,而对于易位的灵敏度为91.7%。
此分析致使如SEQ ID NO:403的序列的鉴定。其显示出存在框内融合且在AGRN基因的外显子12与NRG1基因的外显子6之间出现接点。下划线序列,即核苷酸1-106,对应AGRN基因(NM_001305275.2)的外显子12的一部分。核苷酸107-207对应编码NRG1的基因(NM_001159999.3)的一部分。
GTGTGCGGCTCAGATGGGGTCACCTACAGCACCGAGTGTGAGCTGAAGAAGGCCAGGTGTGAGTCACA GCGAGGGCTCTACGTAGCGGCCCAGGGAGCCTGCCGAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCTTCATGGTGAAAGAC(SEQ ID NO:403)。
此外,也检测到FGFR1过度表达。
实施例26:源自患者的PVALB-NRG1融合数据
从经诊断出罹患非小细胞肺癌的患者所获得的肿瘤性材料上进行的分子分析显示出存在出现在如SEQ ID NO:437序列所包含的PVALB基因的外显子4与NRG1的外显子6之间的框内融合接点。下划线序列,即核苷酸1-102,对应编码PVALB的基因(NM_002854.3)的外显子4的一部分。核苷酸103-227对应NRG1基因的外显子6的一部分。
TAAAAGGCTTCTCCCCAGATGCCAGAGACCTGTCTGCTAAAGAAACCAAGATGCTGATGGCTGCTGGA GACAAAGATGGGGACGGCAAAATTGGGGTTGACGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCTTCATGGTGAAAGACCTTTCAAACCCCTCGAGATACTTG(SEQ ID NO:437)。
实施例27:源自患者的SLC3A2-NRG1融合数据
从经诊断出罹患肺癌的患者所获得的肿瘤性材料上进行以下分子生物技术分析。先后使用Maxwell RSC及ReliaPrepTMFFPE Total RNA Promega套组以及Archer Dx CTLFusionplex从经福尔马林固定的石蜡块萃取出总RNA。使用Archer Analysis第6.2.7版进行生物信息分析。
此分析显示出存在了出现在如SEQ ID NO:454序列所包含的SLC3A2基因的外显子2与NRG1的外显子6之间的框内融合接点。下划线序列,即核苷酸1-93,对应编码SLC3A2的基因(NM_002394.6)的外显子2的一部分。核苷酸94-121对应NRG1基因的外显子6的一部分。
AGTTGGGGTCTCACTGTGTTGCCCAGACTGGTCTCGAACTCTTGGCCTCAGGTGATCCTCTTCCCTCA GCTTCCCAGAATGCCGAGATGATAGCTACATCTACATCCACCACTGGGACAAG(SEQ ID NO:454)。
实施例28:源自患者的APP-NRG1融合数据
从经诊断出罹患胰脏癌的患者所获得的肿瘤性材料上进行分子生物技术分析,其显示出存在出现在如SEQ ID NO:486序列所包含的APP基因的外显子14与NRG1基因的外显子6之间的框内融合接点。下划线序列,即核苷酸1-54,对应编码APP的基因(NM_001136130.3)的外显子14的一部分。核苷酸55-141对应NRG1基因的外显子6的一部分。
TTGAGCCTGTTGATGCCCGCCCTGCTGCCGACCGAGGACTGACCACTCGACCAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCT(SEQID NO:486)。
实施例29:源自患者的WRN-NRG1融合数据
从经诊断出罹患乳癌的患者所获得的肿瘤性材料上进行分子生物技术分析,其显示出存在出现在如SEQ ID NO:528序列所包含的WRN基因的外显子33与NRG1基因的外显子6之间的框内融合接点。下划线序列,即核苷酸1-96,对应编码APP的基因(NM_000553.6)的外显子33的一部分。核苷酸97-182对应NRG1基因的外显子6的一部分。
AAGCTGGCTGCCCCCTTGATTTGGAGCGAGCAGGCCTGACTCCAGAGGTTCAGAAGATTATTGCTGAT GTTATCCGAAACCCTCCCGTCAACTCAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGC(SEQ ID NO:528)。
实施例30:源自患者的DAAM1-NRG1融合数据
从经诊断出罹患乳癌的患者所获得的肿瘤性材料上进行分子生物技术分析,其显示出存在出现在如SEQ ID NO:605序列所包含的DAAM1基因的外显子1与NRG1基因的外显子1之间的框内融合接点。下划线序列,即核苷酸1-75,对应编码DAAM1的基因(NM_001270520.2)的外显子1的一部分。核苷酸76-150对应NRG1基因的外显子1的一部分。
GAAGGAAACTGTTTAACCGGATCCCATTGTACCCAGAGTGCAGAGCCGCCTTTCCAGCATGCAGGGGC TGCTCAGGACAGAGAGGGAGGAGGCGCGCGGGGACGGGGACGCCCAGGAGGACCCACTCGCGGGTCCCGCTCCGCTCCGGCA(SEQ ID NO:605)。
实施例31:源自患者的ASPH-NRG1融合数据
从经诊断出罹患大肠直肠腺癌的患者所获得的肿瘤性材料上进行分子生物技术分析,其显示出存在出现在如SEQ ID NO:635序列所包含的ASPH基因的外显子22与NRG1基因的外显子2之间的框内融合接点。下划线序列,即核苷酸1-75,对应编码ASPH的基因(NM_001164750.2)的外显子1的一部分。核苷酸76-150对应NRG1基因的外显子2的一部分。
AAGGTCTCTTCCTGCCTGAGGATGAAAACCTGAGGGAAAAAGGGGACTGGAGCCAGTTCACGCTGTGG CAGCAAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA(SEQ ID NO:635)。
实施例32:源自患者的NOTCH2-NRG1融合数据
从经诊断出罹患胰脏癌的患者所获得的肿瘤性材料上进行分子生物技术分析,其显示出存在出现在如SEQ ID NO:693序列所包含的NOTCH2基因的外显子6与NRG1基因的外显子6之间的框内融合接点。下划线序列,即核苷酸1-75,对应编码NOTCH2的基因(NM_024408.4)的外显子6的一部分。核苷酸76-150对应NRG1基因的外显子6的一部分。
CCTCCTGTACTCCAGGCTCCACCTGCATCGACCGTGTGGCCTCCTTCTCTTGCATGTGCCCAGAGGGG AAGGCAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG(SEQ ID NO:693)。
实施例33:源自患者的CD74-NRG1融合数据
从经诊断出罹患肺癌的患者所获得的肿瘤性材料上进行分子生物技术分析,其显示出存在出现在如SEQ ID NO:717序列所包含的CD74基因的外显子2与NRG1基因的外显子2之间的框内融合接点。下划线序列,即核苷酸1-75,对应编码CD74的基因(NM_001025159.3)的外显子2的一部分。核苷酸76-150对应NRG1基因的外显子2的一部分。
AGGGCCGGCTGGACAAACTGACAGTCACCTCCCAGAACCTGCAGCTGGAGAACCTGCGCATGAAGCTT CCCAAGCCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA(SEQ ID NO:717)。
实施例34:源自患者的SDC4-NRG1融合数据
从经诊断出罹患肺癌的患者所获得的肿瘤性材料上进行分子生物技术分析,其显示出存在出现在如SEQ ID NO:743序列所包含的SDC4基因的外显子2与NRG1基因的外显子2之间的框内融合接点。下划线序列,即核苷酸1-75,对应编码SDC4的基因(NM_002999.4)的外显子2的一部分。核苷酸76-150对应NRG1基因的外显子2的一部分。
TACCAGACGATGAGGATGTAGTGGGGCCCGGGCAGGAATCTGATGACTTTGAGCTGTCTGGCTCTGGA GATCTGGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA(SEQ ID NO:743)。
实施例35:源自患者的CD44-NRG1融合数据
从经诊断出罹患癌症的患者所获得的肿瘤性材料上进行分子生物技术分析,其显示出存在出现在如SEQ ID NO:761序列所包含的CD44基因的外显子5与NRG1基因的外显子6之间的框内融合接点。下划线序列,即核苷酸1-75,对应编码CD44的基因(NM_000610.4)的外显子2的一部分。核苷酸76-150对应NRG1基因的外显子6的一部分。
TTTCTACTGTACACCCCATCCCAGACGAAGACAGTCCCTGGATCACCGACAGCACAGACAGAATCCCT GCTACCACTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG(SEQ ID NO:761)。
实施例36:源自患者的SLC4A4-NRG1融合数据
从经诊断出罹患胰脏癌的患者所获得的肿瘤性材料上进行分子生物技术分析,其显示出存在出现在如SEQ ID NO:765序列所包含的SLC4A4基因的外显子14与NRG1基因的外显子6之间的框内融合接点。下划线序列,即核苷酸1-75,对应编码SLC4A4的基因(NM_001098484.3)的外显子14的一部分。核苷酸76-150对应NRG1基因的外显子6的一部分。
ACTACCCCATCAACTCCAACTTCAAAGTGGGCTACAACACTCTCTTTTCCTGTACCTGTGTGCCACCT GACCCAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG(SEQ ID NO:765)。
实施例37:源自患者的SDC4-NRG1融合数据
从经诊断出罹患肺癌的患者所获得的肿瘤性材料上进行分子生物技术分析,其显示出存在出现在如SEQ ID NO:824序列所包含的SDC4基因的外显子4与NRG1基因的外显子2之间的框内融合接点。下划线序列,即核苷酸1-75,对应编码SDC4的基因(NM_002999.4)的外显子4的一部分。核苷酸76-150对应NRG1基因的外显子2的一部分。
ATGTGTCCAACAAGGTGTCAATGTCCAGCACTGTGCAGGGCAGCAACATCTTTGAGAGAACGGAGGTC CTGGCAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA(SEQ ID NO:824)。
实施例38:源自患者的ZFAT-NRG1融合数据
从经诊断出罹患肺癌的患者所获得的肿瘤性材料上进行分子生物技术分析,其显示出存在出现在如SEQ ID NO:828序列所包含的ZFAT基因的外显子12与NRG1基因的外显子6之间的框内融合接点。下划线序列,即核苷酸1-75,对应编码ZFAT的基因(NM_020863.4)的外显子12的一部分。核苷酸76-150对应NRG1基因的外显子6的一部分。
ACAGGAAGCACCCTAATGAGGAGTATGCCAACGTGGGCACCGGGGAGCTGGCAGCGGAGGTGCTCATC CAGCAAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG(SEQ ID NO:828)。
实施例39:源自患者的DSCAML1-NRG1融合数据
从经诊断出罹患胰脏癌的患者所获得的肿瘤性材料上进行分子生物技术分析,其显示出存在出现在如SEQ ID NO:868序列所包含的DSCAML1基因的外显子3与NRG1基因的外显子2之间的框内融合接点。下划线序列,即核苷酸1-75,对应编码DSCAML1的基因(NM_020693.4)的外显子3的一部分。核苷酸76-150对应NRG1基因的外显子2的一部分。
GCCTCATCCCCTCTTCAGTGCAGGAATATGTTAGCGTTGTATCTTGGGAGAAAGACACAGTCTCCATC ATCCCAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA(SEQ ID NO:868)。
实施例40:PDX动物模型
制备源自患者的异种移植(PDX)动物模型使其含有包含多核苷酸融合物且表达由其所编码的多肽融合物的异常细胞的植入异常细胞,以使用泽妥珠单抗作为ERB2和/或Erb3靶向剂进行治疗来评估其治疗活性。
可从含有癌症或样本的样本产生PDX模型,诸如在此实施例中女性患者经诊断患有胰脏腺癌,以及CDH1-NRG1多核苷酸融合物(见实施例18),基本上如Puig等人,APersonalizedPreclinical Model to Evaluate the Metastatic Potential ofPatient-Derived Colon Cancer Initiating Cells,Clin Cancer Res;19(24),6787-6801(2013)中所述,其全文并入本申请中。
对于全部的小鼠研究,使用介于6-8周龄的雌性NOD.CB17/AlhnRj-Prkdcscid/Rj小鼠(Janvier Labs)。
该模型可以皮下注射,或在免疫缺陷小鼠的胰腺中原位注射。原位模型系于淋巴结、肝脏、肺或癌病中产生局部及远处转移,再现PDAC患者的前期疾病。
在第6周,将所有经载体或泽妥珠单抗治疗的小鼠牺牲且分析治疗功效。
可以对统计学上相关数量的NOD-SCID小鼠原位胰腺注射1*10^6个来自所述PDX模型的肿瘤细胞。从注射后15天开始,每周用CT成像来监测小鼠并检测胰腺中的原发性肿瘤。在至少80%的动物的胰腺中有原发性肿瘤生长后开始进行治疗。
基于不符合以下质量标准的小鼠将其排除在研究之外,包括手术后死亡、没有原发性肿瘤、肿瘤过大的小鼠、体重不足和一般疾病迹象。根据实施例12进行给药及治疗方案,然而,使用标准程序及计算,注意从人类情况中适当地转换与小鼠有关的条件。
本公开的序列信息
VAPB序列信息
SEQ ID NO:1VAPB-NRG1融合物5’处的VAPB外显子1序列
CAGGTCCTGAGCCTCGAGCCGCAGCACGAGCTCAAATTCCGAG
SEQ ID NO:2VAPB-NRG1融合物3’处的NRG1外显子2序列
CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTT
SEQ ID NO:3VAPB-NRG1多核苷酸序列
CAGGTCCTGAGCCTCGAGCCGCAGCACGAGCTCAAATTCCGAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTT
SEQ ID NO:4VAPB-NRG1多肽序列
QVLSLEPQHELKFRALPPRLKEMKSQESAAG
SEQ ID NO:17VAPB的外显子1
AGTCCCCGCCCCTGGAGCCGGCGGCGCAGGGCGCAGCTTCCCGCCGCCAGAGCGGGCCAGCCTGCTGCGTGCGTGCGTGTGTACGACTCTGCGTGCGTGCGTGCGTGCGTGCGTGCCGTCAGCTCGCCGGGCACCGCGGCCTCGCCCTCGCCCTCCGCCCCTGCGCCTGCACCGCGTAGACCGACCCCCCCCCAGCGCGCCCACCCGGTAGAGGACCCCCGCCCGTGCCCCGACCGGTCCCCGCCTTTTTGTAAAACTTAAAGCGGGCGCAGCATTAACGCTTCCCGCCCCGGTGACCTCTCAGGGGTCTCCCCGCCAAAGGTGCTCCGCCGCTAAGGAACATGGCGAAGGTGGAGCAGGTCCTGAGCCTCGAGCCGCAGCACGAGCTCAAATTCCGAG
SEQ ID NO:18VAPB的外显子2
GTCCCTTCACCGATGTTGTCACCACCAACCTAAAGCTTGGCAACCCGACAGACCGAAATGTGTGTTTTAAGGTGAAGACTACAGCACCACGTAGGTACTGTGTGAGGCCCAACAGCGGAATCATCGATGCAGGGGCCTCAATTAATGTATCTG
SEQ ID NO:19VAPB的外显子3
TGATGTTACAGCCTTTCGATTATGATCCCAATGAGAAAAGTAAACACAAGTTTATGGTTCAGTCTATGTTTGCTCCAACTGACACTTCAGATATGGAAGCAGTA
SEQ ID NO:20VAPB的外显子4
TGGAAGGAGGCAAAACCGGAAGACCTTATGGATTCAAAACTTAGATGTGTGTTTGAATTGCCAGCAGAGAATGATAAACCA
SEQ ID NO:21VAPB的外显子5
CATGATGTAGAAATAAATAAAATTATATCCACAACTGCATCAAAGACAGAAACACCAATAGTGTCTAAGTCTCTGAGTTCTTCTTTGGATGACACCGAAGTTAAGAAGGTTATGGAAGAATGTAAGAGGCTGCAAGGTGAAGTTCAGAGGCTACGGGAGGAGAACAAGCAGTTCAAG
SEQ ID NO:22VAPB的外显子6
GAAGAAGATGGACTGCGGATGAGGAAGACAGTGCAGAGCAACAGCCCCATTTCAGCA
TTAGCCCCAACTGGGAAGGAAGAAGGCCTTAGCACCCGGCTCTTGGCTCTGGTGGTTT
TGTTCTTTATCGTTGGTGTAATTATTGGGAAGATTGCCTTGTAGAGGTAGCATGCACAGG
ATGGTAAATTGGATTGGTGGATCCACCATATCATGGGATTTAAATTTATCATAACCATGTG
TAAAAAGAAATTAATGTATGATGACATCTCACAGGTCTTGCCTTTAAATTACCCCTCCCT
GCACACACATACACAGATACACACACACAAATATAATGTAACGATCTTTTAGAAAGTTA
AAAATGTATAGTAACTGATTGAGGGGGAAAAGAATGATCTTTATTAATGACAAGGGAAA
CCATGAGTAATGCCACAATGGCATATTGTAAATGTCATTTTAAACATTGGTAGGCCTTGG
TACATGATGCTGGATTACCTCTCTTAAAATGACACCCTTCCTCGCCTGTTGGTGCTGGCC
CTTGGGGAGCTGGAGCCCAGCATGCTGGGGAGTGCGGTCAGCTCCACACAGTAGTCCC
CACGTGGCCCACTCCCGGCCCAGGCTGCTTTCCGTGTCTTCAGTTCTGTCCAAGCCATC
AGCTCCTTGGGACTGATGAACAGAGTCAGAAGCCCAAAGGAATTGCACTGTGGCAGC
ATCAGACGTACTCGTCATAAGTGAGAGGCGTGTGTTGACTGATTGACCCAGCGCTTTGG
AAATAAATGGCAGTGCTTTGTTCACTTAAAGGGACCAAGCTAAATTTGTATTGGTTCAT
GTAGTGAAGTCAAACTGTTATTCAGAGATGTTTAATGCATATTTAACTTATTTAATGTATT
TCATCTCATGTTTTCTTATTGTCACAAGAGTACAGTTAATGCTGCGTGCTGCTGAACTCT
GTTGGGTGAACTGGTATTGCTGCTGGAGGGCTGTGGGCTCCTCTGTCTCTGGAGAGTCT
GGTCATGTGGAGGTGGGGTTTATTGGGATGCTGGAGAAGAGCTGCCAGGAAGTGTTTT
TTCTGGGTCAGTAAATAACAACTGTCATAGGGAGGGAAATTCTCAGTAGTGACAGTCA
ACTCTAGGTTACCTTTTTTAATGAAGAGTAGTCAGTCTTCTAGATTGTTCTTATACCACCT
CTCAACCATTACTCACACTTCCAGCGCCCAGGTCCAAGTCTGAGCCTGACCTCCCCTTG
GGGACCTAGCCTGGAGTCAGGACAAATGGATCGGGCTGCAGAGGGTTAGAAGCGAGG
GCACCAGCAGTTGTGGGTGGGGAGCAAGGGAAGAGAGAAACTCTTCAGCGAATCCTT
CTAGTACTAGTTGAGAGTTTGACTGTGAATTAATTTTATGCCATAAAAGACCAACCCAGT
TCTGTTTGACTATGTAGCATCTTGAAAAGAAAAATTATAATAAAGCCCCAAAATTAAGA
ATTCTTTTGTCATTTTGTCACATTTGCTCTATGGGGGGAATTATTATTTTATCATTTTTATTA
TTTTGCCATTGGAAGGTTAACTTTAAAATGAGCCCTATCACTGAGAAATACGTGTTTCAT
GATTTAACTCTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTATTTTTTTTTTGGT
TGTCTTCAGCTGACAGTATGAAAAATGAAACTGCTGAAAAAGCTGAGCACCTGGTCAC
CCTTGGCCTTCCATTGCTTTGGCCTTCAGTAAAAAGCAGCCTCCCTTCTAGGTCAGGGA
ACCATGCCATTGAGACTAGTAACGGGCGTTCTGGGCACAGTCCCACTGTGCACAGGTT
TGAGAGGACAAGTTCATCAGAAGGAAGGCAGTCCTTAGAAGTCACATACGTTGAGCCA
CGTTGCTCCTAAGCCTGGCTCTGTCAAGCTGGGTCAGGGGCCTTGAAACTGGAGAAGT
GGAAGTCTATGGTTGGTCTGAGTAAGTAACTTCCTGTCTTCATGAAAAAAGTTGACTTT
GAATCCCAGGTACTCACAGAAATGGTGAACAGACTTAGTTGTTACCCAGGCACCCATG
GATTGTGTTGAGTGTGCAGACAGGGAGGCCACCCCAATAGGAATTCGTCTCCAGGATTT
TTCCCATGTGTCCCCCAGTACTTATAAAAGGGAGTGAAAAGACCGAGCTGTAAGGCAT
GTGCCTTCTGCCACCTGACTTTCCGTGAGGGGACTAAAATTTACTAATTGTAGTTGCTG
CAGCCAGTTAAGTCCTGTAGCTTCCAGGCCCTCATGTCTTTGATAGGAGAGTGCTTAGG
TGGTCCCCAACAGTGCCTAGGGGTACAGTACAGTCCCATTACACTAGAGCAGGGCTCTA
TTTATTTTTAAAGGATATGGCCGTGTGTTTTGATAAAACTTTATTCACAAAAACAGCCGG
GTCATGGGATTTGGCTTGTGAGTCTGTAACAGTTCTTAAAAAGAATATCTGAGAAACTA
CTCTGTTTTAGACCTTTGAAGGTGATTTAGAGTTTTGTGTACATCTAGGAGAAGGTGTTC
AGCTTCTCAGAGGATGTGGACATTTTGGTTGCAGCTAAAAATCAGTCTCTGAAGTCTCT
CTCCCTTCTAGAGGTTAGGACTTGGTGAACATGTTTGTGGGCCTTTTGACTGAGTGGCA
GAAGGAAACTGCTCAGGAAGAGAAACAGGTGACTGATGGGAAGGTTGATTATTTTCTC
AGTCATCCTGGCAGCCAAAAATGTGCCAGGAAAAGAAAGAATGTGGAGCACGCGTGG
CTCCTGGAGGACTTGGAGATGCATGCACATTTAGGGTGTTTTCCCTAGAATTACATAATG
AAAAAAAGAATAAGGCAAAGAGGAGGTGAATATGGGGCCTGTCACAACGGCCTGCCC
TGCCCCAAGAGGGTTAAGAGTCAGATAATCGGGACGAAACTGGCATGGAAAGAGCGA
GCCTAGGGAGGATGCCGCTGGGCAGTGTGCATGGGGGAGCTGCTGCCAGGCTGCCCTC
CAGTCTGCTCCTGTGGTTACTGGCTCCACAGCACCTCAGAGAGGGCGGCCCTGGCTTC
AGAAATGCCAGCCATAGTGCTCACAAATGCAGAAGAGATGGAAGCGGTGACAGAATCC
TGAAAGTTTTTATTGATTGAAGTTTTAAATTGGTAACTTAAGCTTCCTTGGCACGATACA
AAATACCTCTTAAAGACAGCAGGCTTTTTTATTTGTAGGTGTGAGGAACTGGCTTTAAC
TTTTTTCTCCTCCTAGTTTGCATGTTTTCCTTCTCTCGTCTTCTGAACTGCTGGCACCAG
CAGTAATACATACTGATAAAATCAAAATTGATTTTTACCAGTGGCCAGTTTATGGCTAGA
GAGACGACTTATACCTCCATAACACAGAAGGGGGAAAAATGAAGAACCTCCAGTGATC
CGTGAAAACCTAAACGCTTTCAAACAAATCCCAGGAACAGAATTGCTATCGAAAGATAT
CATTGCCCAGTTTGCAGGCTATGTTGAGTCAGATAGAACTGAATGTAGTGAGAGCTCAG
AGCTACAGAGCCTTTCAGATGAATTTGAAAACAGACTCTGTGTGTGTGTGCATGTGTGC
ATGTGTGCATGTGTGGCATATGTGCCGTATGTCAGTAGCTTGACAGTTTTCAAATCGTGC
CTATATTTTTTTGCATACACAAATTTTTGTGTTTGCAAACTCAGAATCCATGCCAAAATAC
AATGTTATATGTCATTTTCAGCTCCTTCTCTAAAGGAATGGCCCATTTCTCATTGTAGTTT
GAGAAATACATGTATGAAGAGATAGGGGTCTTGGGCTTCCCAGTGTCACTTTGAACACC
TGAATAACATTTAACTCCTGAGACCTTCTCGGTGTAGAGGCCACTGCTTCCCCCTGCTG
GAGATGGCATTTCATTGAAGGGCCTCTCGTGGCTTTCCCTGCCCCCGGCTGTCTGGCCT
GAAGAAGGAGAAAGAACCAAACTGAACTATGAAAAGTTACCACTCTGAGGAGACCTC
TCTTAATTAACACTTGGGGCCATGTTTGCTGTTGTTGAGAAGGAGTGTTCTCAAAGATG
AGCTGGAATGGAATTGTATTTAGAAAGGCCCCTGCAAAGTATATAGATGGATGACTCTA
GTTCATGACATACAAATCCCATAAGGCCAACGACCACTCTTCTGGAACACCAAGAGCA
GCTCTGAGATCATGCTGGCCCTACGCGAATTGAGTTTCTGTGGCCTAATTGGATTTGGA
GAACGCCTTCCCTGGCCCCTTTTCCTCAGACAGATCTGCTCTGATAGGAACCTTTTCAA
GAAAGTTACTGTTGTTTCAATGCCACTCCTTACCTGTATAGAACATTTCCAATACATTCG
CTCATTGAACTTAATCCTTGCAACTGTGACTGGGGGGTAGATGGCTCTGTTTGCATACG
AAGAAATAAAGGCTCCAGGAGGTTAAATCGGGCAACTTTTTAGAACTAAATCAGTCTCT
GTAAGGCCTACATTGCTAAGATACCATTTCAGCTCTGAAAATCTGCTTCAGGGAAGTGA
GTGGATGAGGCCTTCCTGCCTCAGCTACTCTGCCCGTCTGTACATCTTTTGTGTCTGCCT
CCGTACCTTATTCAGTTATTTTCACACTAAAGTAAGTAGAATTAAGACTGTAGTTCAGAT
GCTTTTTCTTTTTCTGTTGGAAACTGAACACACTACAGACAGTGAAAAAAGGTACATAT
TCCATTTTCTCATTGCCTGAAGATCTCTGCTGATGCTCCTGGAGAATGACTTTGGGGGCT
TTAGAAAGAATATTGCCAGTCCGTCTCGGCAAGGAGATGATGGGAGCGCTTTATATGGA
GGCTTTACATGACTTGTAAATTAAATGTGAATGAGGGCAGTTGATTAAAATTGGTATTAC
AGAAGGGCCCTGCTGAGGTTTGAAAACAGCTGAGCTGCTGATGTCTCAGGCCTTTCCC
TGAATTAGCACTGCGGTTCTCCAGGATATCAGCAAAGAGGGCAAGTAATAGAAGCCCC
TGATAAGGAGCGTCAGCCGACAGGCAAGCTTGGGAGGCTGTGGGAATGGGTCTGCCCC
CAGCTTCACAGACCTCTTCCTCCAGCCTCTGAATCCCATTAGCCACAGCCTAGAACATT
AGCTGAGCTGCACAAGCTCACCCACCCCTGTGCCAGGGGGCCCTGACCTCCCTCCATG
CCATGTTTTTGGCTGTATCTACGGCACTTAACAATAGGGGCTTTTTATTTTCATTACAGAG
ATATTTTGAAAAATTTAAAAGACATGAACTCACATAAACAGTTATGGATGATAGTTAAAA
GAGAAACGGGTGGAGGTGGATGAGAGGTTGTCTTCATGAATATAATTACTTGAGATTTT
TTTTTCTTAATGGAATTAGTTTATTAGAAAATGTCTGTGTTAAATCCGTAGAAAAGGAAG
AAAAGTGTAGCAACAAAAATGTAGCCATTATCTAACTTGCCATAAATATTTGCAGTTATG
ATACCTTGGAATGTTGCCACGATATGGATTGCTTTGATTAAAAGATGTCAGTTGAATAAA
ACAGTACTGTGGGAGAATCGCTTTCTGCTGCTAGATAAATGCTGATGTTTATTTTTAAAC
CAGGAAACATTGATCCTGTAACAATGCCCGATTACAATTGCTTTATTACACCCCAGGGCT
GATGGAGATGTAATCACTTGGCTAATGGATGTGGGTGCAGGACAGATGCTCGCTTGCTG
GCCTGCTTTCCTGCTTGCATTCTGATGAGCTGCAGGAGTGCGCCTGGCCTTCTGCAGGT
GGAGCTGCTGTCAGAGCTTCGTTTCACTGATACCCAAAGCCATGTCTGACTGAAATAAA
ACAGGTTCCCTTTTTTTTTCCCTTTGGAAAATGCCAACTAAGGGAGACTAATCAGATATC
TTAACACAATTTCATCCAGGCTTAGTGCTAACAAGATTGCGGGGCTTTTTAGGGTTTAA
GAAGATGAGAAATGAGTGTGCACGTTTCACACGTTGACTTGCCGGTTTTTCCATGTCAT
ACAAAAAAGTCCTGGCTGTTTCTCCGAACTGGCTGCCTGCATTCCCGTCTTTCTTTTGT
TTTTAAGAAATAGACTGAATTCAGCTGTTAATCCTCTAGTACAGTATCCATGTTAAAATG
TTTTTCCATTGCATCTTTTATGTGAATTCAAAGGTCAGAATTTATTGTCTGTGATATTGAGACCATGTGTACAAGAACTACTTTTTGCTTTTCATCATTCACTCCTTAGCAAACGTTTCGTAAGTACCCTCTGTCTGTTTGCTACTATATGAGGTGCTGCGAAATTAGTGGGCGTGGCTTTTTATATTTTTCATTCGTGTGTAGCCTAAGTAAGGTGACTCAAGATGATACACCGAGAGAAAAATGCAAAATATATTTGGTTCTCATTTCTGTTGCTGTCGTTTCCTTTTTAAAGACGATTTATCAACTGCTGCCATTTGGAACTTCCTATAAGAAACTAAAAATGATCTATTTCAGTGTTCCTTTCGCCTTTCCTCTGCTTTCTGAATAAATGGTTTCAGTAACCCATGCTGTTCTCTCCCTATTCTACGTCTTTCTCCCTATGTTGAAAAAAGATTCCCACAGTTTCTGATGTGTGTGTTTATAGTCTTCAATGTATGTTAACATGTTAGGAACTGAGTATCTTAAGAGATGTCTTAGAATGCTTTAGTTTTCATAATTTGTCCTTTATGTATTTTTCATTGTATTTGCTGTTTTGACATGGAAGTAATTTAAAAAGTTGGTGCAGGAAAGGACTCTTTACTGTTGCACATTTTGGTTTTCTGATATGTAATAAATTCATGGCTTGGCAGCTGACATGATGTTTCCCAGAGAGAAGGAGATGTATTTCTGCAGGGTCCAGACCAAAAGAGCCATTTACAGCATGTTCTCCCATGTTCCATTATCAGCCTGATGAAACCTGCCCTGCCAAGGCATAAACTTTTGTACTAGCTGTCTCCATATTATGTTCAATAAATTCTGTGCTCTGAATATATTTAAAAAAAAAAAAA
SEQ ID NO:23VAPB的全部6个外显子1-6按顺序排列的多核苷酸序列
SEQ ID NO:24VAPB的外显子1的翻译多肽序列
MAKVEQVLSLEPQHELKFR
SEQ ID NO:25VAPB的外显子2的翻译多肽序列
PFTDVVTTNLKLGNPTDRNVCFKVKTTAPRRYCVRPNSGIIDAGASINVS
SEQ ID NO:26VAPB的外显子3的翻译多肽序列
MLQPFDYDPNEKSKHKFMVQSMFAPTDTSDMEAV
SEQ ID NO:27VAPB的外显子4的翻译多肽序列
WKEAKPEDLMDSKLRCVFELPAENDKP
SEQ ID NO:28VAPB的外显子5的翻译多肽序列
HDVEINKIISTTASKTETPIVSKSLSSSLDDTEVKKVMEECKRLQGEVQRLREENKQFK
SEQ ID NO:29VAPB的外显子6的翻译多肽序列
EEDGLRMRKTVQSNSPISALAPTGKEEGLSTRLLALVVLFFIVGVIIGKIAL
SEQ ID NO:30VAPB多肽序列
MAKVEQVLSLEPQHELKFRGPFTDVVTTNLKLGNPTDRNVCFKVKTTAPRRYCVRPNSGIIDAGASINVSVMLQPFDYDPNEKSKHKFMVQSMFAPTDTSDMEAVWKEAKPEDLMDSKLRCVFELPAENDKPHDVEINKIISTTASKTETPIVSKSLSSSLDDTEVKKVMEECKRLQGEVQRLREENKQFKEEDGLRMRKTVQSNSPISALAPTGKEEGLSTRLLALVVLFFIVGVIIGKIALCADM1序列信息
SEQ ID NO:5 CADM1-NRG1融合物5’处的CADM1外显子7序列
AGCTTCAAACATAGTGGGGAAAGCTCACTCGGATTATATGCTGTATGTATACG
SEQ ID NO:6 CADM1-NRG1融合物3’处的NRG1外显子6序列
CTACATCTACATCCACCACTGGGACAAGCCAT
SEQ ID NO:7 CADM1-NRG1多核苷酸序列
AGCTTCAAACATAGTGGGGAAAGCTCACTCGGATTATATGCTGTATGTATACGCTACATCTACATCCACCACTGGGACAAGCCAT
SEQ ID NO:8 CADM1-NRG1多肽序列
ASNIVGKAHSDYMLYVYATSTSTTGTSH
SEQ ID NO:33 CADM1的外显子1
GGTTGGGCTCGCGGCGCTGTGATTGGTCTGCCCGGACTCCGCCTCCAGCGCATGTCATTAGCATCTCATTAGCTGTCCGCTCGGGCTCCGGAGGCAGCCAACGCCGCCAGTCTGAGGCAGGTGCCCGACATGGCGAGTGTAGTGCTGCCGAGCGGATCCCAGTGTGCGGCGGCAGCGGCGGCGGCGGCGCCTCCCGGGCTCCGGCTCCGGCTTCTGCTGTTGCTCTTCTCCGCCGCGGCACTGATCCCCACAG
SEQ ID NO:34 CADM1的外显子2
GTGATGGGCAGAATCTGTTTACGAAAGACGTGACAGTGATCGAGGGAGAGGTTGCGACCATCAGTTGCCAAGTCAATAAGAGTGACGACTCTGTGATTCAGCTACTGAATCCCAACAGGCAGACCATTTATTTCAGGGACTTCAGGC
SEQ ID NO:35 CADM1的外显子3
CTTTGAAGGACAGCAGGTTTCAGTTGCTGAATTTTTCTAGCAGTGAACTCAAAGTATCATTGACAAACGTCTCAATTTCTGATGAAGGAAGATACTTTTGCCAGCTCTATACCGATCCCCCACAGGAAAGTTACACCACCATCACAGTCCTGG
SEQ ID NO:36 CADM1的外显子4
TCCCACCACGTAATCTGATGATCGATATCCAGAAAGACACTGCGGTGGAAGGTGAGGAGATTGAAGTCAACTGCACTGCTATGGCCAGCAAGCCAGCCACGACTATCAGGTGGTTCAAAGGGAACACAGAGCTAAAAG
SEQ ID NO:37 CADM1的外显子5
GCAAATCGGAGGTGGAAGAGTGGTCAGACATGTACACTGTGACCAGTCAGCTGATGCTGAAGGTGCACAAGGAGGACGATGGGGTCCCAGTGATCTGCCAGGTGGAGCACCCTGCGGTCACTGGAAACCTGCAGACCCAGCGGTATCTAGAAGTACAGT
SEQ ID NO:38 CADM1的外显子6
ATAAGCCTCAAGTGCACATTCAGATGACTTATCCTCTACAAGGCTTAACCCGGGAAGGGGACGCGCTTGAGTTAACATGTGAAGCCATCGGGAAGCCCCA
SEQ ID NO:39 CADM1的外显子7
GCCTGTGATGGTAACTTGGGTGAGAGTCGATGATGAAATGCCTCAACACGCCGTACTGTCTGGGCCCAACCTGTTCATCAATAACCTAAACAAAACAGATAATGGTACATACCGCTGTGAAGCTTCAAACATAGTGGGGAAAGCTCACTCGGATTATATGCTGTATGTATACG
SEQ ID NO:40 CADM1的外显子8
ACACAACGGCGACGACAGAACCAGCAGTTCACG
SEQ ID NO:41 CADM1的外显子9
GCCTTACTCAGTTGCCCAATTCCGCAGAAGAACTGGACAGTGAGGACCTCTCAG
SEQ ID NO:42 CADM1的外显子10
ATTCCCGAGCAGGTGAAGAAGGCTCGATCAGGGCAGTGGATCATGCCGTGATCGGTGGCGTCGTGGCGGTGGTGGTGTTCGCCATGCTGTGCTTGCTCATCATTCTGGGGCGCTATTTTGCCAGACATAAAG
SEQ ID NO:43 CADM1的外显子11
GTACATACTTCACTCATGAAGCCAAAGGAGCCGATGACGCAGCAGACGCAGACACAGCTATAATCAATGCAGAAGGAGGACAGAACAACTCCGAAGAAAAGAAAGAGTACTTCATCTAGATCAGCCTTTTTGTTTCAATGAGGTGTCCAACTGGCCCTATTTAGATGATAAAGAGACAGTGATATTGGAACTTGCGAGAAATTCGTGTGTTTTTTTATGAATGGGTGGAAAGGTGTGAGACTGGGAAGGCTTGGGATTTGCTGTGTAAAAAAAAAAAAAATGTTCTTTGGAAAGTACACTCTGCTGTTTGACACCTCTTTTTTCGTTTGTTTGTTTGTTTAATTTTTATTTCTTCCTACCAAGTCAAACTTGGATACTTGGATTTAGTTTCAGTAGATTGCAGAAAATTCTGTGCCTTGTTTTTTGTTTGTTTGTTGCGTTCCTTTCTTTTCCCCCTTTGTGCACATTTATTTCCTCCCTCTACCCCAATTTCGGATTTTTTCCAAAATCTCCCATTTTGGAATTTGCCTGCTGGGATTCCTTAGACTCTTTTCCTTCCCTTTTCTGTTCTAGTTTTTTACTTTTGTTTATTTTTATGGTAACTGCTTTCTGTTCCAAATTCAGTTTCATAAAAGGAGAACCAGCACAGCTTAGATTTCATAGTTCAGAATTTAGTGTATCCATAATGCATTCTTCTCTGTTGTCGTAAAGATTTGGGTGAACAAACAATGAAAACTCTTTGCTGCTGCCCATGTTTCAAATACTTAGAGCAGTGAAGACTAGAAAATTAGACTGTGATTCAGAAAATGTTCTGTTTGCTGTGGAACTACATTACTGTACAGGGTTATCTGCAAGTGAGGTGTGTCACAATGAGATTGAATTTCACTGTCTTTAATTCTGTATCTGTAGACGGCTCAGTATAGATACCCTACGCTGTCCAGAAAGGTTTGGGGCAGAAAGGACTCCTCCTTTTTCCATGCCCTAAACAGACCTGACAGGTGAGGTCTGTTCCTTTTATATAAGTGGACAAATTTTGAGTTGCCACAGGAGGGGAAGTAGGGAGGGGGGAAATACAGTTCTGCTCTGGTTGTTTCTGTTCCAAATGATTCCATCCACCTTTCCCAATCGGCCTTACTTCTCACTAATTTGTAGGAAAAAGCAAGTTCGTCTGTTGTGCGAATGACTGAATGGGACAGAGTTGATTTTTTTTTTTTTTTCCTTTGTGCTTAGTTAGGAAGGCAGTAGGATGTGGCCTGCATGTACTGTATATTACAGATATTTGTCATGCTGGGATTTCCAACTCGAATCTGTGTGAAACTTTCATTCCTTCAGATTTGGCTTGACAAAGGCAGGAGGTACAAAAGAAGGGCTGGTATTGTTCTCACACTGGTCTGCTGTCGCTCTCAGTTCTCGATAGGTCAGAGCAGAGGTGGAAAAACAGCATGTACGGATTTTCAGTTACTTAATCAAAACTCAAATGTGAGTGTTTTTATCTTTTTACCTTTCATACACTAGCCTTGGCCTCTTTCCTCAGCCTTAAGAACCATCTGCCAAAAATTACTGATCCTCGCATGATGGCAGCCATAGTGCATAGCTACTAAAATCAGTGACCTTGAACATATCTTAGATGGGGAGCCTCGGGAAAAGGTAGAGGAGTCACGTTACCATTTACATGTTTTAAAGAAAGAAGTGTGGGGATTTTCACTGAAACGTCTAGGAAATCTAGAAGTAGTCCTGAAGGACAGAAACTAAACTCTTACCATATGTTTGGTAAGACTCCAGACTCCAGCTAACAGTCCCTATGGAAAGATGGCATCAAAAAAGATAGATCTATATATATATATAAATATATATTCTATTACATTTTCAGTGAGTAATTTTGGATTTTGCAAGGTGCATTTTTACTATTGTTACATTATGTGGAAAACTTATGCTGATTTATTTAAGGGGGAAAAAGTGTCAACTCTTTGTTATTTGAAAACATGTTTATTTTTCTTGTCTTTATTTTAACCTTTGATAGAACCATTGCAATATGGGGGCCTTTTGGGAACGGACTGGTATGTAAAAGAAAATCCATTATCGAGCAGCATTTTATTTACCCCTCCCCTATCCCTAGGCACTTAACCAAGACAAAAAGCCACAATGAACATCCCTTTTTCAATGAATTTTATAATCTGCAGCTCTATTCCGAGCCCTTAGCACCCATTCCGACCATAGTATAATCATATCAAAGGGTGAGAATCATTTAGCATGTTGTTGAAAGGTTTTTTTTCAGTTGTTCTTTTTAGAAAAAAAGAAAAACAAAAACAAAAACAAAAAAAAAAAATCACACCATTGCTCACAGAATTGGCATCTCATTTTTGGGACCTCCCATCTTTCTGTTTTGAAAAGTGTACAGTAGTGCAGTGTTCCTGATGTAACTTTATGGCTTACAATGTTGACATGTCTCAGGTTCATGTGTTGCGATTGGTGTTTTCCGTCTCAGGTAGATTGCAAAGTGTAGGCCCCACACATTGGAAAAAATAATAATAAAACAAAGCAAAAACAGGAAATTATGGATTTTAGTTGTATATTGGTTTATGTATTTTTTCTTAAGTATACAGTGCACTGTTTGAAATGTATTGTTGAGTATTACTTTGTACAGGTTGATCACTTTTTTTAGAGTGAAGAAAGAACAAACTTGTTTTTTGTGTTTTTTAAAGGAATATAAAATAATGAAGGATGTATAATTGATGCCAAATAAGCTTGTTCTTTAGTCACACCGACGTCTTATTTTTCCCTTTAGGCCAGTTCTGTTTTTAAGGTGTACATGGACAATGTTACAGTGTAAGAAACTCCATATCCATATGTTCCCATTCGCATTTTGTATTGGTTCATGTATACCATTTTTACAAAAAAAAAAAGAAAAAAAAGAAGTACTATAAAATATCTGTCTTCTTAATAAAAAAAAATTAATGTTACAAAGTGA
SEQ ID NO:44 CADM1的全部11个外显子1-11按顺序排列的多核苷酸序列
SEQ ID NO:45 CADM1的外显子1的翻译多肽序列
MASVVLPSGSQCAAAAAAAAPPGLRLRLLLLLFSAAALIPT
SEQ ID NO:46 CADM1的外显子2的翻译多肽序列
DGQNLFTKDVTVIEGEVATISCQVNKSDDSVIQLLNPNRQTIYFRDFR
SEQ ID NO:47 CADM1的外显子3的翻译多肽序列
LKDSRFQLLNFSSSELKVSLTNVSISDEGRYFCQLYTDPPQESYTTITVL
SEQ ID NO:48 CADM1的外显子4的翻译多肽序列
PPRNLMIDIQKDTAVEGEEIEVNCTAMASKPATTIRWFKGNTELK
SEQ ID NO:49 CADM1的外显子5的翻译多肽序列
KSEVEEWSDMYTVTSQLMLKVHKEDDGVPVICQVEHPAVTGNLQTQRYLEVQ
SEQ ID NO:50 CADM1的外显子6的翻译多肽序列
KPQVHIQMTYPLQGLTREGDALELTCEAIGKP
SEQ ID NO:51 CADM1的外显子7的翻译多肽序列
PVMVTWVRVDDEMPQHAVLSGPNLFINNLNKTDNGTYRCEASNIVGKAHSDYMLYVY
SEQ ID NO:52 CADM1的外显子8的翻译多肽序列
TTATTEPAVH
SEQ ID NO:53 CADM1的外显子9的翻译多肽序列
LTQLPNSAEELDSEDLS
SEQ ID NO:54 CADM1的外显子10的翻译多肽序列
SRAGEEGSIRAVDHAVIGGVVAVVVFAMLCLLIILGRYFARHK
SEQ ID NO:55 CADM1的外显子11的翻译多肽序列TYFTHEAKGADDAADADTAIINAEGGQNNSEEKKEYFI
SEQ ID NO:56 CADM1多肽序列
MASVVLPSGSQCAAAAAAAAPPGLRLRLLLLLFSAAALIPTGDGQNLFTKDVTVIEGEVATISCQVNKSDDSVIQLLNPNRQTIYFRDFRPLKDSRFQLLNFSSSELKVSLTNVSISDEGRYFCQLYTDPPQESYTTITVLVPPRNLMIDIQKDTAVEGEEIEVNCTAMASKPATTIRWFKGNTELKGKSEVEEWSDMYTVTSQLMLKVHKEDDGVPVICQVEHPAVTGNLQTQRYLEVQYKPQVHIQMTYPLQGLTREGDALELTCEAIGKPQPVMVTWVRVDDEMPQHAVLSGPNLFINNLNKTDNGTYRCEASNIVGKAHSDYMLYVYDTTATTEPAVHGLTQLPNSAEELDSEDLSDSRAGEEGSIRAVDHAVIGGVVAVVVFAMLCLLIILGRYFARHKGTYFTHEAKGADDAADADTAIINAEGGQNNSEEKKEYFI
SEQ ID NO:57 CADM1的全部7个外显子1-7按顺序排列的多核苷酸序列
SEQ ID NO:58 CADM1的外显子1-7按顺序排列的翻译多肽序列
MASVVLPSGSQCAAAAAAAAPPGLRLRLLLLLFSAAALIPTGDGQNLFTKDVTVIEGEVATISCQVNKSDDSVIQLLNPNRQTIYFRDFRPLKDSRFQLLNFSSSELKVSLTNVSISDEGRYFCQLYTDPPQESYTTITVLVPPRNLMIDIQKDTAVEGEEIEVNCTAMASKPATTIRWFKGNTELKGKSEVEEWSDMYTVTSQLMLKVHKEDDGVPVICQVEHPAVTGNLQTQRYLEVQYKPQVHIQMTYPLQGLTREGDALELTCEAIGKPQPVMVTWVRVDDEMPQHAVLSGPNLFINNLNKTDNGTYRCEASNIVGKAHSDYMLYVY
CD44序列信息
SEQ ID NO:9来自CD44-NRG1融合物5’处的CD44外显子5的序列
GACGAAGACAGTCCCTGGATCACCGACAGCACAGACAGAATCCCTGCTACCA
SEQ ID NO:10 CD44-NRG1融合物3’处的NRG1外显2子序列
CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTSEQ ID NO:11 CD44-NRG1多核苷酸序列
GACGAAGACAGTCCCTGGATCACCGACAGCACAGACAGAATCCCTGCTACCACCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACT
SEQ ID NO:12 CD44-NRG1多肽序列
DEDSPWITDSTDRIPATTLPPRLKEMKSQESAAGSK
SEQ ID NO:61 CD44的外显子1
CTCATTGCCCAGCGGACCCCAGCCTCTGCCAGGTTCGGTCCGCCATCCTCGTCCCGTCCTCCGCCGGCCCCTGCCCCGCGCCCAGGGATCCTCCAGCTCCTTTCGCCCGCGCCCTCCGTTCGCTCCGGACACCATGGACAAGTTTTGGTGGCACGCAGCCTGGGGACTCTGCCTCGTGCCGCTGAGCCTGGCGCAGATCG
SEQ ID NO:62 CD44的外显子2
ATTTGAATATAACCTGCCGCTTTGCAGGTGTATTCCACGTGGAGAAAAATGGTCGCTACAGCATCTCTCGGACGGAGGCCGCTGACCTCTGCAAGGCTTTCAATAGCACCTTGCCCACAATGGCCCAGATGGAGAAAGCTCTGAGCATCGGATTTGAGACCTGCAG
SEQ ID NO:63 CD44的外显子3
GTATGGGTTCATAGAAGGGCACGTGGTGATTCCCCGGATCCACCCCAACTCCATCTGTGCAGCAAACAACACAGGGGTGTACATCCTCACATCCAACACCTCCCAGTATGACACATATTGCTTCAATGCTTCAG
SEQ ID NO:64 CD44的外显子4
CTCCACCTGAAGAAGATTGTACATCAGTCACAGACCTGCCCAATGCCTTTGATGGACCAATTACCATAA
SEQ ID NO:65 CD44的外显子5
CTATTGTTAACCGTGATGGCACCCGCTATGTCCAGAAAGGAGAATACAGAACGAATCCTGAAGACATCTACCCCAGCAACCCTACTGATGATGACGTGAGCAGCGGCTCCTCCAGTGAAAGGAGCAGCACTTCAGGAGGTTACATCTTTTACACCTTTTCTACTGTACACCCCATCCCAGACGAAGACAGTCCCTGGATCACCGACAGCACAGACAGAATCCCTGCTACCA
SEQ ID NO:66 CD44的外显子6
CTTTGATGAGCACTAGTGCTACAGCAACTGAGACAGCAACCAAGAGGCAAGAAACCTGGGATTGGTTTTCATGGTTGTTTCTACCATCAGAGTCAAAGAATCATCTTCACACAACAACACAAATGGCTG
SEQ ID NO:67 CD44的外显子7
GTACGTCTTCAAATACCATCTCAGCAGGCTGGGAGCCAAATGAAGAAAATGAAGATGAAAGAGACAGACACCTCAGTTTTTCTGGATCAGGCATTGATGATGATGAAGATTTTATCTCCAGCACCA
SEQ ID NO:68 CD44的外显子8
TTTCAACCACACCACGGGCTTTTGACCACACAAAACAGAACCAGGACTGGACCCAGTGGAACCCAAGCCATTCAAATCCGGAAGTGCTACTTCAGACAACCACAAGGATGACTGSEQ ID NO:69 CD44的外显子9
ATGTAGACAGAAATGGCACCACTGCTTATGAAGGAAACTGGAACCCAGAAGCACACCCTCCCCTCATTCACCATGAGCATCATGAGGAAGAAGAGACCCCACATTCTACAAGCACAA
SEQ ID NO:70 CD44的外显子10
TCCAGGCAACTCCTAGTAGTACAACGGAAGAAACAGCTACCCAGAAGGAACAGTGGTTTGGCAACAGATGGCATGAGGGATATCGCCAAACACCCAAAGAAGACTCCCATTCGACAACAGGGACAGCTG
SEQ ID NO:71 CD44的外显子11
CAGCCTCAGCTCATACCAGCCATCCAATGCAAGGAAGGACAACACCAAGCCCAGAGGACAGTTCCTGGACTGATTTCTTCAACCCAATCTCACACCCCATGGGACGAGGTCATCAAGCAGGAAGAAGGATGG
SEQ ID NO:72 CD44的外显子12
ATATGGACTCCAGTCATAGTATAACGCTTCAGCCTACTGCAAATCCAAACACAGGTTTGGTGGAAGATTTGGACAGGACAGGACCTCTTTCAATGACAACGC
SEQ ID NO:73 CD44的外显子13
AGCAGAGTAATTCTCAGAGCTTCTCTACATCACATGAAGGCTTGGAAGAAGATAAAGACCATCCAACAACTTCTACTCTGACATCAAGCA
SEQ ID NO:74 CD44的外显子14
ATAGGAATGATGTCACAGGTGGAAGAAGAGACCCAAATCATTCTGAAGGCTCAACTACTTTACTGGAAGGTTATACCTCTCATTACCCACACACGAAGGAAAGCAGGACCTTCATCCCAGTGACCTCAGCTAAGACTGGGTCCTTTGGAGTTACTGCAGTTACTGTTGGAGATTCCAACTCTAATGTCAATCGTTCCTTATCAG
SEQ ID NO:75 CD44的外显子15
GAGACCAAGACACATTCCACCCCAGTGGGGGGTCCCATACCACTCATGGATCTGAATCAGATG
SEQ ID NO:76 CD44的外显子16
GACACTCACATGGGAGTCAAGAAGGTGGAGCAAACACAACCTCTGGTCCTATAAGGACACCCCAAATTCCAG
SEQ ID NO:77 CD44的外显子17
AATGGCTGATCATCTTGGCATCCCTCTTGGCCTTGGCTTTGATTCTTGCAGTTTGCATTGCAGTCAACAGTCGAAGAAG
SEQ ID NO:78 CD44的外显子18
GTGTGGGCAGAAGAAAAAGCTAGTGATCAACAGTGGCAATGGAGCTGTGGAGGACAGAAAGCCAAGTGGACTCAACGGAGAGGCCAGCAAGTCTCAGGAAATGGTGCATTTGGTGAACAAGGAGTCGTCAGAAACTCCAGACCAGTTTATGACAGCTGATGAGACAAGGAACCTGCAGAATGTGGACATGAAGATTGGGGTGTAACACCTACACCATTATCTTGGAAAGAAACAACCGTTGGAAACATAACCATTACAGGGAGCTGGGACACTTAACAGATGCAATGTGCTACTGATTGTTTCATTGCGAATCTTTTTTAGCATAAAATTTTCTACTCTTTTTGTTTTTTGTGTTTTGTTCTTTAAAGTCAGGTCCAATTTGTAAAAACAGCATTGCTTTCTGAAATTAGGGCCCAATTAATAATCAGCAAGAATTTGATCGTTCCAGTTCCCACTTGGAGGCCTTTCATCCCTCGGGTGTGCTATGGATGGCTTCTAACAAAAACTACACATATGTATTCCTGATCGCCAACCTTTCCCCCACCAGCTAAGGACATTTCCCAGGGTTAATAGGGCCTGGTCCCTGGGAGGAAATTTGAATGGGTCCATTTTGCCCTTCCATAGCCTAATCCCTGGGCATTGCTTTCCACTGAGGTTGGGGGTTGGGGTGTACTAGTTACACATCTTCAACAGACCCCCTCTAGAAATTTTTCAGATGCTTCTGGGAGACACCCAAAGGGTGAAGCTATTTATCTGTAGTAAACTATTTATCTGTGTTTTTGAAATATTAAACCCTGGATCAGTCCTTTGATCAGTATAATTTTTTAAAGTTACTTTGTCAGAGGCACAAAAGGGTTTAAACTGATTCATAATAAATATCTGTACTTCTTCGATCTTCACCTTTTGTGCTGTGATTCTTCAGTTTCTAAACCAGCACTGTCTGGGTCCCTACAATGTATCAGGAAGAGCTGAGAATGGTAAGGAGACTCTTCTAAGTCTTCATCTCAGAGACCCTGAGTTCCCACTCAGACCCACTCAGCCAAATCTCATGGAAGACCAAGGAGGGCAGCACTGTTTTTGTTTTTTGTTTTTTGTTTTTTTTTTTTGACACTGTCCAAAGGTTTTCCATCCTGTCCTGGAATCAGAGTTGGAAGCTGAGGAGCTTCAGCCTCTTTTATGGTTTAATGGCCACCTGTTCTCTCCTGTGAAAGGCTTTGCAAAGTCACATTAAGTTTGCATGACCTGTTATCCCTGGGGCCCTATTTCATAGAGGCTGGCCCTATTAGTGATTTCCAAAAACAATATGGAAGTGCCTTTTGATGTCTTACAATAAGAGAAGAAGCCAATGGAAATGAAAGAGATTGGCAAAGGGGAAGGATGATGCCATGTAGATCCTGTTTGACATTTTTATGGCTGTATTTGTAAACTTAAACACACCAGTGTCTGTTCTTGATGCAGTTGCTATTTAGGATGAGTTAAGTGCCTGGGGAGTCCCTCAAAAGGTTAAAGGGATTCCCATCATTGGAATCTTATCACCAGATAGGCAAGTTTATGACCAAACAAGAGAGTACTGGCTTTATCCTCTAACCTCATATTTTCTCCCACTTGGCAAGTCCTTTGTGGCATTTATTCATCAGTCAGGGTGTCCGATTGGTCCTAGAACTTCCAAAGGCTGCTTGTCATAGAAGCCATTGCATCTATAAAGCAACGGCTCCTGTTAAATGGTATCTCCTTTCTGAGGCTCCTACTAAAAGTCATTTGTTACCTAAACTTATGTGCTTAACAGGCAATGCTTCTCAGACCACAAAGCAGAAAGAAGAAGAAAAGCTCCTGACTAAATCAGGGCTGGGCTTAGACAGAGTTGATCTGTAGAATATCTTTAAAGGAGAGATGTCAACTTTCTGCACTATTCCCAGCCTCTGCTCCTCCCTGTCTACCCTCTCCCCTCCCTCTCTCCCTCCACTTCACCCCACAATCTTGAAAAACTTCCTTTCTCTTCTGTGAACATCATTGGCCAGATCCATTTTCAGTGGTCTGGATTTCTTTTTATTTTCTTTTCAACTTGAAAGAAACTGGACATTAGGCCACTATGTGTTGTTACTGCCACTAGTGTTCAAGTGCCTCTTGTTTTCCCAGAGATTTCCTGGGTCTGCCAGAGGCCCAGACAGGCTCACTCAAGCTCTTTAACTGAAAAGCAACAAGCCACTCCAGGACAAGGTTCAAAATGGTTACAACAGCCTCTACCTGTCGCCCCAGGGAGAAAGGGGTAGTGATACAAGTCTCATAGCCAGAGATGGTTTTCCACTCCTTCTAGATATTCCCAAAAAGAGGCTGAGACAGGAGGTTATTTTCAATTTTATTTTGGAATTAAATACTTTTTTCCCTTTATTACTGTTGTAGTCCCTCACTTGGATATACCTCTGTTTTCACGATAGAAATAAGGGAGGTCTAGAGCTTCTATTCCTTGGCCATTGTCAACGGAGAGCTGGCCAAGTCTTCACAAACCCTTGCAACATTGCCTGAAGTTTATGGAATAAGATGTATTCTCACTCCCTTGATCTCAAGGGCGTAACTCTGGAAGCACAGCTTGACTACACGTCATTTTTACCAATGATTTTCAGGTGACCTGGGCTAAGTCATTTAAACTGGGTCTTTATAAAAGTAAAAGGCCAACATTTAATTATTTTGCAAAGCAACCTAAGAGCTAAAGATGTAATTTTTCTTGCAATTGTAAATCTTTTGTGTCTCCTGAAGACTTCCCTTAAAATTAGCTCTGAGTGAAAAATCAAAAGAGACAAAAGACATCTTCGAATCCATATTTCAAGCCTGGTAGAATTGGCTTTTCTAGCAGAACCTTTCCAAAAGTTTTATATTGAGATTCATAACAACACCAAGAATTGATTTTGTAGCCAACATTCATTCAATACTGTTATATCAGAGGAGTAGGAGAGAGGAAACATTTGACTTATCTGGAAAAGCAAAATGTACTTAAGAATAAGAATAACATGGTCCATTCACCTTTATGTTATAGATATGTCTTTGTGTAAATCATTTGTTTTGAGTTTTCAAAGAATAGCCCATTGTTCATTCTTGTGCTGTACAATGACCACTGTTATTGTTACTTTGACTTTTCAGAGCACACCCTTCCTCTGGTTTTTGTATATTTATTGATGGATCAATAATAATGAGGAAAGCATGATATGTATATTGCTGAGTTGAAAGCACTTATTGGAAAATATTAAAAGGCTAACATTAAAAGACTAAAGGAAACAGA
SEQ ID NO:79 CD44的全部18个外显子1-18按顺序排列的多核苷酸序列
SEQ ID NO:80 CD44的外显子1的翻译多肽序列
MDKFWWHAAWGLCLVPLSLAQI
SEQ ID NO:81 CD44的外显子2的翻译多肽序列
LNITCRFAGVFHVEKNGRYSISRTEAADLCKAFNSTLPTMAQMEKALSIGFETC
SEQ ID NO:82 CD44的外显子3的翻译多肽序列
YGFIEGHVVIPRIHPNSICAANNTGVYILTSNTSQYDTYCFNAS
SEQ ID NO:83 CD44的外显子4的翻译多肽序列
PPEEDCTSVTDLPNAFDGPITI
SEQ ID NO:84 CD44的外显子5的翻译多肽序列
IVNRDGTRYVQKGEYRTNPEDIYPSNPTDDDVSSGSSSERSSTSGGYIFYTFSTVHPIPDEDSPWITDSTDRIPAT
SEQ ID NO:85 CD44的外显子6的翻译多肽序列
LMSTSATATETATKRQETWDWFSWLFLPSESKNHLHTTTQMA
SEQ ID NO:86 CD44的外显子7的翻译多肽序列
TSSNTISAGWEPNEENEDERDRHLSFSGSGIDDDEDFISST
SEQ ID NO:87 CD44的外显子8的翻译多肽序列
STTPRAFDHTKQNQDWTQWNPSHSNPEVLLQTTTRMT
SEQ ID NO:88 CD44的外显子9的翻译多肽序列
VDRNGTTAYEGNWNPEAHPPLIHHEHHEEEETPHSTST
SEQ ID NO:89 CD44的外显子10的翻译多肽序列
QATPSSTTEETATQKEQWFGNRWHEGYRQTPKEDSHSTTGTA
SEQ ID NO:90 CD44的外显子11的翻译多肽序列
ASAHTSHPMQGRTTPSPEDSSWTDFFNPISHPMGRGHQAGRRM
SEQ ID NO:91 CD44的外显子12的翻译多肽序列
MDSSHSITLQPTANPNTGLVEDLDRTGPLSMTT
SEQ ID NO:92 CD44的外显子13的翻译多肽序列
QSNSQSFSTSHEGLEEDKDHPTTSTLTSS
SEQ ID NO:93 CD44的外显子14的翻译多肽序列
RNDVTGGRRDPNHSEGSTTLLEGYTSHYPHTKESRTFIPVTSAKTGSFGVTAVTVGDSNSNVNRSLS
SEQ ID NO:94 CD44的外显子15的翻译多肽序列
DQDTFHPSGGSHTTHGSESD
SEQ ID NO:95 CD44的外显子16的翻译多肽序列
HSHGSQEGGANTTSGPIRTPQIP
SEQ ID NO:96 CD44的外显子17的翻译多肽序列
WLIILASLLALALILAVCIAVNSRR
SEQ ID NO:97 CD44的外显子18的翻译多肽序列
CGQKKKLVINSGNGAVEDRKPSGLNGEASKSQEMVHLVNKESSETPDQFMTADETRNLQNVDMKIGV
SEQ ID NO:98 CD44多肽序列
MDKFWWHAAWGLCLVPLSLAQIDLNITCRFAGVFHVEKNGRYSISRTEAADLCKAFNSTLPTMAQMEKALSIGFETCRYGFIEGHVVIPRIHPNSICAANNTGVYILTSNTSQYDTYCFNASAPPEEDCTSVTDLPNAFDGPITITIVNRDGTRYVQKGEYRTNPEDIYPSNPTDDDVSSGSSSERSSTSGGYIFYTFSTVHPIPDEDSPWITDSTDRIPATTLMSTSATATETATKRQETWDWFSWLFLPSESKNHLHTTTQMAGTSSNTISAGWEPNEENEDERDRHLSFSGSGIDDDEDFISSTISTTPRAFDHTKQNQDWTQWNPSHSNPEVLLQTTTRMTDVDRNGTTAYEGNWNPEAHPPLIHHEHHEEEETPHSTSTIQATPSSTTEETATQKEQWFGNRWHEGYRQTPKEDSHSTTGTAAASAHTSHPMQGRTTPSPEDSSWTDFFNPISHPMGRGHQAGRRMDMDSSHSITLQPTANPNTGLVEDLDRTGPLSMTTQQSNSQSFSTSHEGLEEDKDHPTTSTLTSSNRNDVTGGRRDPNHSEGSTTLLEGYTSHYPHTKESRTFIPVTSAKTGSFGVTAVTVGDSNSNVNRSLSGDQDTFHPSGGSHTTHGSESDGHSHGSQEGGANTTSGPIRTPQIPEWLIILASLLALALILAVCIAVNSRRRCGQKKKLVINSGNGAVEDRKPSGLNGEASKSQEMVHLVNKESSETPDQFMTADETRNLQNVDMKIGV
SEQ ID NO:99 CD44的全部5个外显子1-5按顺序排列的多核苷酸序列
SEQ ID NO:100CD44的外显子1-5的翻译多肽序列
MDKFWWHAAWGLCLVPLSLAQIDLNITCRFAGVFHVEKNGRYSISRTEAADLCKAFNSTLPTMAQMEKALSIGFETCRYGFIEGHVVIPRIHPNSICAANNTGVYILTSNTSQYDTYCFNASAPPEEDCTSVTDLPNAFDGPITITIVNRDGTRYVQKGEYRTNPEDIYPSNPTDDDVSSGSSSERSSTSGGYIFYTFSTVHPIPDEDSPWITDSTDRIPAT
SLC3A2转录本6序列信息
SEQ ID NO:13SLC3A2-NRG1融合物5’处的SLC3A2外显子1序列
CCGCATCGGCGACCTTCAGGCCTTCCAGGGCCACGGCGCGGGCAACCTGGCGG
SEQ ID NO:14SLC3A2-NRG1融合物3’处的NRG1外显子5序列
CATCTACATCTACATCCACCACTGGGACAAGCCAT
SEQ ID NO:15SLC3A2-NRG1多核苷酸序列
CCGCATCGGCGACCTTCAGGCCTTCCAGGGCCACGGCGCGGGCAACCTGGCGGCATCTACATCTACATCCACCACTGGGACAAGCCAT
SEQ ID NO:16SLC3A2-NRG1多肽序列
RIGDLQAFQGHGAGNLAASTSTSTTGTSH
SEQ ID NO:103SLC3A2的外显子1
AGATGCAGTAGCCGAAACTGCGCGGAGGCACAGAGGCCGGGGAGAGCGTTCTGGGTCCGAGGGTCCAGGTAGGGGTTGAGCCACCATCTGACCGCAAGCTGCGTCGTGTCGCCGGTTCTGCAGGCACCATGAGCCAGGACACCGAGGTGGATATGAAGGAGGTGGAGCTGAATGAGTTAGAGCCCGAGAAGCAGCCGATGAACGCGGCGTCTGGGGCGGCCATGTCCCTGGCGGGAGCCGAGAAGAATGGTCTGGTGAAGATCAAGGTGGCGGAAGACGAGGCGGAGGCGGCAGCCGCGGCTAAGTTCACGGGCCTGTCCAAGGAGGAGCTGCTGAAGGTGGCAGGCAGCCCCGGCTGGGTACGCACCCGCTGGGCACTGCTGCTGCTCTTCTGGCTCGGCTGGCTCGGCATGCTTGCTGGTGCCGTGGTCATAATCGTGCGAGCGCCGCGTTGTCGCGAGCTACCGGCGCAGAAGTGGTGGCACACGGGCGCCCTCTACCGCATCGGCGACCTTCAGGCCTTCCAGGGCCACGGCGCGGGCAACCTGGCGG
SEQ ID NO:104SLC3A2的外显子2
GTCTGAAGGGGCGTCTCGATTACCTGAGCTCTCTGAAGGTGAAGGGCCTTGTGCTGGGTCCAATTCACAAGAACCAGAAGGATGATGTCGCTCAGACTGACTTGCTGCAGATCGACCCCAATTTTGGCTCCAAGGAAGATTTTGACAGTCTCTTGCAATCGGCTAAAAAAAAGA
SEQ ID NO:105SLC3A2的外显子3
GCATCCGTGTCATTCTGGACCTTACTCCCAACTACCGGGGTGAGAACTCGTGGTTCTCCACTCAGGTTGACACTGTGGCCACCAAGGTGAA
SEQ ID NO:106SLC3A2的外显子4
GATGCTCTGGAGTTTTGGCTGCAAGCTGGCGTGGATGGGTTCCAGGTTCGGGACATAGAGAATCTGAAG
SEQ ID NO:107SLC3A2的外显子5
GATGCATCCTCATTCTTGGCTGAGTGGCAAAATATCACCAAGGGCTTCAGTGAAGACAG
SEQ ID NO:108SLC3A2的外显子6
GCTCTTGATTGCGGGGACTAACTCCTCCGACCTTCAGCAGATCCTGAGCCTACTCGAATCCAACAAAGACTTGCTGTTGACTAGCTCATACCTGTCTGATTCTGGTTCTACTGGGGAGCATACAAAATCCCTAGTCACACAGTATTTGAATGCCACTGGCAATCGCTGGTGCAGCTGGAGT
SEQ ID NO:109SLC3A2的外显子7
TTGTCTCAGGCAAGGCTCCTGACTTCCTTCTTGCCGGCTCAACTTCTCCGACTCTACCAGCTGATGCTCTTCACCCTGCCAGGGACCCCTGTTTTCAGCTACGGGGATGAGATTGGCCTGGATGCAGCTGCCCTTCCTGGACAG
SEQ ID NO:110SLC3A2的外显子8
CCTATGGAGGCTCCAGTCATGCTGTGGGATGAGTCCAGCTTCCCTGACATCCCAGGGGCTGTAAGTGCCAACATGACTGTGAAG
SEQ ID NO:111SLC3A2的外显子9
GGCCAGAGTGAAGACCCTGGCTCCCTCCTTTCCTTGTTCCGGCGGCTGAGTGACCAGCGGAGTAAGGAGCGCTCCCTACTGCATGGGGACTTCCACGCGTTCTCCGCTGGGCCTGGACTCTTCTCCTATATCCGCCACTGGGACCAGAATGAGCGTTTTCTGGTAGTGCTTAACTTTGGGGATGTGGGCCTCTCGGCTGGACTGCAGGCCTCCGACCTGCCTGCCAGCGCCAGCCTGCCAGCCAAGGCTGACCTCCTGCTCAGCACCCAGCCAGGCCGTGAGGAGGGCTCCCCTCTTGAGCTGGAACGCCTGAAACTGGAGCCTCACGAAGGGCTGCTGCTCCGCTTCCCCTACGCGGCCTGACTTCAGCCTGACATGGACCCACTACCCTTCTCCTTTCCTTCCCAGGCCCTTTGGCTTCTGATTTTTCTCTTTTTTAAAAACAAACAAACAAACTGTTGCAGATTATGAGTGAACCCCCAAATAGGGTGTTTTCTGCCTTCAAATAAAAGTCACCCCTGCATGGTGAA
SEQ ID NO:112SLC3A2的全部9个外显子1-9按顺序排列的多核苷酸序列
SEQ ID NO:113SLC3A2的外显子1的翻译多肽序列
MSQDTEVDMKEVELNELEPEKQPMNAASGAAMSLAGAEKNGLVKIKVAEDEAEAAAAAKFTGLSKEELLKVAGSPGWVRTRWALLLLFWLGWLGMLAGAVVIIVRAPRCRELPAQKWWHTGALYRIGDLQAFQGHGAGNLA
SEQ ID NO:114SLC3A2的外显子2的翻译多肽序列
LKGRLDYLSSLKVKGLVLGPIHKNQKDDVAQTDLLQIDPNFGSKEDFDSLLQSAKKK
SEQ ID NO:115SLC3A2的外显子3的翻译多肽序列
IRVILDLTPNYRGENSWFSTQVDTVATKV
SEQ ID NO:116SLC3A2的外显子4的翻译多肽序列
DALEFWLQAGVDGFQVRDIENLK
SEQ ID NO:117SLC3A2的外显子5的翻译多肽序列
DASSFLAEWQNITKGFSED
SEQ ID NO:118SLC3A2的外显子6的翻译多肽序列
LLIAGTNSSDLQQILSLLESNKDLLLTSSYLSDSGSTGEHTKSLVTQYLNATGNRWCSWS
SEQ ID NO:119SLC3A2的外显子7的翻译多肽序列
LSQARLLTSFLPAQLLRLYQLMLFTLPGTPVFSYGDEIGLDAAALPGQ
SEQ ID NO:120SLC3A2的外显子8的翻译多肽序列
PMEAPVMLWDESSFPDIPGAVSANMTVK
SEQ ID NO:121SLC3A2的外显子9的翻译多肽序列
GQSEDPGSLLSLFRRLSDQRSKERSLLHGDFHAFSAGPGLFSYIRHWDQNERFLVVLNFGDVGLSAGLQASDLPASASLPAKADLLLSTQPGREEGSPLELERLKLEPHEGLLLRFPYAA
SEQ ID NO:122SLC3A2多肽序列
MSQDTEVDMKEVELNELEPEKQPMNAASGAAMSLAGAEKNGLVKIKVAEDEAEAAAAAKFTGLSKEELLKVAGSPGWVRTRWALLLLFWLGWLGMLAGAVVIIVRAPRCRELPAQKWWHTGALYRIGDLQAFQGHGAGNLAGLKGRLDYLSSLKVKGLVLGPIHKNQKDDVAQTDLLQIDPNFGSKEDFDSLLQSAKKKSIRVILDLTPNYRGENSWFSTQVDTVATKVKDALEFWLQAGVDGFQVRDIENLKDASSFLAEWQNITKGFSEDRLLIAGTNSSDLQQILSLLESNKDLLLTSSYLSDSGSTGEHTKSLVTQYLNATGNRWCSWSLSQARLLTSFLPAQLLRLYQLMLFTLPGTPVFSYGDEIGLDAAALPGQPMEAPVMLWDESSFPDIPGAVSANMTVKGQSEDPGSLLSLFRRLSDQRSKERSLLHGDFHAFSAGPGLFSYIRHWDQNERFLVVLNFGDVGLSAGLQASDLPASASLPAKADLLLSTQPGREEGSPLELERLKLEPHEGLLLRFPYAA
NRG1序列信息
SEQ ID NO:125NRG1的外显子1
AGTAAGCCTCCGCAGCCCACTCGGACTGCAGCCTGTTTGCCGCCCGTCCTCCCATTGCAGCACTCGGGGCGACAGAGAGGGAGGAGGCGCGCGGGGACGGGGACGCCCAGGAGGACCCACTCGCGGGTCCCGCTCCGCTCCGGCAGCAGCATGGGGAAAGGACGCGCGGGCCGAGTTGGCACCACAG
SEQ ID NO:126NRG1的外显子2
CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAACCAGTTCTGAATACTCCTCTCTCAGATTCAAGTGGTTCAAGAATGGGAATGAATTGAATCGAAAAAACAAACCACAAAATATCAAGATACAAAAAAAGCCAGG
SEQ ID NO:127NRG1的外显子3
GAAGTCAGAACTTCGCATTAACAAAGCATCACTGGCTGATTCTGGAGAGTATATGTGCAAAGTGATCAGCAAATTAGGAAATGACAGTGCCTCTGCCAATATCACCATCGTGGAATCAAACG
SEQ ID NO:128NRG1的外显子4
AGATCATCACTGGTATGCCAGCCTCAACTGAAGGAGCATATGTGTCTTCAG
SEQ ID NO:129NRG1的外显子5
AGTCTCCCATTAGAATATCAGTATCCACAGAAGGAGCAAATACTTCTTCAT
SEQ ID NO:130NRG1的外显子6
CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCTTCATGGTGAAAGACCTTTCAAACCCCTCGAGATACTTGTGCAA
SEQ ID NO:131NRG1的外显子7
GTGCCCAAATGAGTTTACTGGTGATCGCTGCCAAAACTACGTAATGGCCAGCTTCTACASEQ ID NO:132NRG1的外显子8
AGCATCTTGGGATTGAATTTATGG
SEQ ID NO:133NRG1的外显子9
AGGCGGAGGAGCTGTACCAGAAGAGAGTGCTGACCATAACCGGCATCTGCATCGCCCTCCTTGTGGTCGGCATCATGTGTGTGGTGGCCTACTGCAAAACCAA
SEQ ID NO:134NRG1的外显子10
GAAACAGCGGAAAAAGCTGCATGACCGTCTTCGGCAGAGCCTTCGGTCTGAACGAAACAATATGATGAACATTGCCAATGGGCCTCACCATCCTAACCCACCCCCCGAGAATGTCCAGCTGGTGAAT
SEQ ID NO:135NRG1的外显子11
CAATACGTATCTAAAAACGTCATCTCCAGTGAGCATATTGTTGAGAGAGAAGCAGAGACATCCTTTTCCACCAGTCACTATACTTCCACAGCCCATCACTCCACTACTGTCACCCAGACTCCTAGCCACAG
SEQ ID NO:136NRG1的外显子12
CTGGAGCAACGGACACACTGAAAGCATCCTTTCCGAAAGCCACTCTGTAATCGTGATGTCATCCGTAGAAAACAGTAGGCACAGCAGCCCAACTGGGGGCCCAAGAGGACGTCTTAATGGCACAGGAGGCCCTCGTGAATGTAACAGCTTCCTCAGGCATGCCAGAGAAACCCCTGATTCCTACCGAGACTCTCCTCATAGTGAAAG
SEQ ID NO:137NRG1的外显子13
GTATGTGTCAGCCATGACCACCCCGGCTCGTATGTCACCTGTAGATTTCCACACGCCAAGCTCCCCCAAATCGCCCCCTTCGGAAATGTCTCCACCCGTGTCCAGCATGACGGTGTCCATGCCTTCCATGGCGGTCAGCCCCTTCATGGAAGAAGAGAGACCTCTACTTCTCGTGACACCACCAAGGCTGCGGGAGAAGAAGTTTGACCATCACCCTCAGCAGTTCAGCTCCTTCCACCACAACCCCGCGCATGACAGTAACAGCCTCCCTGCTAGCCCCTTGAGGATAGTGGAGGATGAGGAGTATGAAACGACCCAAGAGTACGAGCCAGCCCAAGAGCCTGTTAAGAAACTCGCCAATAGCCGGCGGGCCAAAAGAACCAAGCCCAATGGCCACATTGCTAACAGATTGGAAGTGGACAGCAACACAAGCTCCCAGAGCAGTAACTCAGAGAGTGAAACAGAAGATGAAAGAGTAGGTGAAGATACGCCTTTCCTGGGCATACAGAACCCCCTGGCAGCCAGTCTTGAGGCAACACCTGCCTTCCGCCTGGCTGACAGCAGGACTAACCCAGCAGGCCGCTTCTCGACACAGGAAGAAATCCAGGCCAGGCTGTCTAGTGTAATTGCTAACCAAGA
CCCTATTGCTGTATAAAACCTAAATAAACACATAGATTCACCTGTAAAACTTTATTTTATA
TAATAAAGTATTCCACCTTAAATTAAACAATTTATTTTATTTTAGCAGTTCTGCAAATAGA
AAACAGGAAAAAAACTTTTATAAATTAAATATATGTATGTAAAAATGTGTTATGTGCCAT
ATGTAGCAATTTTTTACAGTATTTCAAAACGAGAAAGATATCAATGGTGCCTTTATGTTAT
GTTATGTCGAGAGCAAGTTTTGTACAGTTACAGTGATTGCTTTTCCACAGTATTTCTGCA
AAACCTCTCATAGATTCAGTTTTTGCTGGCTTCTTGTGCATTGCATTATGATGTTGACTG
GATGTATGATTTGCAAGACTTGCAACTGTCCCTCTGTTTGCTTGTAGTAGCACCCGATCA
GTATGTCTTGTAATGGCACATCCATCCAGATATGCCTCTCTTGTGTATGAAGTTTTCTTTG
CTTTCAGAATATGAAATGAGTTGTGTCTACTCTGCCAGCCAAAGGTTTGCCTCATTGGG
CTCTGAGATAATAGTAGATCCAACAGCATGCTACTATTAAATACAGCAAGAAACTGCATT
AAGTAATGTTAAATATTAGGAAGAAAGTAATACTGTGATTTAAAAAAAACTATATTATTA
ATCAGAAGACAGCTTGCTCTTACTAAAAGGAGCTCTCATTTACTTTATTTGATTTTATTTT
TCTTGACAAAAAGCAACAGTTTTAGGGATAGCTTAGAAAATGGGTTCTGGCTTGCTATC
AGGGTAAATCTAACACCTTACAAGAGGACTGAGTGTCACTTTCTCTCTGGGGGAATGAT
CCAGCAGCTTATCTAGTTGACAATCAAAACACGGCTGATAAAGGTGCAATCATTTCTGA
CATGTATTTTTCACTGATTTTGAAGCTAGTGATTGGTTGTGTCTTCTTGGCTCAAAAAGA
AGCATATTACGGCACAAAAAGCCCAGCCCAGACAGCACATGCAGCATTTTGTCTGAAA
TACTTCTAGAGTCAAACGTGCCTGCTGTACATAGCGATGACTTGTCATCATAGGGAAGT
ATTTCCATCGTAGAGTGTTCAGAAGGAGTGACTGTATAGGTGGAGAGAAGCTTAGTGA
CTCCGTTGAAATTTTAAAATGTGGATGACCACCCCTTTCTCCCCCTTATTTTTCTTTTATC
TTTCCATGTTGCCTTGATCAGGTCATAACTATGCATGAACATTTTTTATCAGGAATGGCC
GATGTGTATGTGATTTGTAATCACAAGTAATGATTCATCAGGAAATGTCAATCCTGTTGG
AAAGATTGCACCTTTACTTGCAGAAGTGACCCCCACCTGTGTCCTGACCTCTCCATTTA
CAGGCTCTCTCACCCATTTCCCCCACCTCCTTTAATTTTTGCTTTACTGTCATAAAGTAG
GACTAAGATTGGTCTAAGCATTGCATGTTCTTTTGTGATGGTAAATCCAAAGGAAGGCC
TATAAGTATTAACATTTGAAATAACTGCTAATTCAGGAAAATGGAAGAAAAAAAATTATT
TGAAACACAGAACCCATTTCATGGCCTGCCTGATATCTGTGAAATCAGGGCTGGAGCTT
TACTTAGGATTCACATGGCCTCCTAGGAACCATGGGACAAATGGGAAACAGGTTATCGG
GGGATTCATGAAGTCAGTGAGAGTAATTGCTTCTTTTTTGCGGGTGAACTGAATGTATTT
CTTCACCAAATCTTGATGTTAACAATTAAAAAGAAGAAATGACATGCAAGTAGGTCTTA
GCAGAAAAATGCAGGCTGGGCATGAGTCATGTTGTTACCCTCCCACATGCTCCTACAAT
CCACAGAGATGCCTGTCTGCAGGTTCTTGAAGTTATTGTTAGTATTTGGTATCTCAAATT
TTTCGTCACTGTTCACATGCCACTTTCTCTGTGCACAGTGGTATCCTCATTTGCTTTTTAA
CCTACACTGAGGAGTCTTTGTCAGGTTGCACTGATTTTCCAATTCTGCAGTAATGAGTA
AGCTCACGGCATGGGGAAGAAGACAGTCAGTCCAATGAAGTTCTCTAAATTATTTTAAC
ATTGCCTTTGAAGGCCTTGACTCATCCTTAGCTATTTCAATGAAGAAATTCCTACCATGA
ATTTAAAACCCTAAAAATTCTGTTTCAAATTCTTTGGGCATTGGGGTACTCAGATATCCC
ATTGTGGAAGAATTTTAAGAATAAATAGAAGTTTCTGTTGAGAACCATGAGCAACATGT
TTCTTACAATGAGAATTGCTATGCATTTTAAAATTGCAAATATATATGAAAATTGAAGAC
AAGAGGAAATTGTATTTCTAACTTGATTCTGATCACTCACAGAGGTGGCATATTATTATA
GTTGGGACATCCTTTGCACCCTTCATAAAAAAGGCCAGCTGACTGCTCAGCATCACCTG
CCAAGGCCACTAGATTTGTGTTTACAGGGGTATCTCTGTGATGCTTGTCACATCACTCTT
GACCACCTCTGTTAATAAATTCCGACAGTGCAGTGGCGATCGGAGTGTGAACTTATGTT
CCCAGCATATGGAAAGCTATCTTAGGTTTTAAGGTAGTAGAAATTGCCCAGGAGTTTGA
CAGCAACTTTGTTTCCCGGGTCTAAAATCGTATCCCACTGAGGTGTATGCAGTGGAGCA
TAATACATGCAAATACATGCAAAACTCCTTTTGTTTCACCTAAGATTCACTTTCTATCTTA
CTTTCCCTTCCTGCCTAGTGTGACTTTTGCCCCCAAGAGTGCCTGGACAGCATTCTAGT
TTCTACAAAATGGTCCTCTGTGTAGGTGAATGTGTCCCAAACCTGCTATCACTTTCTTGT
TTCAGTGTGACTGTCTTGTTAGAGGTGAAGTTTATCCAGGGTAACTTGCTCACTAACTAT
TCCTTTTTATGGCCTGGGGTTAAAGGGCGCATGGCTCACACTGGTGAAAATAAGGAAG
GCCTGGTCTTATCTTGTATTAATAATACTGGCTGCATTCCACCAGCCAGAGATTTCTATCT
GCGAAGACCTATGAAACACTGAAGAGAAATGTAGGCAGAAGGAAATGGCCACATATCA
CAAGTTCTATTATATATTCTTTTGTAAATACATATTGTATATTACTTGGATGTTTTCTTATAT
CATTTACTGTCTTTTTGAGTTAATGTCAGTTTTTACTCTCTCAACTTACTATGTAACATTG
TAAATAACATAATGTCCTTTATTATTTATATTTAAGCATCTAACATATAGAGTTGTTTTCAT
ATAAGTTTAAGATAAATGTCAAAAATATATGTTCTTTTGTTTTTCTTTGCTTTAAAATTATG
TATCTTTTCCTTTTCTTTTTTTTAAGAATAATTTATTGTTCAGGAGAAAGAATGTATATGTA
ACTGAAACTATCTGAAGAATGCACATTGAAGGCCGTGAGGTACTGATAAACTAAAGAA
TTTATTATTCAAAATACTAAGCAATAAGTAATTGTGATTTATTTAAAGTTTTGTCCATTTTC
CATGAAAGACATACTGCAATAAAAATGCTACTCTGTGGAGACCTGGGAGTGTTGCTCAG
CAGACTACAGCTTCAGTCTGTTAGACCAGCACCTTTCATCTCATTCCCATAGTTATGCTA
ATTTAGGATTGTGTTCCATGGACCCCATGATCACCTTGTCTATACGTTGCTTCTTGTCTGT
CCATTGCTTTTGCCACACCACCTGTTCTCAAATCATCTCCTCCCTACCAATGCTGTTTATC
ACTTTCTTCCTTGTTGAAGAGGCCACACAACCAGACAGTACTATGCTTCCTTTTTCCTC
CATACACAATAACAGAGAGAGAATATTCTAGGGCATGACTGCCTGGATCCTGGCTGTTG
CTATCTTTTGTAGTGGCAGTAAGAAACTCCTTCAGACTAATGAAAATGTCAACGTGCCA
TTCAATCACGAAAGGTAACGAAAAATGCTCTCATGGTTCAAATAGTCCAATGGCCCATA
GTGGCCTAAAAGGCAGCCAGTTGACACCTGGCCATGCTAAGCTTCCTTATACCATCCGC
TAATGACTTTCCATTGGGCCCACAATTTACGGATTCATAATTTTAAAAGAGGAGAAGGC
CAAGTTAGGTTCATTCCCCTTATTCTGTCAATAAAACAAATCAAACTCATGTCTATCTAA
CTGCTCAGGGAGGAGCCTTTGCATGAGAAAATTCTCATATTCTAAGACTGAGTCATAGA
AATGAGGGTATTACTTTTCTTACTGCAATTAACCTAAACAAAAGCCATATTTTAACAAAT
AGATATTTGCATGGTACCCTTCATATATTCCAAGCATTTCACTCATTATTCCAGGTAGGTT
AAGAGCTTCTGAAGTGTATGAAGTAAAGGTCAGCAATCCTTTGGGGTGAACAGTGGCC
TCCTTTGGAGTTTGGGGGTAACCTGAGACTTCCCACCAATGTCCACCTCCATCTGTGTA
CCTAATTCCTATTACCTAGTTATGGCTCCTCTAGGATCATTTCCAAACACTCTGGATGTCC
AGGAAATTTAAATTGTAGCTTTTGACTGAGCTAGTTTTTCCTATTTATATTAATAAATTTT
CAAAAATGCTTGAAATCTTCACATTTGCAACAACTTTAGTTTTCATGCACATACAAACA
CAGAGAGACAAAAATTCCAAACAGACACTCTCCAAAAGCCACCACACTCTTTCACTTG
CTCTATAGTCATTTAGCCAACCAGCCATGCAGAGAATATTTAAAACTTAAAGATTGAGAC
ATTATTCTCAGTTTTTGCTGAGGCTTTGTAACGAAATTGAACACTATAAGCAGCTATTGT
AGTAATTTTGGTTAAAATTGTTTGCCTGGGATATAGTATTTGAGGCAGAAGCACGTGTGT
GAAGGAGGTGAGGTGGTTTGGAAAGAGTGAAGACTCGCAGCCAGATTGAATGTCTGG
ATAATTACTATAATTCTCCCTTCTTGGTTGAAACCATGTTCTCTCTTGATTTTTAAACCCA
GGCTGCCTCTGGAAACAAGCAAACCTGAGTCTTTCTAACCTGAGTCTTCCCAATCATTA
GATTTCTTTTCTGTCCTAACGATGAATGATAAAAGGACTTGATGTTCACAATTTGGGGTT
ATAAGGCAGGTCTGAAATCTGGAGACTCAAGATGCTGGAAGGAGTGGAAAGTTTCGAT
GACTTTATATGAATCACTTTGCACTCTATGTTTGGCTTGTCCTCTTTGAAACTGATTTACT
AAAATAAATGTAAGGGAACTATTACTCCAAAAGATTAACTTGGCAGGAAATACCAATAC
TTTCAGTTTATGAAAGACAAAACTGTCTTGTTGCTACAGGAAGCTGCAATGTTCCTAAC
CTTTAAGGTTGGTGTTGAATAGGGTGGTCATGCCCTCCCCTGCAGGTATCTTTAGGCTCC
TGTTGACCTCCTGGTACTATAACTGTTCGTCTTCTCTGGGTAGCTATTGATTTTGAACTTT
AACATGCTTCAAAACTTTATTCATCAGGGAAATAGGAAAAGAGTTTTGTTACCTGGAGG
AAATCTATTGTGATCTACCTGAGCTTTTTAAAAACAGACCAGGAGAAGGAAACCAGTA
ATTTTTAAAGAAGAGACAGAGAATGGGATAATAGTTTCACCCAGGATCTCTTTCTAACC
CTTTCCCTTCAAATGAACTTATTGGAACAGAATTGGAAAGAAGAAAGGACATCTCTGCC
CACCCCACAGGATGCCAAAAAGGCTAAAGAATTACCTCTGTAGATTTAAACATCTTTAA
TGGCTTATGTATAGATTTGCTAATACAGAGAGAAATGAACTATTAAATAAAAATCACATT
TTATAATATTTTTATGGCTTAAAACATCCTTTATCTCCTTTTTGTTCTCTCTACATGATATG
GTAAGTGATGAGGAAAATTTAGGCTCAGGAAGGTTAAAATCTTTCTTGGAGTTACACAT
CTAAGAGAGCTGCAGAGCTGACACTTGTACCCAGGTTTTCTGACTGCAAATCCAGTTTC
TTTCTATTGCGTTCTTCCCCTTTCCCTGCCTCAAGCAGAAACAGGTTTTTTATTTTCAAC
CTTTATGTATACAGTATGTTATGTTACATCTACAGCTAAGTTTCTTTTTAGAAGAATGTGA
GCCCTTCTAGCTTTGGTTTAGAGTGATTCTAGAAGCCAATTTCCTTGGCTTAGTGATTCT
ATGCACCTTTCCTAAACTTAGCTTTCTAAGGAAATGAAGTGTACGAGTGAGAATGAATT
CACAATTTCGACATGTAGGTAGCATCCTAAAGTGAAAAGAGGAGGAAATTTGTGGTCA
AAGCACTCTCCCCACCACTTAGAAACTTACTGACTGTGGGCAGCTTCCTCCTCCAAGTT
TCCTTCCTGATTTACAAGACCGTGGTGTGGTCAGGATTAAACTTGAATACATGTAAGGA
AGCCTGAAAGTGTCTAACACATAGCGAGTATTCAAATGCCACCTTCTATTTGATCCTTCC
CCTCCAGTTCCTTAAGTTTTGGAATCTAGGTTTCTCAGTTCCAAATGGATTGACATTTGC
ATATCCCCATTGCACAATGGATCAAATAAACTTTATGTTATCATTTCTCCAACATAGTGCC
AGTAAGCAAATCCTTTTTAATAACAACAGTATGTTGAGAAACATATCACCAAATAATATT
TAACTTTGTAGCTTTGATAAGTTCTTTAGGTTTTGGTTTTGGTTTTGTTTTCTGAGACAG
GGTCTTGATCTGTCACCCAGACTGGAGTGCAATGGTTCAATTTTAGCTCACTGCAACCT
GTAACTCCTGAGCTCAAGTGATCCTCCCACCTCAGCCTCTCAAGTAGCTGGGACTACAG
GTGTGCTCCACCATGCCCAGCGATTTTTTTTTTTTTTTTTTTTTTTTTTTTTGGTAGGGAC
AAGGTCTCGCTATGTTGCCCAGGCTGGTCTTCAATTCCTGGCCTTAAGTGATCCTCCTGC
CTCGGCCTCCCAAAGTGCTGGAATTACAGGCATGAGCCACCACCCATAACTTTATGTTT
GTTTTTTTGATGCAGTATAAGTTCAGCTTGCTTCTTATGCAGCCATACCATTTCATGTTAA
CTCTGATTTTTAGCAGCTTATTACATTAGTGTTTTATTATTAATATAATTTTACAGAAATTT
ACTAAACCATGACTCTGTAGAGTTTTAATAATACTACCTCCAAACATCATTGCAAACATC
TAGAAGAATGAACAAAAATGATCTTAGATCGACAGTATATCTGTTTGTCTTAGTTTCTAC
ACAGGATGTTCAGACATATTCCATTTCTTTAAAAAAAAAATATATATATATATATATATATAT
AGGCCTGGCACGGTGGCTCATGACTGTAATCCCAGCACTTTGGGAGGCTTAGGCAGGC
AAATCACCTGAGGTCAGGAGTTTGAGACTGGCCTGACCAACATGGTGAAACCTCGTCT
CTATTAAAATTACAAAAATTAGCCGGGCGTGGTGGCACATGCCTGTAATCCCAGCTACT
CGGGAGGCTGAGGCAGGAGAATCACTTGAACCTGGGAGGCAGAGGTTGCAGTGAGTT
GAGATCACGCCATTGCACTCCAGCCTTGGTGACAAGAGTGAAACTCCGTCTCAAAAAA
AAAAAAAATATGTATATATATATATATATATATATATATATATATATATATATATATATAAAATCC
CACCAAAAGTCTGCAGAGTGACCAAATTAGACGGCTCTGGTTTCAGATTAAATTCTAAA
TGTGAGAAACCACATAGCTCCCATGATCCATCCAATAATTCCTCACGTCCTCTTCACTCT
TTACTCCATGCATAAAACAGAATTTTTTTTTCTCATCCTGGGTATGAAGCAATTAATAATT
TACGGATTTAGCCTATTTGGATTCAATCCCTTCAAACTCCATACTACATCCAAGGTGGAA
GTGACTTAAACTCTGATATCAATCATCAGGCTTGTAATATAGGCTTTGTTAATGGCAGGA
GAGTCTAATAAAACTTTCTGTTCCTTATCCTTCATTTAAATGAAAAACTTTTTATTGAAA
ACAATCATAACTCTAGCTCATCATAAATATAATTCATGAGGACATTTTATTATTTTTATATT
AAAGAAATAATATTATAGATGTAAACTTTGCACCTTTCTAATTATTATCATGAGTTAAGCT
AATACTTGTCTTCTGGTCCCTAGATGATGATTCTTTTTTGCCTTACTGGAGGAGCCCTTG
TCTTGAAGTGAGTTGCTTCAACAGCAGAGGACTTCTAGTTTCTCCCAGTTGAGCCTAAA
GTGAACTTTTCATCTTCTTCAGAGGAAGGGGCTTCCTTGATTTGTACTTTTGTGGCTCCT
CAGATAACACAGACAATTTTATCTTGGATCCCAGGTTCTCTTCACCATTAAGAATAAGAA
AGAGAGAAAATGCTGTGCATGACAGCCACCTACTCCAAACTACCCAACCCCCTGTAAC
CAGGTACCTTCCAACAACGAGATGATTCTGCCCTCACTCAAGAGTCTCCCCCACAAAG
ATTCCATTCTCCCTTTACTTTTTATTTTTTATTTTTTTGCAAAACAAAGGCCTCCTTTAGTA
CCTCCTTAGTTTATAACCCTTATCTTCCCAGCTCTTCCCTTCACTGATACCTCTGATTTCA
AAAGTTCTGAAGTCGGAAGACCACACAATTTCAGACTGTGAACAGAAATTCAGTCAGA
AATTATTGGAGTTAGAAAGAATTTAGAGAAATTGTATTGAACTAGAAAGTCCTCTTTGAT
TAGTGGTGGCCCTTTAGAAAGTTCTAGGGCAGAGTCCCATGGTGTTTCATCTTTTCCATG
ATTTGCTTGACCAAAAACTTTTCTTTCACAACATGAAAATATGCTAATCCACCACACATT
TTGGATTCTGCTCTGTTTGCCTGAGGTGTTAGATCTCTAGCCAGGACTGTGAAGGGAAG
GAACTTGAATCCTTCCTATTGAGCTATTAATGCAGAGTCAGTGAGATGAAGGGTTCCAC
TCGGGGTCAAAATCATGTCAGTTACCAAGCAAAGGAGCAAGTAAGGGGAAACATCTCC
TCATCTGGTTAGTGGAGCCACATTTCACCCACTGATCAAGCCAGACCTGAGCAATAGTC
TAGATTTCTCCCTCCACATCTAATTGGTGACAATGGTGATTGTACCACTGACAGGTCACA
CAAGTCCACACCCTCCTTCACAGCCTCACTGCTTCGGCTCTTGTTTATGCTCTTATCAGC
ATCTGTCACTAGGATCCATTTGTCTCCTGACTCATCTACTTCCTTTCACTCCCCTGGGCCATCCTTCACATCATGCTAGAAGACTGTGTCTAACTTGCAGAACTTATTGTGTCAATCTCCTGGTTACGGCCCCTCCATGGCTCCCCACCTGACATAGGAGGCCCTTCACAATCTGGCTTCTGTCACTCATAACTTGTCTCCAGCCTTCATTCTTCAGTCTGATTTTATGGTTTTCTAGTTCCCCAATACACCACACCAGTGTTTATGAAACCCTAGTCATTGGCCTACGAACTTTATGATTATTGACATATTCATGTACCACCTGTATTATTTTTTGCATAGTGTTTATTTTTAATTGACTACATTTTTAACTACAATAAAGTAATTTCAACTAAAA
SEQ ID NO:138NRG1的全部13个外显子1-13按顺序排列的多核苷酸序列
SEQ ID NO:139NRG1的外显子1的翻译多肽序列
MGKGRAGRVGTT
SEQ ID NO:140NRG1的外显子2的翻译多肽序列
LPPRLKEMKSQESAAGSKLVLRCETSSEYSSLRFKWFKNGNELNRKNKPQNIKIQKKP
SEQ ID NO:141NRG1的外显子3的翻译多肽序列
KSELRINKASLADSGEYMCKVISKLGNDSASANITIVESN
SEQ ID NO:142NRG1的外显子4的翻译多肽序列
IITGMPASTEGAYVSS
SEQ ID NO:143NRG1的外显子5的翻译多肽序列
SPIRISVSTEGANTSS
SEQ ID NO:144NRG1的外显子6的翻译多肽序列
TSTSTTGTSHLVKCAEKEKTFCVNGGECFMVKDLSNPSRYLC
SEQ ID NO:145NRG1的外显子7的翻译多肽序列
CPNEFTGDRCQNYVMASFY
SEQ ID NO:146NRG1的外显子8的翻译多肽序列
HLGIEFM
SEQ ID NO:147NRG1的外显子9的翻译多肽序列
AEELYQKRVLTITGICIALLVVGIMCVVAYCKT
SEQ ID NO:148NRG1的外显子10的翻译多肽序列
KQRKKLHDRLRQSLRSERNNMMNIANGPHHPNPPPENVQLVN
SEQ ID NO:149NRG1的外显子11的翻译多肽序列
QYVSKNVISSEHIVEREAETSFSTSHYTSTAHHSTTVTQTPSH
SEQ ID NO:150NRG1的外显子12的翻译多肽序列
WSNGHTESILSESHSVIVMSSVENSRHSSPTGGPRGRLNGTGGPRECNSFLRHARETPDSYRDSPHSE
SEQ ID NO:151NRG1的外显子13的翻译多肽序列
YVSAMTTPARMSPVDFHTPSSPKSPPSEMSPPVSSMTVSMPSMAVSPFMEEERPLLLVTPPRLREKKFDHHPQQFSSFHHNPAHDSNSLPASPLRIVEDEEYETTQEYEPAQEPVKKLANSRRAKRTKPNGHIANRLEVDSNTSSQSSNSESETEDERVGEDTPFLGIQNPLAASLEATPAFRLADSRTNPAGRFSTQEEIQARLSSVIANQDPIAV
SEQ ID NO:152NRG1多肽序列
MGKGRAGRVGTTALPPRLKEMKSQESAAGSKLVLRCETSSEYSSLRFKWFKNGNELNRKNKPQNIKIQKKPGKSELRINKASLADSGEYMCKVISKLGNDSASANITIVESNEIITGMPASTEGAYVSSESPIRISVSTEGANTSSSTSTSTTGTSHLVKCAEKEKTFCVNGGECFMVKDLSNPSRYLCKCPNEFTGDRCQNYVMASFYKHLGIEFMEAEELYQKRVLTITGICIALLVVGIMCVVAYCKTKKQRKKLHDRLRQSLRSERNNMMNIANGPHHPNPPPENVQLVNQYVSKNVISSEHIVEREAETSFSTSHYTSTAHHSTTVTQTPSHSWSNGHTESILSESHSVIVMSSVENSRHSSPTGGPRGRLNGTGGPRECNSFLRHARETPDSYRDSPHSERYVSAMTTPARMSPVDFHTPSSPKSPPSEMSPPVSSMTVSMPSMAVSPFMEEERPLLLVTPPRLREKKFDHHPQQFSSFHHNPAHDSNSLPASPLRIVEDEEYETTQEYEPAQEPVKKLANSRRAKRTKPNGHIANRLEVDSNTSSQSSNSESETEDERVGEDTPFLGIQNPLAASLEATPAFRLADSRTNPAGRFSTQEEIQARLSSVIANQDPIAV
SEQ ID NO:153NRG1的全部12个外显子2-13按顺序排列的多核苷酸序列
SEQ ID NO:154NRG1的外显子2-13的翻译多肽序列
LPPRLKEMKSQESAAGSKLVLRCETSSEYSSLRFKWFKNGNELNRKNKPQNIKIQKKPGKSELRINKASLADSGEYMCKVISKLGNDSASANITIVESNEIITGMPASTEGAYVSSESPIRISVSTEGANTSSSTSTSTTGTSHLVKCAEKEKTFCVNGGECFMVKDLSNPSRYLCKCPNEFTGDRCQNYVMASFYKHLGIEFMEAEELYQKRVLTITGICIALLVVGIMCVVAYCKTKKQRKKLHDRLRQSLRSERNNMMNIANGPHHPNPPPENVQLVNQYVSKNVISSEHIVEREAETSFSTSHYTSTAHHSTTVTQTPSHSWSNGHTESILSESHSVIVMSSVENSRHSSPTGGPRGRLNGTGGPRECNSFLRHARETPDSYRDSPHSERYVSAMTTPARMSPVDFHTPSSPKSPPSEMSPPVSSMTVSMPSMAVSPFMEEERPLLLVTPPRLREKKFDHHPQQFSSFHHNPAHDSNSLPASPLRIVEDEEYETTQEYEPAQEPVKKLANSRRAKRTKPNGHIANRLEVDSNTSSQSSNSESETEDERVGEDTPFLGIQNPLAASLEATPAFRLADSRTNPAGRFSTQEEIQARLSSVIANQDPIAV
SEQ ID NO:155NRG1的全部8个外显子6-13按顺序排列的多核苷酸序列
SEQ ID NO:156NRG1的外显子6-13的翻译多肽序列
TSTSTTGTSHLVKCAEKEKTFCVNGGECFMVKDLSNPSRYLCKCPNEFTGDRCQNYVMASFYKHLGIEFMEAEELYQKRVLTITGICIALLVVGIMCVVAYCKTKKQRKKLHDRLRQSLRSERNNMMNIANGPHHPNPPPENVQLVNQYVSKNVISSEHIVEREAETSFSTSHYTSTAHHSTTVTQTPSHSWSNGHTESILSESHSVIVMSSVENSRHSSPTGGPRGRLNGTGGPRECNSFLRHARETPDSYRDSPHSERYVSAMTTPARMSPVDFHTPSSPKSPPSEMSPPVSSMTVSMPSMAVSPFMEEERPLLLVTPPRLREKKFDHHPQQFSSFHHNPAHDSNSLPASPLRIVEDEEYETTQEYEPAQEPVKKLANSRRAKRTKPNGHIANRLEVDSNTSSQSSNSESETEDERVGEDTPFLGIQNPLAASLEATPAFRLADSRTNPAGRFSTQEEIQARLSSVIANQDPIAV
SEQ ID NO:157NRG1的全部8个外显子6-13按顺序排列的多核苷酸序列(不包括外显子5的核苷酸CAT)
SEQ ID NO:158NRG1的外显子5+CAT及外显子6-13的翻译多肽序列
STSTSTTGTSHLVKCAEKEKTFCVNGGECFMVKDLSNPSRYLCKCPNEFTGDRCQNYVMASFYKHLGIEFMEAEELYQKRVLTITGICIALLVVGIMCVVAYCKTKKQRKKLHDRLRQSLRSERNNMMNIANGPHHPNPPPENVQLVNQYVSKNVISSEHIVEREAETSFSTSHYTSTAHHSTTVTQTPSHSWSNGHTESILSESHSVIVMSSVENSRHSSPTGGPRGRLNGTGGPRECNSFLRHARETPDSYRDSPHSERYVSAMTTPARMSPVDFHTPSSPKSPPSEMSPPVSSMTVSMPSMAVSPFMEEERPLLLVTPPRLREKKFDHHPQQFSSFHHNPAHDSNSLPASPLRIVEDEEYETTQEYEPAQEPVKKLANSRRAKRTKPNGHIANRLEVDSNTSSQSSNSESETEDERVGEDTPFLGIQNPLAASLEATPAFRLADSRTNPAGRFSTQEEIQARLSSVIANQDPIAV
SEQ ID NO:161NRG1的全部5个外显子1-5按顺序排列的多核苷酸序列(不包括外显子5的核苷酸CAT)
AGTAAGCCTCCGCAGCCCACTCGGACTGCAGCCTGTTTGCCGCCCGTCCTCCCATTGCAGCACTCGGGGCGACAGAGAGGGAGGAGGCGCGCGGGGACGGGGACGCCCAGGAGGACCCACTCGCGGGTCCCGCTCCGCTCCGGCAGCAGCATGGGGAAAGGACGCGCGGGCCGAGTTGGCACCACAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAACCAGTTCTGAATACTCCTCTCTCAGATTCAAGTGGTTCAAGAATGGGAATGAATTGAATCGAAAAAACAAACCACAAAATATCAAGATACAAAAAAAGCCAGGGAAGTCAGAACTTCGCATTAACAAAGCATCACTGGCTGATTCTGGAGAGTATATGTGCAAAGTGATCAGCAAATTAGGAAATGACAGTGCCTCTGCCAATATCACCATCGTGGAATCAAACGAGATCATCACTGGTATGCCAGCCTCAACTGAAGGAGCATATGTGTCTTCAGAGTCTCCCATTAGAATATCAGTATCCACAGAAGGAGCAAATACTTCTT
SEQ ID NO:162NRG1外显子1-5的翻译多肽序列,不包括经翻译外显子5的最C端氨基酸(S)
MGKGRAGRVGTTALPPRLKEMKSQESAAGSKLVLRCETSSEYSSLRFKWFKNGNELNRKNKPQNIKIQKKPGKSELRINKASLADSGEYMCKVISKLGNDSASANITIVESNEIITGMPASTEGAYVSSESPIRISVSTEGANTS
SEQ ID NO:163根据SEQ ID NO:152的NRG1序列的EGF样结构域HLVKCAEKEKTFCVNGGECFMVKDLSNPSRYLCKCPNEFTGDRCQNYVMASF
VTCN1序列信息
SEQ ID NO:164VTCN1-NRG1融合物5’处的VTCN1外显子2序列
CATAATTAGCATCATCATTATTCTGGCTGGAGCAATTGCACTCATCATTGGCTTTGGTATTTCAG
SEQ ID NO:165VTCN1-NRG1融合物3’处的NRG1外显子2序列
CCTTGCCTCCCCGATTGAAAGAGATGAA
SEQ ID NO:166VTCN1-NRG1多核苷酸序列
CATAATTAGCATCATCATTATTCTGGCTGGAGCAATTGCACTCATCATTGGCTTTGGTATTTCAGCCTTGCCTCCCCGATTGAAAGAGATGAA
SEQ ID NO:167VTCN1-NRG1多肽序列
IISIIIILAGAIALIIGFGISALPPRLKEM
SEQ ID NO:168VTCN1的外显子1
GTGAGTCACCAAGGAAGGCAGCGGCAGCTCCACTCAGCCAGTACCCAGATACGCTGGGAACCTTCCCCAGCCATGGCTTCCCTGGGGCAGATCCTCTTCTGGAG
SEQ ID NO:169VTCN1的外显子2
CATAATTAGCATCATCATTATTCTGGCTGGAGCAATTGCACTCATCATTGGCTTTGGTATTTCAG
SEQ ID NO:170VTCN1的外显子3
GGAGACACTCCATCACAGTCACTACTGTCGCCTCAGCTGGGAACATTGGGGAGGATGGAATCCTGAGCTGCACTTTTGAACCTGACATCAAACTTTCTGATATCGTGATACAATGGCTGAAGGAAGGTGTTTTAGGCTTGGTCCATGAGTTCAAAGAAGGCAAAGATGAGCTGTCGGAGCAGGATGAAATGTTCAGAGGCCGGACAGCAGTGTTTGCTGATCAAGTGATAGTTGGCAATGCCTCTTTGCGGCTGAAAAACGTGCAACTCACAGATGCTGGCACCTACAAATGTTATATCATCACTTCTAAAGGCAAGGGGAATGCTAACCTTGAGTATAAAACTGGAG
SEQ ID NO:171VTCN1的外显子4
CCTTCAGCATGCCGGAAGTGAATGTGGACTATAATGCCAGCTCAGAGACCTTGCGGTGTGAGGCTCCCCGATGGTTCCCCCAGCCCACAGTGGTCTGGGCATCCCAAGTTGACCAGGGAGCCAACTTCTCGGAAGTCTCCAATACCAGCTTTGAGCTGAACTCTGAGAATGTGACCATGAAGGTTGTGTCTGTGCTCTACAATGTTACGATCAACAACACATACTCCTGTATGATTGAAAATGACATTGCCAAAGCAACAGGGGATATCAAAGTGACAG
SEQ ID NO:172VTCN1的外显子5
AATCGGAGATCAAAAGGCGGAGTCACCTACAGCTGCTAAACTCAAAGGCTTCTCTGTGTGTCTCTTCTTTCTTTGCCATCAGCTGGGCACTTCTGCCTCTCAGCCCTTACCTGATGCTAAAATAATGTGCCTCGGCCACAAAAAAGCATGCAAAGTCATTGTTACAACAG
SEQ ID NO:173VTCN1的外显子6
GGATCTACAGAACTATTTCACCACCAGATATGACCTAGTTTTATATTTCTGGGAGGAAATGAATTCATATCTAGAAGTCTGGAGTGAGCAAACAAGAGCAAGAAACAAAAAGAAGCCAAAAGCAGAAGGCTCCAATATGAACAAGATAAATCTATCTTCAAAGACATATTAGAAGTTGGGAAAATAATTCATGTGAACTAGACAAGTGTGTTAAGAGTGATAAGTAAAATGCACGTGGAGACAAGTGCATCCCCAGATCTCAGGGACCTCCCCCTGCCTGTCACCTGGGGAGTGAGAGGACAGGATAGTGCATGTTCTTTGTCTCTGAATTTTTAGTTATATGTGCTGTAATGTTGCTCTGAGGAAGCCCCTGGAAAGTCTATCCCAACATATCCACATCTTATATTCCACAAATTAAGCTGTAGTATGTACCCTAAGACGCTGCTAATTGACTGCCACTTCGCAACTCAGGGGCGGCTGCATTTTAGTAATGGGTCAAATGATTCACTTTTTATGATGCTTCCAAAGGTGCCTTGGCTTCTCTTCCCAACTGACAAATGCCAAAGTTGAGAAAAATGATCATAATTTTAGCATAAACAGAGCAGTCGGCGACACCGATTTTATAAATAAACTGAGCACCTTCTTTTTAAACAAACAAATGCGGGTTTATTTCTCAGATGATGTTCATCCGTGAATGGTCCAGGGAAGGACCTTTCACCTTGTCTATATGGCATTATGTCATCACAAGCTCTGAGGCTTCTCCTTTCCATCCTGCGTGGACAGCTAAGACCTCAGTTTTCAATAGCATCTAGAGCAGTGGGACTCAGCTGGGGTGATTTCGCCCCCCATCTCCGGGGGAATGTCTGAAGACAATTTTGGTTACCTCAATGAGGGAGTGGAGGAGGATACAGTGCTACTACCAACTAGTGGATAGAGGCCAGGGATGCTGCTCAACCTCCTACCATGTACAGGACGTCTCCCCATTACAACTACCCAATCCGAAGTGTCAACTGTGTCAGGGCTAAGAAACCCTGGTTTTGAGTAGAAAAGGGCCTGGAAAGAGGGGAGCCAACAAATCTGTCTGCTTCCTCACATTAGTCATTGGCAAATAAGCATTCTGTCTCTTTGGCTGCTGCCTCAGCACAGAGAGCCAGAACTCTATCGGGCACCAGGATAACATCTCTCAGTGAACAGAGTTGACAAGGCCTATGGGAAATGCCTGATGGGATTATCTTCAGCTTGTTGAGCTTCTAAGTTTCTTTCCCTTCATTCTACCCTGCAAGCCAAGTTCTGTAAGAGAAATGCCTGAGTTCTAGCTCAGGTTTTCTTACTCTGAATTTAGATCTCCAGACCCTGCCTGGCCACAATTCAAATTAAGGCAACAAACATATACCTTCCATGAAGCACACACAGACTTTTGAAAGCAAGGACAATGACTGCTTGAATTGAGGCCTTGAGGAATGAAGCTTTGAAGGAAAAGAATACTTTGTTTCCAGCCCCCTTCCCACACTCTTCATGTGTTAACCACTGCCTTCCTGGACCTTGGAGCCACGGTGACTGTATTACATGTTGTTATAGAAAACTGATTTTAGAGTTCTGATCGTTCAAGAGAATGATTAAATATACATTTCCTACACCA
SEQ ID NO:174VTCN1的全部6个外显子1-6按顺序排列的多核苷酸序列
SEQ ID NO:175VTCN1的外显子1的翻译多肽序列
MASLGQILFW
SEQ ID NO:176VTCN1的外显子2的翻译多肽序列
IISIIIILAGAIALIIGFGIS
SEQ ID NO:177VTCN1的外显子3的翻译多肽序列
RHSITVTTVASAGNIGEDGILSCTFEPDIKLSDIVIQWLKEGVLGLVHEFKEGKDELSEQDEMFRGRTAVFADQVIVGNASLRLKNVQLTDAGTYKCYIITSKGKGNANLEYKTG
SEQ ID NO:178VTCN1的外显子4的翻译多肽序列
FSMPEVNVDYNASSETLRCEAPRWFPQPTVVWASQVDQGANFSEVSNTSFELNSENVTMKVVSVLYNVTINNTYSCMIENDIAKATGDIKVT
SEQ ID NO:179VTCN1的外显子5的翻译多肽序列
SEIKRRSHLQLLNSKASLCVSSFFAISWALLPLSPYLMLK
SEQ ID NO:180VTCN1多肽序列
MASLGQILFWSIISIIIILAGAIALIIGFGISGRHSITVTTVASAGNIGEDGILSCTFEPDIKLSDIVIQWLKEGVLGLVHEFKEGKDELSEQDEMFRGRTAVFADQVIVGNASLRLKNVQLTDAGTYKCYIITSKGKGNANLEYKTGAFSMPEVNVDYNASSETLRCEAPRWFPQPTVVWASQVDQGANFSEVSNTSFELNSENVTMKVVSVLYNVTINNTYSCMIENDIAKATGDIKVTESEIKRRSHLQLLNSKASLCVSSFFAISWALLPLSPYLMLK
SEQ ID NO:181VTCN1的外显子1和2
GTGAGTCACCAAGGAAGGCAGCGGCAGCTCCACTCAGCCAGTACCCAGATACGCTGGGAACCTTCCCCAGCCATGGCTTCCCTGGGGCAGATCCTCTTCTGGAGCATAATTAGCATCATCATTATTCTGGCTGGAGCAATTGCACTCATCATTGGCTTTGGTATTTCAG
SEQ ID NO:182VTCN1的外显子1和2的翻译多肽序列
MASLGQILFWSIISIIIILAGAIALIIGFGIS
CDH1序列信息
SEQ ID NO:184 CDH1-NRG1融合物5’处的CDH1外显子11序列
CTGGCTGGAGATTAATCCGGACACTGGTGCCATTTCCACTCGGGCTGAGCTGGACAGGGAGGATTTTGAGCACGTGAAGAACAGCACGTACACAGCCCTAATCATAGCTACAGACAATG
SEQ ID NO:185 CDH1-NRG1融合物3’处的NRG1外显子2序列
CCTTGCCTCCCCGATTGAAAGAGATGAAAA
SEQ ID NO:186 CDH1-NRG1多核苷酸序列
CTGGCTGGAGATTAATCCGGACACTGGTGCCATTTCCACTCGGGCTGAGCTGGACAGGGAGGATTTTGAGCACGTGAAGAACAGCACGTACACAGCCCTAATCATAGCTACAGACAATGCCTTGCCTCCCCGATTGAAAGAGATGAAA
SEQ ID NO:187 CDH1-NRG1多肽序列
WLEINPDTGAISTRAELDREDFEHVKNSTYTALIIATDNALPPRLKEMK
SEQ ID NO:188 CDH1的外显子1
AGTGGCGTCGGAACTGCAAAGCACCTGTGAGCTTGCGGAAGTCAGTTCAGACTCCAGCCCGCTCCAGCCCGGCCCGACCCGACCGCACCCGGCGCCTGCCCTCGCTCGGCGTCCCCGGCCAGCCATGGGCCCTTGGAGCCGCAGCCTCTCGGCGCTGCTGCTGCTGCTGCAG
SEQ ID NO:189 CDH1的外显子2
GTCTCCTCTTGGCTCTGCCAGGAGCCGGAGCCCTGCCACCCTGGCTTTGACGCCGAGAGCTACACGTTCACGGTGCCCCGGCGCCACCTGGAGAGAGGCCGCGTCCTGGGCAGAGSEQ ID NO:190 CDH1的外显子3
TGAATTTTGAAGATTGCACCGGTCGACAAAGGACAGCCTATTTTTCCCTCGACACCCGATTCAAAGTGGGCACAGATGGTGTGATTACAGTCAAAAGGCCTCTACGGTTTCATAACCCACAGATCCATTTCTTGGTCTACGCCTGGGACTCCACCTACAGAAAGTTTTCCACCAAAGTCACGCTGAATACAGTGGGGCACCACCACCGCCCCCCGCCCCATCAG
SEQ ID NO:191 CDH1的外显子4
GCCTCCGTTTCTGGAATCCAAGCAGAATTGCTCACATTTCCCAACTCCTCTCCTGGCCTCAGAAGACAGAAGAGAGACTGGGTTATTCCTCCCATCAGCTGCCCAGAAAATGAAAAAGGCCCATTTCCTAAAAACCTGGTTCAG
SEQ ID NO:192 CDH1的外显子5
ATCAAATCCAACAAAGACAAAGAAGGCAAGGTTTTCTACAGCATCACTGGCCAAGGAGCTGACACACCCCCTGTTGGTGTCTTTATTATTGAAAGAGAAACAGGATGGCTGAAGGTGACAGAGCCTCTGGATAGAGAACGCATTGCCACATACACT
SEQ ID NO:193 CDH1的外显子6
CTCTTCTCTCACGCTGTGTCATCCAACGGGAATGCAGTTGAGGATCCAATGGAGATTTTGATCACGGTAACCGATCAGAATGACAACAAGCCCGAATTCACCCAGGAGGTCTTTAAGGGGTCTGTCATGGAAGGTGCTCTTCCAG
SEQ ID NO:194 CDH1的外显子7
GAACCTCTGTGATGGAGGTCACAGCCACAGACGCGGACGATGATGTGAACACCTACAATGCCGCCATCGCTTACACCATCCTCAGCCAAGATCCTGAGCTCCCTGACAAAAATATGTTCACCATTAACAGGAACACAGGAGTCATCAGTGTGGTCACCACTGGGCTGGACCGAGAG
SEQ ID NO:195 CDH1的外显子8
AGTTTCCCTACGTATACCCTGGTGGTTCAAGCTGCTGACCTTCAAGGTGAGGGGTTAAGCACAACAGCAACAGCTGTGATCACAGTCACTGACACCAACGATAATCCTCCGATCTTCAATCCCACCACG
SEQ ID NO:196 CDH1的外显子9
TACAAGGGTCAGGTGCCTGAGAACGAGGCTAACGTCGTAATCACCACACTGAAAGTGACTGATGCTGATGCCCCCAATACCCCAGCGTGGGAGGCTGTATACACCATATTGAATGATGATGGTGGACAATTTGTCGTCACCACAAATCCAGTGAACAACGATGGCATTTTGAAAACAGCAAAGGTTTGTATGGTACCTGGCAAGATGCAGAAACTGGCATCCTCACAGCTGTTCATACCCTTGTCCCCTG
SEQ ID NO:197 CDH1的外显子10
GGCTTGGATTTTGAGGCCAAGCAGCAGTACATTCTACACGTAGCAGTGACGAATGTGGTACCTTTTGAGGTCTCTCTCACCACCTCCACAGCCACCGTCACCGTGGATGTGCTGGATGTGAATGAAGCCCCCATCTTTGTGCCTCCTGAAAAGAGAGTGGAAGTGTCCGAGGACTTTGGCGTGGGCCAGGAAATCACATCCTACACTGCCCAGGAGCCAGACACATTTATGGAACAGAAAATAAC
SEQ ID NO:198 CDH1的外显子11
ATATCGGATTTGGAGAGACACTGCCAACTGGCTGGAGATTAATCCGGACACTGGTGCCATTTCCACTCGGGCTGAGCTGGACAGGGAGGATTTTGAGCACGTGAAGAACAGCACGTACACAGCCCTAATCATAGCTACAGACAATG
SEQ ID NO:199 CDH1的外显子12
GTTCTCCAGTTGCTACTGGAACAGGGACACTTCTGCTGATCCTGTCTGATGTGAATGACAACGCCCCCATACCAGAACCTCGAACTATATTCTTCTGTGAGAGGAATCCAAAGCCTCAGGTCATAAACATCATTGATGCAGACCTTCCTCCCAATACATCTCCCTTCACAGCAGAACTAACACACGGGGCGAGTGCCAACTGGACCATTCAGTACAACGACCCAA
SEQ ID NO:200 CDH1的外显子13
CCCAAGAATCTATCATTTTGAAGCCAAAGATGGCCTTAGAGGTGGGTGACTACAAAATCAATCTCAAGCTCATGGATAACCAGAATAAAGACCAAGTGACCACCTTAGAGGTCAGCGTGTGTGACTGTGAAGGGGCCGCTGGCGTCTGTAGGAAGGCACAGCCTGTCGAAGCAGGATTGCAAATTCCTGCCATTCTGGGGATTCTTGGAGGAATTCTTGCTTTGCTAA
SEQ ID NO:201 CDH1的外显子14
TTCTGATTCTGCTGCTCTTGCTGTTTCTTCGGAGGAGAGCGGTGGTCAAAGAGCCCTTACTGCCCCCAGAGGATGACACCCGGGACAACGTTTATTACTATGATGAAGAAGGAGGCGGAGAAGAGGACCAG
SEQ ID NO:202 CDH1的外显子15
GACTTTGACTTGAGCCAGCTGCACAGGGGCCTGGACGCTCGGCCTGAAGTGACTCGTAACGACGTTGCACCAACCCTCATGAGTGTCCCCCGGTATCTTCCCCGCCCTGCCAATCCCGATGAAATTGGAAATTTTATTGATGAA
SEQ ID NO:203 CDH1的外显子16
AATCTGAAAGCGGCTGATACTGACCCCACAGCCCCGCCTTATGATTCTCTGCTCGTGTTTGACTATGAAGGAAGCGGTTCCGAAGCTGCTAGTCTGAGCTCCCTGAACTCCTCAGAGTCAGACAAAGACCAGGACTATGACTACTTGAACGAATGGGGCAATCGCTTCAAGAAGCTGGCTGACATGTACGGAGGCGGCGAGGACGACTAGGGGACTCGAGAGAGGCGGGCCCCAGACCCATGTGCTGGGAAATGCAGAAATCACGTTGCTGGTGGTTTTTCAGCTCCCTTCCCTTGAGATGAGTTTCTGGGGAAAAAAAAGAGACTGGTTAGTGATGCAGTTAGTATAGCTTTATACTCTCTCCACTTTATAGCTCTAATAAGTTTGTGTTAGAAAAGTTTCGACTTATTTCTTAAAGCTTTTTTTTTTTTCCCATCACTCTTTACATGGTGGTGATGTCCAAAAGATACCCAAATTTTAATATTCCAGAAGAACAACTTTAGCATCAGAAGGTTCACCCAGCACCTTGCAGATTTTCTTAAGGAATTTTGTCTCACTTTTAAAAAGAAGGGGAGAAGTCAGCTACTCTAGTTCTGTTGTTTTGTGTATATAATTTTTTAAAAAAAATTTGTGTGCTTCTGCTCATTACTACACTGGTGTGTCCCTCTGCCTTTTTTTTTTTTTTAAGACAGGGTCTCATTCTATCGGCCAGGCTGGAGTGCAGTGGTGCAATCACAGCTCACTGCAGCCTTGTCCTCCCAGGCTCAAGCTATCCTTGCACCTCAGCCTCCCAAGTAGCTGGGACCACAGGCATGCACCACTACGCATGACTAATTTTTTAAATATTTGAGACGGGGTCTCCCTGTGTTACCCAGGCTGGTCTCAAACTCCTGGGCTCAAGTGATCCTCCCATCTTGGCCTCCCAGAGTATTGGGATTACAGACATGAGCCACTGCACCTGCCCAGCTCCCCAACTCCCTGCCATTTTTTAAGAGACAGTTTCGCTCCATCGCCCAGGCCTGGGATGCAGTGATGTGATCATAGCTCACTGTAACCTCAAACTCTGGGGCTCAAGCAGTTCTCCCACCAGCCTCCTTTTTATTTTTTTGTACAGATGGGGTCTTGCTATGTTGCCCAAGCTGGTCTTAAACTCCTGGCCTCAAGCAATCCTTCTGCCTTGGCCCCCCAAAGTGCTGGGATTGTGGGCATGAGCTGCTGTGCCCAGCCTCCATGTTTTAATATCAACTCTCACTCCTGAATTCAGTTGCTTTGCCCAAGATAGGAGTTCTCTGATGCAGAAATTATTGGGCTCTTTTAGGGTAAGAAGTTTGTGTCTTTGTCTGGCCACATCTTGACTAGGTATTGTCTACTCTGAAGACCTTTAATGGCTTCCCTCTTTCATCTCCTGAGTATGTAACTTGCAATGGGCAGCTATCCAGTGACTTGTTCTGAGTAAGTGTGTTCATTAATGTTTATTTAGCTCTGAAGCAAGAGTGATATACTCCAGGACTTAGAATAGTGCCTAAAGTGCTGCAGCCAAAGACAGAGCGGAACTATGAAAAGTGGGCTTGGAGATGGCAGGAGAGCTTGTCATTGAGCCTGGCAATTTAGCAAACTGATGCTGAGGATGATTGAGGTGGGTCTACCTCATCTCTGAAAATTCTGGAAGGAATGGAGGAGTCTCAACATGTGTTTCTGACACAAGATCCGTGGTTTGTACTCAAAGCCCAGAATCCCCAAGTGCCTGCTTTTGATGATGTCTACAGAAAATGCTGGCTGAGCTGAACACATTTGCCCAATTCCAGGTGTGCACAGAAAACCGAGAATATTCAAAATTCCAAATTTTTTTCTTAGGAGCAAGAAGAAAATGTGGCCCTAAAGGGGGTTAGTTGAGGGGTAGGGGGTAGTGAGGATCTTGATTTGGATCTCTTTTTATTTAAATGTGAATTTCAACTTTTGACAATCAAAGAAAAGACTTTTGTTGAAATAGCTTTACTGTTTCTCAAGTGTTTTGGAGAAAAAAATCAACCCTGCAATCACTTTTTGGAATTGTCTTGATTTTTCGGCAGTTCAAGCTATATCGAATATAGTTCTGTGTAGAGAATGTCACTGTAGTTTTGAGTGTATACATGTGTGGGTGCTGATAATTGTGTATTTTCTTTGGGGGTGGAAAAGGAAAACAATTCAAGCTGAGAAAAGTATTCTCAAAGATGCATTTTTATAAATTTTATTAAACAATTTTGTTAAA
SEQ ID NO:204 CDH1的全部16个外显子1-16按顺序排列的多核苷酸序列
SEQ ID NO:205 CDH1的外显子10的翻译多肽序列
MEQKI
SEQ ID NO:206 CDH1的外显子11的翻译多肽序列
YRIWRDTANWLEINPDTGAISTRAELDREDFEHVKNSTYTALIIATDN
SEQ ID NO:207 CDH1的外显子12的翻译多肽序列
SPVATGTGTLLLILSDVNDNAPIPEPRTIFFCERNPKPQVINIIDADLPPNTSPFTAELTHGASANWTIQYNDP
SEQ ID NO:208 CDH1的外显子13的翻译多肽序列
QESIILKPKMALEVGDYKINLKLMDNQNKDQVTTLEVSVCDCEGAAGVCRKAQPVEAGLQIPAILGILGGILALL
SEQ ID NO:209 CDH1的外显子14的翻译多肽序列
LILLLLLFLRRRAVVKEPLLPPEDDTRDNVYYYDEEGGGEEDQ
SEQ ID NO:210 CDH1的外显子15的翻译多肽序列
DFDLSQLHRGLDARPEVTRNDVAPTLMSVPRYLPRPANPDEIGNFIDE
SEQ ID NO:211 CDH1的外显子16的翻译多肽序列
NLKAADTDPTAPPYDSLLVFDYEGSGSEAASLSSLNSSESDKDQDYDYLNEWGNRFKKLADMYGGGEDD
SEQ ID NO:212 CDH1多肽序列
MEQKITYRIWRDTANWLEINPDTGAISTRAELDREDFEHVKNSTYTALIIATDNGSPVATGTGTLLLILSDVNDNAPIPEPRTIFFCERNPKPQVINIIDADLPPNTSPFTAELTHGASANWTIQYNDPTQESIILKPKMALEVGDYKINLKLMDNQNKDQVTTLEVSVCDCEGAAGVCRKAQPVEAGLQIPAILGILGGILALLILILLLLLFLRRRAVVKEPLLPPEDDTRDNVYYYDEEGGGEEDQDFDLSQLHRGLDARPEVTRNDVAPTLMSVPRYLPRPANPDEIGNFIDENLKAADTDPTAPPYDSLLVFDYEGSGSEAASLSSLNSSESDKDQDYDYLNEWGNRFKKLADMYGGGEDD
SEQ ID NO:213 CDH1的全部11个外显子1-11按顺序排列的多核苷酸序列
SEQ ID NO:214外显子1-11的翻译多肽序列
MEQKIYRIWRDTANWLEINPDTGAISTRAELDREDFEHVKNSTYTALIIATDN
CXADR序列信息
SEQ ID NO:215 CXADR-NRG1融合物5’处的CXADR外显子1序列
ATGGCGCTCCTGCTGTGCTTCGTGCTCCTGTGCGGAGTAGTGG
SEQ ID NO:216 CXADR-NRG1融合物3’处的NRG1外显子2序列
CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACT
SEQ ID NO:217 CXADR-NRG1多核苷酸序列
ATGGCGCTCCTGCTGTGCTTCGTGCTCCTGTGCGGAGTAGTGGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACT
SEQ ID NO:218 CXADR-NRG1多肽序列
MALLLCFVLLCGVVALPPRLKEMKSQESAAGSK
SEQ ID NO:219CXADR的外显子1
AGTCGGGAGCGCGCGAGGCGCGGGGAGCCTGGGACCAGGAGCGAGAGCCGCCTACCTGCAGCCGCCGCCCACGGCACGGCAGCCACCATGGCGCTCCTGCTGTGCTTCGTGCTCCTGTGCGGAGTAGTGG
SEQ ID NO:220CXADR的外显子2
ATTTCGCCAGAAGTTTGAGTATCACTACTCCTGAAGAGATGATTGAAAAAGCCAAAGGGGAAACTGCCTATCTGCCATGCAAATTTACGCTTAGTCCCGAAGACCAGGGACCGCTGGACATCGAGTGGCTGATATCACCAGCTGATAATCAGAAGGTGGATCAAGTG
SEQ ID NO:221CXADR的外显子3
ATTATTTTATATTCTGGAGACAAAATTTATGATGACTACTATCCAGATCTGAAAGGCCGAGTACATTTTACGAGTAATGATCTCAAATCTGGTGATGCATCAATAAATGTAACGAATTTACAACTGTCAGATATTGGCACATATCAGTGCAAAGTGAAAAAAGCTCCTGGTGTTGCAAATAAGAAGATTCATCTGGTAGTTCTTG
SEQ ID NO:222CXADR的外显子4
TTAAGCCTTCAGGTGCGAGATGTTACGTTGATGGATCTGAAGAAATTGGAAGTGACTTTAAGATAAAATGTGAACCAAAAGAAGGTTCACTTCCATTACAGTATGAGTGGCAAAAATTGTCTGACTCACAGAAAATGCCCACTTCATGGTTAGCAG
SEQ ID NO:223CXADR的外显子5
GGAAGATGTGCCACCTCCAAAGAGCCGTACGTCCACTGCCAGAAGCTACATCGGCAGTAATCATTCATCCCTGGGGTCCATGTCTCCTTCCAACATGGAAGGATATTCCAAGACTCAGTATAACCAAGTACCAAGTGAAGACTTTGAACGCACTCCTCAGAGTCCGACTCTCCCACCTGCTAAGGTAGCTGCCCCTAATCTAAGTCGAATGGGTGCGATTCCTGTGATGATTCCAGCACAGAGCAAGGATGGGTCTATAGTATAGAGCCTCCATATGTCTCATCTGTGCTCTCCGTGTTCCTTTCCTTTTTTTGATATATGAAAACCTATTCTGGTCTAAATTGTGTTACTAGCCTCAAAATACATCAAAAAATAAGTTAATCAGGAACTGTACGGAATATATTTTTAAAAATTTTTGTTTGGTTATATCGAAATAGTTACAGGCACTAAAGTTAGTAAAGAAAAGTTTACCATCTGAAAAAGCTGGATTTTCTTTAAGAGGTTGATTATAAAGTTTTCTAAATTTATCAGTACCTAAGTAAGATGTAGCGCTTTGAATATGAAATCATAGGTGAAGACATGGGTGAACTTACTTGCATACCAAGTTGATACTTGAATAACCATCTGAAAGTGGTACTTGATCATTTTTACCATTATTTTTAGGATGTGTATTTCATTTATTTATGGCCCACCAGTCTCCCCCAAATTAGTACAGAAATATCCATGACAAAATTACTTACGTATGTTTGTACTTGGTTTTACAGCTCCTTTGAAAACTCTGTGTTTGGAATATCTCTAAAAACATAGAAAACACTACAGTGGTTTAGAAATTACTAATTTTACTTCTAAGTCATTCATAAACCTTGTCTATGAAATGACTTCTTAAATATTTAGTTGATAGACTGCTACAGGTAATAGGGACTTAGCAAGCTCTTTTATATGCTAAAGGAGCATCTATCAGATTAAGTTAGAACATTTGCTGTCAGCCACATATTGAGATGACACTAGGTGCAATAGCAGGGATAGATTTTGTTGGTGAGTAGTCTCATGCCTTGAGATCTGTGGTGGTCTTCAAAATGGTGGCCAGCCAGATCAAGGATGTAGTATCTCATAGTTCCCAGGTGATATTTTTCTTATTAGAAAAATATTATAACTCATTTGTTGTTTGACACTTATAGATTGAAATTTCCTAATTTATTCTAAATTTTAAGTGGTTCTTTGGTTCCAGTGCTTTATGTTGTTGTTGTTTTTGGATGGTGTTACATATTATATGTTCTAGAAACATGTAATCCTAAATTTACCCTCTTGAATATAATCCCTGGATGATATTTTTTATCATAAATGCAGAATAATCAAATACATTTTAAGCAAGTTAAGTGTCCTCCATCAATTCTGTATTCCAGACTTGGGAGGATGTACAGTTGCTGTTGTGTGATCAAACATGTCTCTGTGTAGTTCCAGCAAATCAAGCTGAGCTTTGAAAAAGTTTGTCTTAGTTTTGTGAAGGTGATTTATTCTTAAAAAAAAAAAAGAAAGAAAAAGAAAAAAAGATAAGAAGGAGGAGTAAAGGGACTACTCCTCCTTGCCAAATGTGCTAAATATCATTTTAGGAGAAGAAAGTGGGTTTATTGTATTTCCCTTAAGATTGTGAGGGAGTGTGGATACAGTAGAATGAGCCAACAGTTTCTTTATAATAAATACGGTCTGCAATAAATTATTTCACTAGCTCTAAAACCTTTCCCTAGATTTTAGTAGGGAGTTGGTTTCTGTTAATATCTTTGGGTGCTGTGGTGGTAAATGCTATATTATGAACGGTGGCATGTATTTACAGTTAGAGTATTGTGTGTACACTTTTTAATGGTAAACTTAAGCTGAATGTGTAATGGATTTGTGTATAGTTTTACATATTTGGAAGCATTTTAAAAACAGGTTTTAACCTTATGTAAAATTACTTTTATACTCGTGTTAACATTTTCATCTGTGCCTTTTGGTAATTTAATTTCTATTATGAATTTCTGGTGCCTATGAGCTAGCTATCACCTACCTGAAAGGTGCTTAGAGGTGAAGGTACTGTTTCTAAAAACACATCACTGTGATACCTTTCTATCCTCACATTTTCAAGCTTGCCTCTTTTCTGTTCTTTGTGGATATAACTTAAGCAATTGTGTTATTCATAAAGGTTTAGAAATTTCAATATTCCCAACACTCTATGTTTCTGATTTTATAACAGTAGCCATTTTTGAAAGTCAGATGTTTGGCCTGTTTTATATGAATAAAGTTTATTTATAAAATATTATAAAAAATAAGTAAATAAACAGAACATTAATAATAAAGTTTTGGTTCTTCCTATTCCTGACTTTCATATAATGAAAATTATCCTATTGATCTAAGTAGAAGTTATCATAGAAAGTGGACACGTATAAGACTTTCCTTCCTTTTTTTTTTTAATAACATATGAGGAACAAGACTTCTCTTCCCATATACTTCATATTTTAGAGGACATTGTTTTAAAGGCTTATGTCTCACTGTAAAATTCTGTCAGCCAAATAGTACCAATACGTTTTCAAGTAGTTCTCACTGATAATTTAGTTGAACCAGAGATCAAATATTTGCTCCCGAATTACTACTGGTAATCAAGTAGTTGAACAAAAAATTACTAAAGCATTTCCGTTAGATCAGTCAAGGACAGTACTGCATCTTTTTTTTTTTTTTTTTTTTTAAGACGGAGTCTCGGTCTGTCACCCAGGCTGGAGTGCAGTGGCGGGATCTCGGCTCACTGCAAGCTCCGCCTCCCAGGTTCACGCCATTCTCCTGCCTCAGCCTCCCGAGCAGCTGGGACTACAGGCTCCCATCACCACGCTCGGCTAAGTTTTTGTAATTTTAGTAGAGACAGGGTTTCACCGTGTTAGCCAGGATGGTCTCGATCTCCTGACCTCGTGATCTGCCTGCCTCGGCCTCCCAAAGTGCTGGGATTACAGGCGTGAACCACTGCACCCGGCCCAGTACTGCATCTTAACAGCAAAGCCATTTTATTCTACTTTATAACTGAGAGACTTGATACCATCCATCTCTTTAGGTTACAGAGGATAATTTGAAGAGAAATGTTACTGTAGAATATATAGTTCTGTACTTTTTTTTTTTTTTTTTAAGAGATAGGGTTTCACTATTGCTCAGGCTGGTCTCAAACTGCTGGGCTCAGGAGATCCTCCTGCCTTGGCCTCCCAAATTGCTGGGATTACAGGTGTGAGCCGCAGCATCCAGCCAGTTCTGTACTTTGAATATGGAGTAGTTTACAGCTATTTTTTTTTCTTACTGGTAATCTTAACTAATATGATTCCCTTGTTAGAGAGCCTCTCACTCCCCCACCCCCAAAAATGTCTACTATTCATGACAGTAACCAATTATTCTGGACAAATTGCTTCTTTTTAATTTGAGCTATCTGCCATGGACTTTCTAAAATGGAAACACAGCCTGAGTGTATCTTAGGGAGAGTTTGATTGAAAAAATCCAAATCACTATCCATATAGATCATGGATATAAAGAGATACCTGATTTTTATTAAAAAGATACTTTTTCAAATTTAAGAGTTAATCTTGGAAATTTGGAACAAGTAAAGGGGCAAGTAAACCTTTTGATGAAATATAAAAGGAACTCATTGCATGAAGTTGACTATCAAATTCTGTGATGTGTGGCTTCTTAAAAATATTCTCAGTGTCTTTTGTGTGCGTGCAGCATGTACATTTGATGTTATGTGAATGTTGAGTTTTTTCTTCTAATTTTCACTTCAGCAGTGTTTAGGGCTTTCAGATGCCTTATTCCAGTGTGAACAGAAAAAGTTCATATTTTATGTGGTTAATGCTTTGATGTGTCACATAAAGAGTAGTTTGTAGAAAATGTTGGCACAATTTTAACTTCTTAGTGGCTTGTGACATTATATATTATATATATATATGTACATATATCTTTATAACATTCCTGTGTTTAGTAGTGTAAATGTTCTGGGCAAGTTTTAATATTTTGAATGCCTTTGGATATTCCAGCAATAAAGGCATCATGTTCTGCAATAGGATTTCTTACTCATTTACCTATTTTAACACTAAAATAGACCACAACTGAGCACAAATTCCTTTTATAAATGTTATAGAAGCAGGGAAGAATAATAAACACATTTGTGAATTGTGGTTCAGTTTATTTATCTTTAGGGAAGGCTGATCATTTATCTTATAGCAGATAACCCCAGCCTCTTATTCATTATGGTTAACTTTTATAATTTATCTTATTTTATAATTTAAGAATATAGTACATATCAGTTGGGTTTGGTTTTGGTCATCGAGACTAAAAGCTCCATCAAAACAGAACTTTGTGTTTTCTGCTAACTTATTTAATGACACAAGTTTTAAGAGAACCACAATTCATTGATTCACTTATTCTTTTCCCTAATTGTGAATTTTAGTGATAAATACACCTGTACTACTGAGGAAAATATTCTGACACTTCACGTGTGCAAAGTATAGAACTGACAGTGTCAGTTTCAGATTTTGTATGTACGATTTCTGGCTTATATATCCAATGGTGCAGATTTTGAAATTTGTAAGAACAAAATTTGTTAAGAAAAACAACTTGCTCTAGTTTTGTGACCTTGTGTACTTTTGAAATAAAATCAAGAAAGCAGTTCTCTGCCTC
SEQ ID NO:224CXADR的全部5个外显子1-5按顺序排列的多核苷酸序列
SEQ ID NO:225CXADR的外显子1的翻译多肽序列
MALLLCFVLLCGVV
SEQ ID NO:226CXADR的外显子2的翻译多肽序列
FARSLSITTPEEMIEKAKGETAYLPCKFTLSPEDQGPLDIEWLISPADNQKVDQV
SEQ ID NO:227CXADR的外显子3的翻译多肽序列
IILYSGDKIYDDYYPDLKGRVHFTSNDLKSGDASINVTNLQLSDIGTYQCKVKKAPGVANKKIHLVVL
SEQ ID NO:228CXADR的外显子4的翻译多肽序列
KPSGARCYVDGSEEIGSDFKIKCEPKEGSLPLQYEWQKLSDSQKMPTSWLA
SEQ ID NO:229CXADR的外显子5的翻译多肽序列
KMCHLQRAVRPLPEATSAVIIHPWGPCLLPTWKDIPRLSITKYQVKTLNALLRVRLSHLLR
SEQ ID NO:230CDAXR多肽序列
MALLLCFVLLCGVVDFARSLSITTPEEMIEKAKGETAYLPCKFTLSPEDQGPLDIEWLISPADNQKVDQVIILYSGDKIYDDYYPDLKGRVHFTSNDLKSGDASINVTNLQLSDIGTYQCKVKKAPGVANKKIHLVVLVKPSGARCYVDGSEEIGSDFKIKCEPKEGSLPLQYEWQKLSDSQKMPTSWLAGKMCHLQRAVRPLPEATSAVIIHPWGPCLLPTWKDIPRLSITKYQVKTLNALLRVRLSHLLR
GTF2E2序列信息
SEQ ID NO:231GTF2E2-NRG1融合物5’处的GTF2E2外显子2序列GGGAGCTGTTCAAAAAACGAGCTCTTTCTACTCCTGTAGTAGAAAAACGTTCAGCATCTTCTGAGTCATCATCATCATCGTCAAAGAAGAAGAAAACAAAGGTAGAACATGGAGGATCGTCAGGCTCTAAACAAAATTCTG
SEQ ID NO:232GTF2E2-NRG1融合物3’处的NRG1外显子2序列CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAACCAGTTCTGAATACTCCTCTCTCAGATTCAAGTGGTTCAAGAATGGGAATGA
SEQ ID NO:233GTF2E2-NRG1多核苷酸序列
GGGAGCTGTTCAAAAAACGAGCTCTTTCTACTCCTGTAGTAGAAAAACGTTCAGCATCTTCTGAGTCATCATCATCATCGTCAAAGAAGAAGAAAACAAAGGTAGAACATGGAGGATCGTCAGGCTCTAAACAAAATTCTGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAACCAGTTCTGAATACTCCTCTCTCAGATTCAAGTGGTTCAAGAATGGGAATGA
SEQ ID NO:234GTF2E2-NRG1多肽序列
ELFKKRALSTPVVEKRSASSESSSSSSKKKKTKVEHGGSSGSKQNSALPPRLKEMKSQESAAGSKLVLRCETSSEYSSLRFKWFKNGN
SEQ ID NO:235GTF2E2的外显子1
ACTGAGCTCCTAGCACCCGATCGGGAAGTGGCGGGCGGAGTCCCGGGTCCAGTCGCCGCCTCAGCTACCGCCGCTGCCGCCGCCGCCGCCGCCACCGCCAGTGGTGAGACCCCGACCTGGCGGGTCAGCGCTGGGCGTGCGTGCGGGCAGGCGGGGGCGCTGACGAGAAGCAGGAAGAGGGTGCAGTGCCGGCGTGGGCGGCCGGCCGAGGCGGAGGCGCAGGAAGGGGGCGGCGAGTCGTGCGAGGCTGCCCTTCTCACTCAG
SEQ ID NO:236GTF2E2的外显子2
CATTATGGATCCAAGCCTGTTGAGAGAAAGGGAGCTGTTCAAAAAACGAGCTCTTTCTACTCCTGTAGTAGAAAAACGTTCAGCATCTTCTGAGTCATCATCATCATCGTCAAAGAAGAAGAAAACAAAGGTAGAACATGGAGGATCGTCAGGCTCTAAACAAAATTCTG
SEQ ID NO:237GTF2E2的外显子3
ATCATAGCAATGGATCATTTAACTTGAAAGCTTTGTCAGGAAGCTCTGGATATAAGTTTGGTGTTCTTGCTAAGATTGTGAATTACATGAAG
SEQ ID NO:238GTF2E2的外显子4
ACACGGCATCAGCGAGGAGATACGCATCCTCTAACCTTAGATGAAATTTTGGATGAAACACAACATTTAGATATTGGACTCAAGCAGAAACAATGGCTAATGACTGAG
SEQ ID NO:239GTF2E2的外显子5
GCTTTAGTCAACAATCCCAAAATTGAAGTAATAGATGGGAAGTATGCTTTCAAGCCCAAGTACAACGTGAGAGATAAGAAGGCCCTACTTAGGCTCTTAGATCAGCATGACCAGCGAGGATTAGGAGGAATTCTTTTAGAAGACATAGAAGAAGCACTGCCCAATTCCCAGAAAGCTGTCAAG
SEQ ID NO:240GTF2E2的外显子6
GCTTTGGGGGACCAGATACTATTTGTAAATCGTCCCGATAAGAAGAAAATACTTTTCTTCAATGATAAGAGCTGTCAGTTTTCTGTGGATGAAG
SEQ ID NO:241GTF2E2的外显子7
AATTTCAGAAACTGTGGAGGAGTGTCACTGTAGATTCCATGGACGAGGAGAAAATTGAAGAATATCTGAAGCGACAGGGTATTTCTTCCATGCAGGAATCTGGACCAAAGAAAGTGSEQ ID NO:242GTF2E2的外显子8
GCCCCTATTCAGAGAAGGAAAAAGCCTGCTTCACAGAAAAAGCGACGCTTTAAGACTCATAACGAACACTTGGCTGGAGTGCTGAAGGATTACTCTGACATTACTTCCAGCAAATAGGGAACAGTTTTGCCCTGGAACAGAGTTACAGATACACAATCAAGAGTGTTCTTGCTGATGCTCGGGGTCTGAAGACTGTCTTCCTATCTGCTTCTTGCGGCTGAGGAGAGGAGCAGTTCAGTTTACAAAACAAGTGCAAATTACCAAACTCAAAGCTTATTTGAGTAGAATGGGCTCATGGGCAATGTGATGTTCCCTGTTAACCTTCTGTTACTCCCTGGGAGAAAGGCGCTGAGCGTGGCATGCAGGTGTCTTTGCTGTGTTTTTCTCCACTTCTAAATGGTTCCTGGTTCCTTTCTTCCTCGTTTGTTACTTTAGAGCAAGTTTGCCCATAGTCTTGAATGCAATATTTGTTTATTCCAAAAGAACATATTTATAATAAAATCACTGTAGAAGGATTTTTAAGATGTTAGTGAATTCTGTTTCTTTTCATTCTCGGAAATGGCAGGAAGCAGCTCCAGTCTCTGATTTCCATGGGTCACGTGCTGGGGATGTGATGAAGCCTGCAGTCTGCACTGTGTTGCTGAGCACATGGATTTCACCACTGGAACACAGGTGTGCTGCTTGTTAGCAAGCAGAGCAATAAAGATGTGCTGGATGTCA
SEQ ID NO:243GTF2E2的全部8个外显子1-8按顺序排列的多核苷酸序列
SEQ ID NO:244GTF2E2的外显子2的翻译多肽序列
MDPSLLRERELFKKRALSTPVVEKRSASSESSSSSSKKKKTKVEHGGSSGSKQNS
SEQ ID NO:245GTF2E2的外显子3的翻译多肽序列
HSNGSFNLKALSGSSGYKFGVLAKIVNYMK
SEQ ID NO:246GTF2E2的外显子4的翻译多肽序列
TRHQRGDTHPLTLDEILDETQHLDIGLKQKQWLMTE
SEQ ID NO:247GTF2E2的外显子5的翻译多肽序列
ALVNNPKIEVIDGKYAFKPKYNVRDKKALLRLLDQHDQRGLGGILLEDIEEALPNSQKAVK
SEQ ID NO:248GTF2E2的外显子6的翻译多肽序列
ALGDQILFVNRPDKKKILFFNDKSCQFSVDE
SEQ ID NO:249GTF2E2的外显子7的翻译多肽序列
FQKLWRSVTVDSMDEEKIEEYLKRQGISSMQESGPKKV
SEQ ID NO:250GTF2E2的外显子8的翻译多肽序列
APIQRRKKPASQKKRRFKTHNEHLAGVLKDYSDITSSK
SEQ ID NO:251全蛋白质序列
MDPSLLRERELFKKRALSTPVVEKRSASSESSSSSSKKKKTKVEHGGSSGSKQNSDHSNGSFNLKALSGSSGYKFGVLAKIVNYMKTRHQRGDTHPLTLDEILDETQHLDIGLKQKQWLMTEALVNNPKIEVIDGKYAFKPKYNVRDKKALLRLLDQHDQRGLGGILLEDIEEALPNSQKAVKALGDQILFVNRPDKKKILFFNDKSCQFSVDEEFQKLWRSVTVDSMDEEKIEEYLKRQGISSMQESGPKKVAPIQRRKKPASQKKRRFKTHNEHLAGVLKDYSDITSSK
SEQ ID NO:252外显子1-2
ACTGAGCTCCTAGCACCCGATCGGGAAGTGGCGGGCGGAGTCCCGGGTCCAGTCGCCGCCTCAGCTACCGCCGCTGCCGCCGCCGCCGCCGCCACCGCCAGTGGTGAGACCCCGACCTGGCGGGTCAGCGCTGGGCGTGCGTGCGGGCAGGCGGGGGCGCTGACGAGAAGCAGGAAGAGGGTGCAGTGCCGGCGTGGGCGGCCGGCCGAGGCGGAGGCGCAGGAAGGGGGCGGCGAGTCGTGCGAGGCTGCCCTTCTCACTCAGCATTATGGATCCAAGCCTGTTGAGAGAAAGGGAGCTGTTCAAAAAACGAGCTCTTTCTACTCCTGTAGTAGAAAAACGTTCAGCATCTTCTGAGTCATCATCATCATCGTCAAAGAAGAAGAAAACAAAGGTAGAACATGGAGGATCGTCAGGCTCTAAACAAAATTCTG
CSMD1序列信息
SEQ ID NO:253 CSMD1-NRG1融合物5’处的CSMD1外显子23序列
ATCCTAAACAGCACATCCAATCACCTGTGGCTAGAGTTCAACACCAATGGATCTGACACCGACCAAGGTTTTCAACTCACCTATACCA
SEQ ID NO:254 CSMD1-NRG1融合物3’处的NRG1外显子6序列
CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACT
SEQ ID NO:255 CSMD1-NRG1多核苷酸序列ATCCTAAACAGCACATCCAATCACCTGTGGCTAGAGTTCAACACCAATGGATCTGACACCGACCAAGGTTTTCAACTCACCTATACCACTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACT
SEQ ID NO:256 CSMD1-NRG1多肽序列
ILNSTSNHLWLEFNTNGSDTDQGFQLTYTTTSTSTTGTSHLVKCAEKEKT
SEQ ID NO:257CSMD1的外显子1
CTCCACGGCAGCGGCTCCTTGTGCCACTAGCAGCCCTTCTTCTGCGCTCTCCGCCTTTTCTCTCTAGACTGGATCTCTCCTCCCCCCCGCGCCCCCCTCCCCGCATCTCCCACTCGCTGGCTCTCTCTCCAGCTGCCTCCTCTCCAGGTCTCTCCTGGCTGCGCGCGCTCCTCTCCCCGCTTCTCCCCCTCCCGCAGCCTCGCCGCCTTGGTGCCTTCCTGCCCGGCTCGGCCGGCGCTCGTCCCCGGCCCCGGCCCCGCCAGCCCGGGTCTCCGCGCTCGGAGCAGCTCAGCCCTGCAGTGGCTCGGGACCCGATGCTATGAGAGGGAAGCGAGCCGGGCGCCCAGACCTTCAGGAGGCGTCGGATGCGCGGCGGGTCTTGGGACCGGGCTCTCTCTCCGGCTCGCCTTGCCCTCGGGTGATTATTTGGCTCCGCTCATAGCCCTGCCTTCCTCGGAGGAGCCATCGGTGTCGCGTGCGTGTGGAGTATCTGCAGACATGACTGCGTGGAGGAGATTCCAGTCGCTGCTCCTGCTTCTCGGGCTGCTGGTGCTGTGCGCGAGGCTCCTCACTGCAGCGAAGG
SEQ ID NO:258CSMD1的外显子2
GTCAGAACTGTGGAGGCTTAGTCCAGGGTCCCAATGGCACTATTGAGAGCCCAGGGTTTCCTCACGGGTATCCGAACTATGCCAACTGCACCTGGATCATCATCACGGGCGAGCGCAATAGGATACAGTTGTCCTTCCATACCTTTGCTCTTGAAGAAGATTTTGATATTTTATCAGTTTACGATGGACAGCCTCAACAAGGGAATTTAAAAGTGAG
SEQ ID NO:259CSMD1的外显子3
ATTATCGGGATTTCAGCTGCCCTCCTCTATAGTGAGTACAGGATCTATCCTCACTCTGTGGTTCACGACAGACTTCGCTGTGAGTGCCCAAGGTTTCAAAGCATTATATGAAG
SEQ ID NO:260CSMD1的外显子4
TTTTACCTAGCCACACTTGTGGAAATCCTGGAGAAATCCTGAAAGGAGTTCTGCATGGAACGAGATTCAACATAGGAGACAAAATCCGGTACAGCTGCCTCCCTGGCTACATCTTGGAAGGCCACGCCATCCTGACCTGCATCGTCAGCCCAGGAAATGGTGCATCGTGGGACTTCCCAGCTCCCTTTTGCAGAG
SEQ ID NO:261CSMD1的外显子5
CTGAGGGAGCCTGCGGAGGAACCTTACGCGGGACCAGCAGCTCCATCTCCAGCCCGCACTTCCCTTCAGAGTACGAGAACAACGCGGACTGCACCTGGACCATTCTGGCTGAGCCCGGGGACACCATTGCGCTGGTCTTCACTGACTTTCAGCTAGAAGAAGGATATGATTTCTTAGAGATCAGTGGCACGGAAGCTCCATCCATATG
SEQ ID NO:262CSMD1的外显子6
GCTAACTGGCATGAACCTCCCCTCTCCAGTTATCAGTAGCAAGAATTGGCTACGACTCCATTTCACCTCTGACAGCAACCACCGACGCAAAGGATTTAACGCTCAGTTCCAAG
SEQ ID NO:263CSMD1的外显子7
TGAAAAAGGCGATTGAGTTGAAGTCAAGAGGAGTCAAGATGCTGCCCAGCAAGGATGGAAGCCATAAAAACTCTGTCT
SEQ ID NO:264CSMD1的外显子8
TGAGCCAAGGAGGTGTTGCATTGGTCTCTGACATGTGTCCAGATCCTGGGATTCCAGAAAATGGTAGAAGAGCAGGTTCCGACTTCAG
SEQ ID NO:265CSMD1的外显子9
GGTTGGTGCAAATGTACAGTTTTCATGTGAGGACAATTACGTGCTCCAGGGATCTAAAAGCATCACCTGTCAGAGAGTTACAGAGACGCTCGCTGCTTGGAGTGACCACAGGCCCATCTGCCGAG
SEQ ID NO:266CSMD1的外显子10
CGAGAACATGTGGATCCAATCTGCGTGGGCCCAGCGGCGTCATTACCTCCCCTAATTATCCGGTTCAGTATGAAGATAATGCACACTGTGTGTGGGTCATCACCACCACCGACCCGGACAAG
SEQ ID NO:267CSMD1的外显子11
GTCATCAAGCTTGCCTTTGAAGAGTTTGAGCTGGAGCGAGGCTATGACACCCTGACGGTTGGTGATGCTGGGAAGGTGGGAGACACCAGATCGGTCTTGTACGT
SEQ ID NO:268CSMD1的外显子12
GCTCACGGGATCCAGTGTTCCTGACCTCATTGTGAGCATGAGCAACCAGATGTGGCTACATCTGCAGTCGGATGATAGCATTGGCTCACCTGGGTTTAAAGCTGTTTACCAAG
SEQ ID NO:269CSMD1的外显子13
AAATTGAAAAGGGAGGGTGTGGGGATCCTGGAATCCCCGCCTATGGGAAGCGGACGGGCAGCAGTTTCCTCCATGGAGATACACTCACCTTTGAATGCCCGGCGGCCTTTGAGCTGGTGGGGGAGAGAGTTATCACCTGTCAGCAGAACAATCAGTGGTCTGGCAACAAGCCCAGCTGTGTAT
SEQ ID NO:270CSMD1的外显子14
TTTCATGTTTCTTCAACTTTACGGCATCATCTGGGATTATTCTGTCACCAAATTATCCAGAGGAATATGGGAACAACATGAACTGTGTCTGGTTGATTATCTCGGAGCCAGGAAGTCGAATTCACCTAATCTTTAATGATTTTGATGTTGAGCCTCAGTTTGACTTTCTCGCGGTCAAGGATGATGGCATTTCTGACATAACTGTCCTGGGTACTTTTTCTGGCAATGAAGTGCCTTCCCAGCTGGCCAGCAGTGGGCATATAGTTCGCTTGGAATTTCAGTCTGACCATTCCACTACTGGCAGAGGGTTCAACATCACTTACACCA
SEQ ID NO:271CSMD1的外显子15
CATTTGGTCAGAATGAGTGCCATGATCCTGGCATTCCTATAAACGGACGACGTTTTGGTGACAGGTTTCTACTCGGGAGCTCGGTTTCTTTCCACTGTGATGATGGCTTTGTCAAGACCCAGGGATCCGAGTCCATTACCTGCATACTGCAAGACGGGAACGTGGTCTGGAGCTCCACCGTGCCCCGCTGTGAAG
SEQ ID NO:272CSMD1的外显子16
CTCCATGTGGTGGACATCTGACAGCGTCCAGCGGAGTCATTTTGCCTCCTGGATGGCCAGGATATTATAAGGATTCTTTACATTGTGAATGGATAATTGAAGCAAAACCAGGCCACTCTATCAAAATAACTTTTGACAG
SEQ ID NO:273CSMD1的外显子17
ATTTCAGACAGAGGTCAATTATGACACCTTGGAGGTCAGAGATGGGCCAGCCAGTTCGTCCCCACTGATCGGCGAGTACCACGGCACCCAGGCACCCCAGTTCCTCATCAGCACCGGGAACTTCATGTACCTGCTGTTCACCACTGACAACAGCCGCTCCAGCATCGGCTTCCTCATCCACTATGAGA
SEQ ID NO:274CSMD1的外显子18
GTGTGACGCTTGAGTCGGATTCCTGCCTGGACCCGGGCATCCCTGTGAACGGCCATCGCCACGGTGGAGACTTTGGCATCAGGTCCACAGTGACTTTCAGCTGTGACCCGGGGTACACACTAAGTGACGACGAGCCCCTCGTCTGTGAGAGGAACCACCAGTGGAACCACGCCTTGCCCAGCTGCGACG
SEQ ID NO:275CSMD1的外显子19
CTCTATGTGGAGGCTACATCCAAGGGAAGAGTGGAACAGTCCTTTCTCCTGGGTTTCCAGATTTTTATCCAAACTCTCTAAACTGCACGTGGACCATTGAAGTGTCTCATGGGAAAG
SEQ ID NO:276CSMD1的外显子20
GAGTTCAAATGATCTTTCACACCTTTCATCTTGAGAGTTCCCACGACTATTTACTGATCACAGAGGATGGAAGTTTTTCCGAGCCCGTTGCCAGGCTCACCGGGTCGGTGTTGCCTCATACGATCAAGGCAGGCCTGTTTGGAAACTTCACTGCCCAGCTTCGGTTTATATCAGACTTCTCAATTTCGTACGAGGGCTTCAATATCACATTTTCAG
SEQ ID NO:277CSMD1的外显子21
AATATGACCTGGAGCCATGTGATGATCCTGGAGTCCCTGCCTTCAGCCGAAGAATTGGTTTTCACTTTGGTGTGGGAGACTCTCTGACGTTTTCCTGCTTCCTGGGATATCGTTTAGAAGGTGCCACCAAGCTTACCTGCCTGGGTGGGGGCCGCCGTGTGTGGAGTGCACCTCTGCCAAGGTGTGTGG
SEQ ID NO:278CSMD1的外显子22
CCGAATGTGGAGCAAGTGTCAAAGGAAATGAAGGAACATTACTGTCTCCAAATTTTCCATCCAATTATGATAATAACCATGAGTGTATCTATAAAATAGAAACAGAAGCCGGCAAGGGCATCCACCTTAGAACACGAAGCTTCCAGCTGTTTGAAGGAGATACTCTAAAG
SEQ ID NO:279CSMD1的外显子23
GTATATGATGGAAAAGACAGTTCCTCACGTCCACTGGGCACGTTCACTAAAAATGAACTTCTGGGGCTGATCCTAAACAGCACATCCAATCACCTGTGGCTAGAGTTCAACACCAATGGATCTGACACCGACCAAGGTTTTCAACTCACCTATACCA
SEQ ID NO:280CSMD1的外显子24
GTTTTGATCTGGTAAAATGTGAGGATCCGGGCATCCCTAACTACGGCTATAGGATCCGTGATGAAGGCCACTTTACCGACACTGTAGTTCTGTACAGTTGCAACCCGGGGTACGCCATGCATGGCAGCAACACCCTGACCTGTTTGAGTGGAGACAGGAGAGTGTGGGACAAACCACTACCTTCGTGCATAG
SEQ ID NO:281CSMD1的全部47个外显子24-70按顺序排列的多核苷酸序列
SEQ ID NO:282CSMD1的全部70个外显子1-70按顺序排列的多核苷酸序列
CTCCACGGCAGCGGCTCCTTGTGCCACTAGCAGCCCTTCTTCTGCGCTCTCCGCCTTTTCTCTCTAGACTGGATCTCTCCTCCCCCCCGCGCCCCCCTCCCCGCATCTCCCACTCGCTGGCTCTCTCTCCAGCTGCCTCCTCTCCAGGTCTCTCCTGGCTGCGCGCGCTCCTCTCCCCGCTTCTCCCCCTCCCGCAGCCTCGCCGCCTTGGTGCCTTCCTGCCCGGCTCGGCCGGCGCTCGTCCCCGGCCCCGGCCCCGCCAGCCCGGGTCTCCGCGCTCGGAGCAGCTCAGCCCTGCAGTGGCTCGGGACCCGATGCTATGAGAGGGAAGCGAGCCGGGCGCCCAGACCTTCAGGAGGCGTCGGATGCGCGGCGGGTCTTGGGACCGGGCTCTCTCTCCGGCTCGCCTTGCCCTCGGGTGATTATTTGGCTCCGCTCATAGCCCTGCCTTCCTCGGAGGAGCCATCGGTGTCGCGTGCGTGTGGAGTATCTGCAGACATGACTGCGTGGAGGAGATTCCAGTCGCTGCTCCTGCTTCTCGGGCTGCTGGTGCTGTGCGCGAGGCTCCTCACTGCAGCGAAGGGTCAGAACTGTGGAGGCTTAGTCCAGGGTCCCAATGGCACTATTGAGAGCCCAGGGTTTCCTCACGGGTATCCGAACTATGCCAACTGCACCTGGATCATCATCACGGGCGAGCGCAATAGGATACAGTTGTCCTTCCATACCTTTGCTCTTGAAGAAGATTTTGATATTTTATCAGTTTACGATGGACAGCCTCAACAAGGGAATTTAAAAGTGAGATTATCGGGATTTCAGCTGCCCTCCTCTATAGTGAGTACAGGATCTATCCTCACTCTGTGGTTCACGACAGACTTCGCTGTGAGTGCCCAAGGTTTCAAAGCATTATATGAAGTTTTACCTAGCCACACTTGTGGAAATCCTGGAGAAATCCTGAAAGGAGTTCTGCATGGAACGAGATTCAACATAGGAGACAAAATCCGGTACAGCTGCCTCCCTGGCTACATCTTGGAAGGCCACGCCATCCTGACCTGCATCGTCAGCCCAGGAAATGGTGCATCGTGGGACTTCCCAGCTCCCTTTTGCAGAGCTGAGGGAGCCTGCGGAGGAACCTTACGCGGGACCAGCAGCTCCATCTCCAGCCCGCACTTCCCTTCAGAGTACGAGAACAACGCGGACTGCACCTGGACCATTCTGGCTGAGCCCGGGGACACCATTGCGCTGGTCTTCACTGACTTTCAGCTAGAAGAAGGATATGATTTCTTAGAGATCAGTGGCACGGAAGCTCCATCCATATGGCTAACTGGCATGAACCTCCCCTCTCCAGTTATCAGTAGCAAGAATTGGCTACGACTCCATTTCACCTCTGACAGCAACCACCGACGCAAAGGATTTAACGCTCAGTTCCAAGTGAAAAAGGCGATTGAGTTGAAGTCAAGAGGAGTCAAGATGCTGCCCAGCAAGGATGGAAGCCATAAAAACTCTGTCTTGAGCCAAGGAGGTGTTGCATTGGTCTCTGACATGTGTCCAGATCCTGGGATTCCAGAAAATGGTAGAAGAGCAGGTTCCGACTTCAGGGTTGGTGCAAATGTACAGTTTTCATGTGAGGACAATTACGTGCTCCAGGGATCTAAAAGCATCACCTGTCAGAGAGTTACAGAGACGCTCGCTGCTTGGAGTGACCACAGGCCCATCTGCCGAGCGAGAACATGTGGATCCAATCTGCGTGGGCCCAGCGGCGTCATTACCTCCCCTAATTATCCGGTTCAGTATGAAGATAATGCACACTGTGTGTGGGTCATCACCACCACCGACCCGGACAAGGTCATCAAGCTTGCCTTTGAAGAGTTTGAGCTGGAGCGAGGCTATGACACCCTGACGGTTGGTGATGCTGGGAAGGTGGGAGACACCAGATCGGTCTTGTACGTGCTCACGGGATCCAGTGTTCCTGACCTCATTGTGAGCATGAGCAACCAGATGTGGCTACATCTGCAGTCGGATGATAGCATTGGCTCACCTGGGTTTAAAGCTGTTTACCAAGAAATTGAAAAGGGAGGGTGTGGGGATCCTGGAATCCCCGCCTATGGGAAGCGGACGGGCAGCAGTTTCCTCCATGGAGATACACTCACCTTTGAATGCCCGGCGGCCTTTGAGCTGGTGGGGGAGAGAGTTATCACCTGTCAGCAGAACAATCAGTGGTCTGGCAAC
AAGCCCAGCTGTGTATTTTCATGTTTCTTCAACTTTACGGCATCATCTGGGATTATTCTGT
CACCAAATTATCCAGAGGAATATGGGAACAACATGAACTGTGTCTGGTTGATTATCTCG
GAGCCAGGAAGTCGAATTCACCTAATCTTTAATGATTTTGATGTTGAGCCTCAGTTTGAC
TTTCTCGCGGTCAAGGATGATGGCATTTCTGACATAACTGTCCTGGGTACTTTTTCTGGC
AATGAAGTGCCTTCCCAGCTGGCCAGCAGTGGGCATATAGTTCGCTTGGAATTTCAGTC
TGACCATTCCACTACTGGCAGAGGGTTCAACATCACTTACACCACATTTGGTCAGAATG
AGTGCCATGATCCTGGCATTCCTATAAACGGACGACGTTTTGGTGACAGGTTTCTACTC
GGGAGCTCGGTTTCTTTCCACTGTGATGATGGCTTTGTCAAGACCCAGGGATCCGAGTC
CATTACCTGCATACTGCAAGACGGGAACGTGGTCTGGAGCTCCACCGTGCCCCGCTGT
GAAGCTCCATGTGGTGGACATCTGACAGCGTCCAGCGGAGTCATTTTGCCTCCTGGATG
GCCAGGATATTATAAGGATTCTTTACATTGTGAATGGATAATTGAAGCAAAACCAGGCCA
CTCTATCAAAATAACTTTTGACAGATTTCAGACAGAGGTCAATTATGACACCTTGGAGG
TCAGAGATGGGCCAGCCAGTTCGTCCCCACTGATCGGCGAGTACCACGGCACCCAGGC
ACCCCAGTTCCTCATCAGCACCGGGAACTTCATGTACCTGCTGTTCACCACTGACAACA
GCCGCTCCAGCATCGGCTTCCTCATCCACTATGAGAGTGTGACGCTTGAGTCGGATTCC
TGCCTGGACCCGGGCATCCCTGTGAACGGCCATCGCCACGGTGGAGACTTTGGCATCA
GGTCCACAGTGACTTTCAGCTGTGACCCGGGGTACACACTAAGTGACGACGAGCCCCT
CGTCTGTGAGAGGAACCACCAGTGGAACCACGCCTTGCCCAGCTGCGACGCTCTATGT
GGAGGCTACATCCAAGGGAAGAGTGGAACAGTCCTTTCTCCTGGGTTTCCAGATTTTTA
TCCAAACTCTCTAAACTGCACGTGGACCATTGAAGTGTCTCATGGGAAAGGAGTTCAA
ATGATCTTTCACACCTTTCATCTTGAGAGTTCCCACGACTATTTACTGATCACAGAGGAT
GGAAGTTTTTCCGAGCCCGTTGCCAGGCTCACCGGGTCGGTGTTGCCTCATACGATCAA
GGCAGGCCTGTTTGGAAACTTCACTGCCCAGCTTCGGTTTATATCAGACTTCTCAATTTC
GTACGAGGGCTTCAATATCACATTTTCAGAATATGACCTGGAGCCATGTGATGATCCTGG
AGTCCCTGCCTTCAGCCGAAGAATTGGTTTTCACTTTGGTGTGGGAGACTCTCTGACGT
TTTCCTGCTTCCTGGGATATCGTTTAGAAGGTGCCACCAAGCTTACCTGCCTGGGTGGG
GGCCGCCGTGTGTGGAGTGCACCTCTGCCAAGGTGTGTGGCCGAATGTGGAGCAAGTG
TCAAAGGAAATGAAGGAACATTACTGTCTCCAAATTTTCCATCCAATTATGATAATAACC
ATGAGTGTATCTATAAAATAGAAACAGAAGCCGGCAAGGGCATCCACCTTAGAACACG
AAGCTTCCAGCTGTTTGAAGGAGATACTCTAAAGGTATATGATGGAAAAGACAGTTCCT
CACGTCCACTGGGCACGTTCACTAAAAATGAACTTCTGGGGCTGATCCTAAACAGCAC
ATCCAATCACCTGTGGCTAGAGTTCAACACCAATGGATCTGACACCGACCAAGGTTTTC
AACTCACCTATACCAGTTTTGATCTGGTAAAATGTGAGGATCCGGGCATCCCTAACTACG
GCTATAGGATCCGTGATGAAGGCCACTTTACCGACACTGTAGTTCTGTACAGTTGCAAC
CCGGGGTACGCCATGCATGGCAGCAACACCCTGACCTGTTTGAGTGGAGACAGGAGAG
TGTGGGACAAACCACTACCTTCGTGCATAGCGGAATGTGGTGGTCAGATCCATGCAGCC
ACATCAGGACGAATATTGTCCCCTGGCTATCCAGCTCCGTATGACAACAACCTCCACTG
CACCTGGATTATAGAGGCAGACCCAGGAAAGACCATTAGCCTCCATTTCATTGTTTTCG
ACACGGAGATGGCTCACGACATCCTCAAGGTCTGGGACGGGCCGGTGGACAGTGACAT
CCTGCTGAAGGAGTGGAGTGGCTCCGCCCTTCCGGAGGACATCCACAGCACCTTCAAC
TCACTCACCCTGCAGTTCGACAGCGACTTCTTCATCAGCAAGTCTGGCTTCTCCATCCA
GTTCTCCACCTCAATTGCAGCCACCTGTAACGATCCAGGTATGCCCCAAAATGGCACCC
GCTATGGAGACAGCAGAGAGGCTGGAGACACCGTCACATTCCAGTGTGACCCTGGCTA
TCAGCTCCAAGGACAAGCCAAAATCACCTGTGTGCAGCTGAATAACCGGTTCTTTTGG
CAACCAGACCCTCCTACATGCATAGCTGCTTGTGGAGGGAATCTGACGGGCCCAGCAG
GTGTTATTTTGTCACCCAACTACCCACAGCCGTATCCTCCTGGGAAGGAATGTGACTGG
AGAGTAAAAGTGAACCCGGACTTTGTCATCGCCTTGATATTCAAAAGTTTCAACATGGA
GCCCAGCTATGACTTCCTACACATCTATGAAGGGGAAGATTCCAACAGCCCCCTCATTG
GGAGTTACCAGGGCTCTCAGGCCCCAGAAAGAATAGAGAGTAGCGGAAACAGCCTGT
TTCTGGCATTTCGGAGTGATGCCTCCGTGGGCCTTTCAGGGTTCGCCATTGAATTTAAA
GAGAAACCACGGGAAGCTTGTTTTGACCCAGGAAATATAATGAATGGGACAAGAGTTG
GAACAGACTTCAAGCTTGGCTCCACCATCACCTACCAGTGTGACTCTGGCTATAAGATT
CTTGACCCCTCATCCATCACCTGTGTGATTGGGGCTGATGGGAAACCCTCCTGGGACCA
AGTGCTGCCCTCCTGCAATGCTCCCTGTGGAGGCCAGTACACGGGATCAGAAGGGGTA
GTTTTATCACCAAACTACCCCCATAATTACACAGCTGGTCAAATATGCCTCTATTCCATCA
CGGTACCAAAGGAATTCGTGGTCTTTGGACAGTTTGCCTATTTCCAGACAGCCCTGAAT
GATTTGGCAGAATTATTTGATGGAACCCATGCACAGGCCAGACTTCTCAGCTCACTCTC
GGGGTCTCACTCAGGGGAAACATTGCCCTTGGCTACGTCAAATCAAATTCTGCTCCGAT
TCAGTGCAAAGAGCGGTGCCTCTGCCCGCGGCTTCCACTTCGTGTATCAAGCTGTTCCT
CGTACCAGTGACACCCAATGCAGCTCTGTCCCCGAGCCCAGATACGGAAGGAGAATTG
GTTCTGAGTTTTCTGCCGGCTCCATCGTCCGATTCGAGTGCAACCCGGGATACCTGCTT
CAGGGTTCCACGGCGCTCCACTGCCAGTCCGTGCCCAACGCCTTGGCACAGTGGAACG
ACACGATCCCCAGCTGTGTGGTACCCTGCAGTGGCAATTTCACTCAACGAAGAGGTAC
AATCCTGTCCCCCGGCTACCCTGAGCCATACGGAAACAACTTGAACTGTATATGGAAGA
TCATAGTTACGGAGGGCTCGGGAATTCAGATCCAAGTGATCAGTTTTGCCACGGAGCA
GAACTGGGACTCCCTTGAGATCCACGATGGTGGGGATGTGACCGCACCCAGACTGGGA
AGCTTCTCAGGCACCACAGTACCGGCACTGCTGAACAGTACTTCCAACCAACTCTACC
TGCATTTCCAGTCTGACATTAGTGTGGCAGCTGCTGGTTTCCACCTGGAATACAAAACT
GTAGGTCTTGCTGCATGCCAAGAACCAGCCCTCCCCAGCAACAGCATCAAAATCGGAG
ATCGGTACATGGTGAACGACGTGCTCTCCTTCCAGTGCGAGCCCGGGTACACCCTGCA
GGGCCGTTCCCACATTTCCTGTATGCCAGGGACCGTTCGCCGTTGGAACTATCCGTCTC
CCCTGTGCATTGCAACCTGTGGAGGGACGCTGAGCACCTTGGGTGGTGTGATCCTGAG
CCCCGGCTTCCCAGGTTCTTACCCCAACAACTTAGACTGCACCTGGAGGATCTCATTAC
CCATCGGCTATGGTGCACATATTCAGTTTCTGAATTTTTCTACCGAAGCTAATCATGACTT
CCTTGAAATTCAAAATGGACCTTACCACACCAGCCCCATGATTGGACAATTTAGCGGCA
CGGATCTCCCCGCGGCCCTGCTGAGCACAACGCATGAAACCCTCATCCACTTTTATAGT
GACCATTCGCAAAACCGGCAAGGATTTAAACTTGCTTACCAAGCCTATGAATTACAGAA
CTGTCCAGATCCACCCCCATTTCAGAATGGGTACATGATCAACTCGGATTACAGCGTGG
GGCAATCAGTATCTTTCGAGTGTTATCCTGGGTACATTCTAATAGGCCATCCTGTCCTCA
CTTGTCAGCATGGGATCAACAGAAACTGGAACTACCCTTTTCCAAGATGTGATGCCCCT
TGTGGGTACAACGTAACTTCTCAGAACGGCACCATCTACTCCCCTGGCTTTCCTGATGA
GTATCCGATCCTGAAGGACTGCATTTGGCTCATCACGGTGCCTCCAGGGCACGGAGTTT
ACATCAACTTCACCCTGTTACAGACGGAAGCTGTCAACGATTACATTGCTGTTTGGGAC
GGTCCCGATCAGAACTCACCCCAGCTGGGAGTTTTCAGTGGCAACACAGCCCTCGAAA
CGGCGTATAGCTCCACCAACCAAGTCCTGCTCAAGTTCCACAGCGACTTTTCAAATGGA
GGCTTCTTTGTCCTCAATTTCCACGCATTTCAGCTCAAGAAATGTCAACCTCCCCCAGC
GGTTCCACAGGCAGAAATGCTTACTGAGGATGATGATTTCGAAATAGGAGATTTTGTGA
AGTACCAGTGCCACCCCGGGTACACCTTGGTGGGGACCGACATTCTGACTTGCAAGCT
CAGTTCCCAGTTGCAGTTTGAGGGTTCTCTCCCAACATGTGAAGCACAATGCCCAGCA
AATGAAGTCCGGACTGGATCATCGGGAGTCATTCTCAGTCCAGGGTATCCGGGTAATTA
TTTTAACTCCCAGACTTGCTCTTGGAGTATTAAAGTGGAACCAAACTACAACATTACCA
TCTTTGTGGACACATTTCAAAGTGAAAAGCAGTTTGATGCACTGGAAGTGTTTGATGGT
TCTTCTGGGCAAAGTCCTCTGCTAGTAGTCTTAAGTGGGAATCATACTGAACAATCAAA
TTTTACAAGCAGGAGTAATCAGTTATATCTCCGCTGGTCCACTGACCATGCCACCAGTA
AGAAAGGATTCAAGATTCGCTATGCAGCACCTTACTGCAGTTTGACCCACCCCCTGAAG
AATGGGGGTATTCTAAACAGGACTGCAGGAGCGGTTGGAAGCAAAGTGCATTATTTTTG
CAAGCCTGGATACCGAATGGTCGGCCACAGCAATGCAACCTGTAGACGAAACCCACTT
GGCATGTACCAGTGGGACTCCCTCACGCCACTCTGCCAGGCTGTGTCCTGTGGAATCCC
AGAATCCCCAGGAAACGGTTCATTTACCGGGAACGAGTTCACTTTGGACAGTAAAGTG
GTCTATGAATGTCATGAGGGCTTCAAGCTTGAATCCAGCCAGCAAGCAACAGCCGTGT
GTCAAGAAGATGGGTTGTGGAGTAACAAGGGGAAGCCGCCCACGTGTAAGCCGGTCG
CTTGCCCCAGCATTGAAGCTCAGCTCTCAGAACATGTCATCTGGAGGCTGGTTTCAGGA
TCCTTGAATGAGTACGGTGCTCAAGTATTGCTGAGCTGCAGTCCTGGTTACTACTTAGA
AGGCTGGAGGCTCCTGCGGTGCCAGGCCAATGGGACGTGGAACATAGGAGATGAGAG
GCCAAGCTGTCGAGTTATCTCGTGTGGAAGCCTTTCCTTTCCCCCAAATGGCAACAAGA
TTGGAACGTTGACAGTTTATGGGGCCACAGCTATATTTACGTGCAACACCGGCTACACG
CTTGTGGGGTCTCATGTCAGAGAGTGCTTGGCAAATGGGCTCTGGAGCGGCAGCGAAA
CTCGATGTCTGGCTGGCCACTGCGGTTCCCCAGACCCGATTGTGAACGGTCACATTAGT
GGAGATGGCTTCAGTTACAGAGACACGGTGGTTTACCAGTGCAATCCTGGTTTCCGGCT
TGTGGGAACTTCCGTGAGGATATGCCTGCAAGACCACAAGTGGTCTGGACAAACGCCT
GTCTGTGTCCCCATCACATGTGGTCACCCTGGAAACCCTGCCCACGGATTCACTAATGG
CAGTGAGTTCAACCTGAATGATGTCGTGAATTTCACCTGCAACACGGGCTATTTGCTGC
AGGGCGTGTCTCGAGCCCAGTGTCGGAGCAACGGCCAGTGGAGTAGCCCTCTGCCCAC
GTGTCGAGTGGTGAACTGTTCTGATCCAGGCTTTGTGGAAAATGCCATTCGTCACGGGC
AACAGAACTTCCCTGAGAGTTTTGAGTATGGAATGAGTATCCTGTACCATTGCAAGAAG
GGATTTTACTTGCTGGGATCTTCAGCCTTGACCTGTATGGCAAATGGCTTATGGGACCGA
TCCCTGCCCAAGTGTTTGGCTATATCGTGTGGACACCCAGGGGTCCCTGCCAACGCCGT
CCTCACTGGAGAGCTGTTTACCTATGGCGCCGTCGTGCACTACTCCTGCAGAGGGAGC
GAGAGCCTCATAGGCAACGACACGAGAGTGTGCCAGGAAGACAGTCACTGGAGCGGG
GCACTGCCCCACTGCACAGGAAATAATCCTGGATTCTGTGGTGATCCGGGGACCCCAG
CACATGGGTCTCGGCTTGGTGATGACTTTAAGACAAAGAGTCTTCTCCGCTTCTCCTGT
GAAATGGGGCACCAGCTGAGGGGCTCCCCTGAACGCACGTGTTTGCTCAATGGGTCAT
GGTCAGGACTGCAGCCGGTGTGTGAGGCCGTGTCCTGTGGCAACCCTGGCACACCCAC
CAACGGAATGATTGTCAGTAGTGATGGCATTCTGTTCTCCAGCTCGGTCATCTATGCCTG
CTGGGAAGGCTACAAGACCTCAGGGCTCATGACACGGCATTGCACAGCCAATGGGACC
TGGACAGGCACTGCTCCCGACTGCACAATTATAAGTTGTGGGGATCCAGGCACACTAG
CAAATGGCATCCAGTTTGGGACCGACTTCACCTTCAACAAGACTGTGAGCTATCAGTGT
AACCCAGGCTATGTCATGGAAGCAGTCACATCCGCCACTATTCGCTGTACCAAAGACGG
CAGGTGGAATCCGAGCAAACCTGTCTGCAAAGCCGTGCTGTGTCCTCAGCCGCCGCCG
GTGCAGAATGGAACAGTGGAGGGAAGTGATTTCCGCTGGGGCTCCAGCATAAGTTACA
GCTGCATGGACGGTTACCAGCTCTCTCACTCCGCCATCCTCTCCTGTGAAGGTCGCGGG
GTGTGGAAAGGAGAGATCCCCCAGTGTCTCCCTGTGTTCTGCGGAGACCCTGGCATCC
CCGCAGAAGGGCGACTTAGTGGGAAAAGTTTCACCTATAAGTCCGAAGTCTTCTTCCA
GTGCAAATCTCCATTTATACTCGTGGGATCCTCCAGAAGAGTCTGCCAAGCTGACGGCA
CGTGGAGCGGCATACAACCCACCTGCATTGATCCTGCTCATAACACCTGCCCAGACCCT
GGTACGCCACACTTTGGAATACAGAATAGCTCCAGAGGCTATGAGGTTGGAAGCACGG
TTTTTTTCAGGTGCAGAAAAGGCTACCATATTCAAGGTTCCACGACTCGCACCTGCCTT
GCCAATTTAACATGGAGTGGGATACAGACCGAATGTATACCTCATGCCTGCAGACAGCC
AGAAACCCCGGCACACGCGGATGTGAGAGCCATCGATCTTCCTACTTTCGGCTACACCT
TAGTGTACACCTGCCATCCAGGCTTTTTCCTCGCAGGGGGATCTGAGCACAGAACATGT
AAAGCAGACATGAAATGGACAGGAAAGTCGCCTGTGTGTAAAAGTAAAGGAGTGAGA
GAAGTTAATGAAACAGTTACTAAAACTCCAGTTCCTTCAGATGTCTTTTTCGTCAATTCA
CTGTGGAAGGGGTATTATGAATATTTAGGGAAAAGACAACCCGCCACTCTAACTGTTGA
CTGGTTCAATGCAACAAGCAGTAAGGTGAATGCCACCTTCAGCGAAGCCTCGCCAGTG
GAGCTGAAGTTGACAGGCATTTACAAGAAGGAGGAGGCCCACTTACTCCTGAAAGCTT
TTCAAATTAAAGGCCAGGCAGATATTTTTGTAAGCAAGTTCGAAAATGACAACTGGGG
ACTAGATGGTTATGTGTCATCTGGACTTGAAAGAGGAGGATTTACTTTTCAAGGTGACA
TTCATGGAAAAGACTTTGGAAAATTTAAGCTAGAAAGGCAAGATCCTTTAAACCCAGAT
CAAGACTCTTCCAGTCATTACCACGGCACCAGCAGTGGCTCTGTGGCGGCTGCCATTCT
GGTTCCTTTCTTTGCTCTAATTTTATCAGGGTTTGCATTTTACCTCTACAAACACAGAAC
GAGACCAAAAGTTCAATACAATGGCTATGCTGGGCATGAAAACAGCAATGGACAAGCA
TCGTTTGAAAACCCCATGTATGATACAAACTTAAAACCCACAGAAGCCAAGGCTGTGA
GGTTTGACACAACTCTGAACACAGTCTGTACAGTGGTATAGCCCTCAGTGCCCCAACA
GGACTGATTCATAGCCATACCTCTGATGGACAAGCAGTGATTCCTTTGGTGCCATATACC
ACTCTCCCTTCCACTCTGGCTTTACTGCAGCGATCTTCAACCTTGTCTACTGGCATAAGT
GCAGCGGGGATCTCTACTCAAATGTGTCAGGGTCTTCTACGGATCAAACTACACATGCG
TTTTCATTCCAAAAGTGGGTTCTAAATGCCTGGCTGCATCTGTATGAAATCAAGGCACA
CTCCAGGAAGACTGCCACGTCGCGCCAACACGTCATACTCAATGCCTCAGACTTTCATA
TTTCTGTGTTGCTGAGATGCCTTTCAATGCAATCGTCTGGGCTCGTGGATATGTCCCTCA
GGTGCGGTGACAGAATGGTGGCACCACGATATGTGTTCTCTTGTGTTGTTTTTCCTTTTT
AAACCCCCATGAACACGAATACTCTGAAAAAAATAAAAAGCTTTCTGGAAGAAGACAC
CTTTCTGATAGAGGCTCACACCTACAAATGCTTCACTCTGTCCTTCCGAGACCTGACAA
GCTTTGAGGACCTCACAGCTCCCCTGTGTGTTCATCTCTAGGGATGTTTGCAATTTCCCA
GTCAGCTGTTCTGTCGCAGAATGTTTAATGCACAATTTTTTGCACTAGTGTGTTATGAAT
GACTAAGATTCTGATAAAAAAAATAAATTATTTACACAGGGTTTATACACACTATCCATT
GTATATAAGCATTATTTCATATTATCAAGCTAAACATTCCCCCATCAGCTTAGTTGGAGTG
TTAGGGAAAAGTATTCCTAGATATGGCACAGATTTTAAAAGGAAATACAGTATTGAAGA
GATTTATTTTATTATTGCTTCAATTAGCTCCATTTACGTGTTGAATTCATTGAAGAGGTCC
AATGAGAAAAAAACAGAAGCCTCCTTATTTCACACGTTTTCCTCCTTTAGTACCATCCT
CATCCAATTACTGTCTCTCTGATACTACTTAATAGCAGGGGGTTTGCAGAAATTTCTGTT
TGCCATGTAAAACTGTGAATAGTAATTTATTTTAGATAGTCGATGAACTTGTGGGTTTTA
GCTCACAATGCAGCCTTCCCTTTTGCAGTGTTTTTTTTTTGTTTTTTTTTTTTTTTGTCTT
TTACTGTGCCATCGATCTTTGATATTGCATTGAAAGACAATATACCACAGTAGCACCTTG
AACTCAGTGAAAATTGTTCAGGATCAAAATACCAAGTGTTCTTTTAGAGGGAAGGAAA
AAGTACACACACTCTCCTCTCACAATGATATATTTTATACATTCATTTGTTATTTGTTTCAT
GCTTTATGATTCCAGATGGAAAGGTAATTTCAGTGACTTTTCAAGTTTAAATTCCATTATA
GGTAAATGATAAGTTATGATGCAAATAAAATCTATAAGATCCCCAGGGCAAATAAAAATC
AAAACATGAAGTAGAAGATGTGGCCGTGAGGTAGTTTATGTAACAAATTCAAAGTGAA
AATCATGTTTACTTTTACTTATACTTATTTGATAAAAATATTTTTGAAACGATAGTACTTAT
TTTATTATTTGATATTTCAGTTCCTATTCAATTGTGGCAGATTTTCTCTGTTTCACATTTTA
GATTGGCGTTGGTAATAGAAATGTCAGAATGTTCAAATTGGCCTTCACGTTGTCGGAGT
GAACACATTGACACCTAGCTTTAAGACTGATTTATCTGTTGGTGTACTGAAGGTTTCCAT
GTAGGACTTCAAATGTGGAAAAGGAAAAGCAGTCAGGAAAATGGGGCATTCTTTGGA
GAGTCACGCGTTTTGATTCGGACATTTCCGTAGAGCTCGGCTCCCAGTGTTGTGTTCCT
CGGTCGAAAGGGTCTCTGCTGTTTGGGGACTCACTGGCCTCTCCTAGGGACTCCTTTGT
CTTGTGAACCCCACGCTGTTGGATTCTGTATCATTATGCTGAATTCTCTGCACAGTTTTC
CCTGGCCAACCTGCCCACATCCTTGGAGATTTGCTTTGCCAGTGGGAATCCTTACATTG
CTGTTTCACAGTAGACGGGACGAGGTCAGCGGGAGTCGTGCTCCTAACACACACATTG
AACGAAACAGAAGATGATTGAAAGTGTGAGGAGGCTCGTGTGCAAGGGAGAACAGGG
TTACTATACATATTAGTGTATATATATACATACATATATATATATATATATTGTACATATCTAAG
TTTGAGTCATTCAAACTAGGTGCAAAATGCTGACTTCAGAGTCTGAATTAACATCTCTG
TTCCCATATCCCTGACCTGCTCCCTGGTCAACGATGCTATGAAATCCTGAAATGACAGG
ACATACATACATACAAGAAACCACATATCAAATTAGATATGATTTTCCTTTGTGTGCAAA
GTCAAACTGTCCTAGGGTTGCCAGTTTGAAGCATGTTATTTAAATGAAAAAAAAAATCA
GTGAAATTCTCGTGTGAGAATTCTGCCTAGTTTCTTCCTAAGGTTGTGTGCAGTGTTGA
ACGGCGTCTCCGCAAGGTGTTGGAGGATCTCATTTTAGGGCAGTCAGGAGCTGTGCTT
GCTGAGTTAGGTCTAGAAGACTCTTCCCTGAAGGCAACGGGAACACGCGTGAGGGAC
GCGACCACACACTAACAGAGGACACGTGCTTCAGAGCTGTTTAAAACTGCTGCTTGTT
TTACACACACATCTTGCCTTTTTTCAGGCTAGCTGCAATAATTTTTTTCTTCTGTAAAATA
TTTTGTAAACAACAACAAAAAGCTATTATAAAAAGGGGGTAAAAAAAAGAACGCTGGC
ATTATGATCAGGAAAACCCATTGTCATCGCCGACCCTCCCTCCCGTCCCACCACACGCT
GCTGTCACGACGTAGGTGCGAAAGACCTTTTTGTACAGAGATATATTTTTTATGAAGAAT
TTGTAAAATTATTAAATATGCTGTAATTTTTTGATTAATGTAGGTACATTGTTAAAAAATA
AATGTTTTTACAATACAGAACTGTAATTTTCCCAATAATGTAAAATGTACCATCTCTAGCT
GATTTTCAGTTCCAATCCTATTACACATGTATTAATATTAAAGTGGCCTGTTAAAATGAAC
AGTATCTTTTTTTTGTCAAAAAAATTATAAAGAGGGTGTAATATAGCCTGTGCAATGCCA
CCAATCTTTAAAGCAAATCAGAGTTCTAATTAAATATTTAATTTTA
SEQ ID NO:283CSMD1的外显子1的翻译多肽序列MTAWRRFQSLLLLLGLLVLCARLLTAAK
SEQ ID NO:284CSMD1的外显子2的翻译多肽序列
QNCGGLVQGPNGTIESPGFPHGYPNYANCTWIIITGERNRIQLSFHTFALEEDFDILSVYDGQPQQGNLKV
SEQ ID NO:285CSMD1的外显子3的翻译多肽序列
LSGFQLPSSIVSTGSILTLWFTTDFAVSAQGFKALYE
SEQ ID NO:286CSMD1的外显子4的翻译多肽序列
LPSHTCGNPGEILKGVLHGTRFNIGDKIRYSCLPGYILEGHAILTCIVSPGNGASWDFPAPFCR
SEQ ID NO:287CSMD1的外显子5的翻译多肽序列
EGACGGTLRGTSSSISSPHFPSEYENNADCTWTILAEPGDTIALVFTDFQLEEGYDFLEISGTEAPSI
SEQ ID NO:288CSMD1的外显子6的翻译多肽序列
LTGMNLPSPVISSKNWLRLHFTSDSNHRRKGFNAQFQ
SEQ ID NO:289CSMD1的外显子7的翻译多肽序列
KKAIELKSRGVKMLPSKDGSHKNSV
SEQ ID NO:290CSMD1的外显子8的翻译多肽序列
SQGGVALVSDMCPDPGIPENGRRAGSDF
SEQ ID NO:291CSMD1的外显子9的翻译多肽序列
VGANVQFSCEDNYVLQGSKSITCQRVTETLAAWSDHRPICR
SEQ ID NO:292CSMD1的外显子10的翻译多肽序列
RTCGSNLRGPSGVITSPNYPVQYEDNAHCVWVITTTDPDK
SEQ ID NO:293CSMD1的外显子11的翻译多肽序列
VIKLAFEEFELERGYDTLTVGDAGKVGDTRSVLY
SEQ ID NO:294CSMD1的外显子12的翻译多肽序列
LTGSSVPDLIVSMSNQMWLHLQSDDSIGSPGFKAVYQ
SEQ ID NO:295CSMD1的外显子13的翻译多肽序列
IEKGGCGDPGIPAYGKRTGSSFLHGDTLTFECPAAFELVGERVITCQQNNQWSGNKPSCV
SEQ ID NO:296CSMD1的外显子14的翻译多肽序列
SCFFNFTASSGIILSPNYPEEYGNNMNCVWLIISEPGSRIHLIFNDFDVEPQFDFLAVKDDGISDITVLGTFSGNEVPSQLASSGHIVRLEFQSDHSTTGRGFNITYT
SEQ ID NO:297CSMD1的外显子15的翻译多肽序列
FGQNECHDPGIPINGRRFGDRFLLGSSVSFHCDDGFVKTQGSESITCILQDGNVVWSSTVPRCE
SEQ ID NO:298CSMD1的外显子16的翻译多肽序列
PCGGHLTASSGVILPPGWPGYYKDSLHCEWIIEAKPGHSIKITFD
SEQ ID NO:299CSMD1的外显子17的翻译多肽序列
FQTEVNYDTLEVRDGPASSSPLIGEYHGTQAPQFLISTGNFMYLLFTTDNSRSSIGFLIHYE
SEQ ID NO:300CSMD1的外显子18的翻译多肽序列
VTLESDSCLDPGIPVNGHRHGGDFGIRSTVTFSCDPGYTLSDDEPLVCERNHQWNHALPSCD
SEQ ID NO:301CSMD1的外显子19的翻译多肽序列
LCGGYIQGKSGTVLSPGFPDFYPNSLNCTWTIEVSHGK
SEQ ID NO:302CSMD1的外显子20的翻译多肽序列
VQMIFHTFHLESSHDYLLITEDGSFSEPVARLTGSVLPHTIKAGLFGNFTAQLRFISDFSISYEGFNITFS
SEQ ID NO:303CSMD1的外显子21的翻译多肽序列
YDLEPCDDPGVPAFSRRIGFHFGVGDSLTFSCFLGYRLEGATKLTCLGGGRRVWSAPLPRCV
SEQ ID NO:304CSMD1的外显子22的翻译多肽序列ECGASVKGNEGTLLSPNFPSNYDNNHECIYKIETEAGKGIHLRTRSFQLFEGDTLK
SEQ ID NO:305CSMD1的外显子23的翻译多肽序列
VYDGKDSSSRPLGTFTKNELLGLILNSTSNHLWLEFNTNGSDTDQGFQLTYT
SEQ ID NO:306CSMD1的外显子24的翻译多肽序列
FDLVKCEDPGIPNYGYRIRDEGHFTDTVVLYSCNPGYAMHGSNTLTCLSGDRRVWDKPLPSCI
SEQ ID NO:307来自外显子24-70的全部47个外显子按顺序排列的翻译多肽序列
SEQ ID NO:308全蛋白质序列
MTAWRRFQSLLLLLGLLVLCARLLTAAKGQNCGGLVQGPNGTIESPGFPHGYPNYANCTWIIITGERNRIQLSFHTFALEEDFDILSVYDGQPQQGNLKVRLSGFQLPSSIVSTGSILTLWFTTDFAVSAQGFKALYEVLPSHTCGNPGEILKGVLHGTRFNIGDKIRYSCLPGYILEGHAILTCIVSPGNGASWDFPAPFCRAEGACGGTLRGTSSSISSPHFPSEYENNADCTWTILAEPGDTIALVFTDFQLEEGYDFLEISGTEAPSIWLTGMNLPSPVISSKNWLRLHFTSDSNHRRKGFNAQFQVKKAIELKSRGVKMLPSKDGSHKNSVLSQGGVALVSDMCPDPGIPENGRRAGSDFRVGANVQFSCEDNYVLQGSKSITCQRVTETLAAWSDHRPICRARTCGSNLRGPSGVITSPNYPVQYEDNAHCVWVITTTDPDKVIKLAFEEFELERGYDTLTVGDAGKVGDTRSVLYVLTGSSVPDLIVSMSNQMWLHLQSDDSIGSPGFKAVYQEIEKGGCGDPGIPAYGKRTGSSFLHGDTLTFECPAAFELVGERVITCQQNNQWSGNKPSCVFSCFFNFTASSGIILSPNYPEEYGNNMNCVWLIISEPGSRIHLIFNDFDVEPQFDFLAVKDDGISDITVLGTFSGNEVPSQLASSGHIVRLEFQSDHSTTGRGFNITYTTFGQNECHDPGIPINGRRFGDRFLLGSSVSFHCDDGFVKTQGSESITCILQDGNVVWSSTVPRCEAPCGGHLTASSGVILPPGWPGYYKDSLHCEWIIEAKPGHSIKITFDRFQTEVNYDTLEVRDGPASSSPLIGEYHGTQAPQFLISTGNFMYLLFTTDNSRSSIGFLIHYESVTLESDSCLDPGIPVNGHRHGGDFGIRSTVTFSCDPGYTLSDDEPLVCERNHQWNHALPSCDALCGGYIQGKSGTVLSPGFPDFYPNSLNCTWTIEVSHGKGVQMIFHTFHLESSHDYLLITEDGSFSEPVARLTGSVLPHTIKAGLFGNFTAQLRFISDFSISYEGFNITFSEYDLEPCDDPGVPAFSRRIGFHFGVGDSLTFSCFLGYRLEGATKLTCLGGGRRVWSAPLPRCVAECGASVKGNEGTLLSPNFPSNYDNNHECIYKIETEAGKGIHLRTRSFQLFEGDTLKVYDGKDSSSRPLGTFTKNELLGLILNSTSNHLWLEFNTNGSDTDQGFQLTYTSFDLVKCEDPGIPNYGYRIRDEGHFTDTVVLYSCNPGYAMHGSNTLTCLSGDRRVWDKPLPSCIAECGGQIHAATSGRILSPGYPAPYDNNLHCTWIIEADPGKTISLHFIVFDTEMAHDILKVWDGPVDSDILLKEWSGSALPEDIHSTFNSLTLQFDSDFFISKSGFSIQFSTSIAATCNDPGMPQNGTRYGDSREAGDTVTFQCDPGYQLQGQAKITCVQLNNRFFWQPDPPTCIAACGGNLTGPAGVILSPNYPQPYPPGKECDWRVKVNPDFVIALIFKSFNMEPSYDFLHIYEGEDSNSPLIGSYQGSQAPERIESSGNSLFLAFRSDASVGLSGFAIEFKEKPREACFDPGNIMNGTRVGTDFKLGSTITYQCDSGYKILDPSSITCVIGADGKPSWDQVLPSCNAPCGGQYTGSEGVVLSPNYPHNYTAGQICLYSITVPKEFVVFGQFAYFQTALNDLAELFDGTHAQARLLSSLSGSHSGETLPLATSNQILLRFSAKSGASARGFHFVYQAVPRTSDTQCSSVPEPRYGRRIGSEFSAGSIVRFECNPGYLLQGSTALHCQSVPNALAQWNDTIPSCVVPCSGNFTQRRGTILSPGYPEPYGNNLNCIWKIIVTEGSGIQIQVISFATEQNWDSLEIHDGGDVTAPRLGSFSGTTVPALLNSTSNQLYLHFQSDISVAAAGFHLEYKTVGLAACQEPALPSNSIKIGDRYMVNDVLSFQCEPGYTLQGRSHISCMPGTVRRWNYPSPLCIATCGGTLSTLGGVILSPGFPGSYPNNLDCTWRISLPIGYGAHIQFLNFSTEANHDFLEIQNGPYHTSPMIGQFSGTDLPAALLSTTHETLIHFYSDHSQNRQGFKLAYQAYELQNCPDPPPFQNGYMINSDYSVGQSVSFECYPGYILIGHPVLTCQHGINRNWNYPFPRCDAPCGYNVTSQNGTIYSPGFPDEYPILKDCIWLITVPPGHGVYINFTLLQTEAVNDYIAVWDGPDQNSPQLGVFSGNTALETAYSSTNQVLLKFHSDFSNGGFFVLNFHAFQLKKCQPPPAVPQAEMLTEDDDFEIGDFVKYQCHPGYTLVGTDILTCKLSSQLQFEGSLPTCEAQCPANEVRTGSSGVILSPGYPGNYFNSQTCSWSIKVEPNYNITIFVDTFQSEKQFDALEVFDGSSGQSPLLVVLSGNHTEQSNFTSRSNQLYLRWSTDHATSKKGFKIRYAAPYCSLTHPLKNGGILNRTAGAVGSKVHYFCKPGYRMVGHSNATCRRNPLGMYQWDSLTPLCQAVSCGIPESPGNGSFTGNEFTLDSKVVYECHEGFKLESSQQATAVCQEDGLWSNKGKPPTCKPVACPSIEAQLSEHVIWRLVSGSLNEYGAQVLLSCSPGYYLEGWRLLRCQANGTWNIGDERPSCRVISCGSLSFPPNGNKIGTLTVYGATAIFTCNTGYTLVGSHVRECLANGLWSGSETRCLAGHCGSPDPIVNGHISGDGFSYRDTVVYQCNPGFRLVGTSVRICLQDHKWSGQTPVCVPITCGHPGNPAHGFTNGSEFNLNDVVNFTCNTGYLLQGVSRAQCRSNGQWSSPLPTCRVVNCSDPGFVENAIRHGQQNFPESFEYGMSILYHCKKGFYLLGSSALTCMANGLWDRSLPKCLAISCGHPGVPANAVLTGELFTYGAVVHYSCRGSESLIGNDTRVCQEDSHWSGALPHCTGNNPGFCGDPGTPAHGSRLGDDFKTKSLLRFSCEMGHQLRGSPERTCLLNGSWSGLQPVCEAVSCGNPGTPTNGMIVSSDGILFSSSVIYACWEGYKTSGLMTRHCTANGTWTGTAPDCTIISCGDPGTLANGIQFGTDFTFNKTVSYQCNPGYVMEAVTSATIRCTKDGRWNPSKPVCKAVLCPQPPPVQNGTVEGSDFRWGSSISYSCMDGYQLSHSAILSCEGRGVWKGEIPQCLPVFCGDPGIPAEGRLSGKSFTYKSEVFFQCKSPFILVGSSRRVCQADGTWSGIQPTCIDPAHNTCPDPGTPHFGIQNSSRGYEVGSTVFFRCRKGYHIQGSTTRTCLANLTWSGIQTECIPHACRQPETPAHADVRAIDLPTFGYTLVYTCHPGFFLAGGSEHRTCKADMKWTGKSPVCKSKGVREVNETVTKTPVPSDVFFVNSLWKGYYEYLGKRQPATLTVDWFNATSSKVNATFSEASPVELKLTGIYKKEEAHLLLKAFQIKGQADIFVSKFENDNWGLDGYVSSGLERGGFTFQGDIHGKDFGKFKLERQDPLNPDQDSSSHYHGTSSGSVAAAILVPFFALILSGFAFYLYKHRTRPKVQYNGYAGHENSNGQASFENPMYDTNLKPTEAKAVRFDTTLNTVCTVV-
SEQ ID NO:309CSMD1的全部23个外显子1-23按顺序排列的多核苷酸序列
SEQ ID NO:310来自CSMD1的全部23个外显子1-23按顺序排列的翻译多肽序列
PTN序列信息
SEQ ID NO:311PTN-NRG1融合物5’处的PTN外显子4序列
CCAGAACTGGAAGTCTGAAGCGAGCCCTGCACAATGCCGAATGCCAGAAGACTGTCACCATCTCCAAGCCCTGTGGCAAACTGACCAAGCCCAAACCTCAAG
SEQ ID NO:312PTN-NRG1融合物3’处的NRG1外显子2序列
CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAACCAGTTCTGAATACTCCTCTCTCAGATT
SEQ ID NO:313PTN-NRG1多核苷酸序列
CCAGAACTGGAAGTCTGAAGCGAGCCCTGCACAATGCCGAATGCCAGAAGACTGTCACCATCTCCAAGCCCTGTGGCAAACTGACCAAGCCCAAACCTCAAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAACCAGTTCTGAATACTCCTCTCTCAGATT
SEQ ID NO:314PTN-NRG1多肽序列
RTGSLKRALHNAECQKTVTISKPCGKLTKPKPQALPPRLKEMKSQESAAGSKLVLRCETSSEYSSLR
SEQ ID NO:315PTN的外显子1
AAGGGGAAATAAGGGACAAGAGAGACCCTCTCATATTGTTTTATATTATTTCATACTCAGAAAAGGAAAGAGAAGCCAAACAAAAGGCAGGTAACCCAGCGCCTAGGAACCAGACCCGAAACCAAGGAACCAGATCTGAAACCAGGCCTGGGCCTGCCTGACCTAAGCCTGGTAGTAAAAATTCCACCCCTGACCTGACCTGGCAACTGTTGTTATCTACAGATTCCAGACATTGTATGGAAGGACACTGTGAAACCTCCCGTTCTGTTCTGTTTCACTCTGACCATCGGTGCTCACAGCCCCTATCACGTACCCCCTGGCTTGCTCAGTCGATCACGACCCTCTCACGTGGACCCCCTTAGAGTTGTTAGCCCTTAAAAGGGACAGAAGTTGAGCACCTGAGGAGCTCAGATTTTAAGACGCTAGGCTGCTGATGCTCCCAGCTGATTAAAGCCACTCCCTTCACTATCTCGGTGTCTCCTGTCCGCGGCTCGTCCTGCTACATTTCTTGGTTCCCTGACCGGCAAGCGAG
SEQ ID NO:316PTN的外显子2
AATGCAGGCTCAACAGTACCAGCAGCAGCGTCGAAAATTTGCAGCTGCCTTCTTGGCATTCATTTTCATACTGGCAGCTGTGGATACTGCTGAAGCAGGGAAGAAAGAGAAACCAG
SEQ ID NO:317PTN的外显子3
AAAAAAAAGTGAAGAAGTCTGACTGTGGAGAATGGCAGTGGAGTGTGTGTGTGCCCACCAGTGGAGACTGTGGGCTGGGCACACGGGAGGGCACTCGGACTGGAGCTGAGTGCAAGCAAACCATGAAGACCCAGAGATGTAAGATCCCCTGCAACTGGAAGAAGCAATTTGGCG
SEQ ID NO:318PTN的外显子4CGGAGTGCAAATACCAGTTCCAGGCCTGGGGAGAATGTGACCTGAACACAGCCCTGAAGACCAGAACTGGAAGTCTGAAGCGAGCCCTGCACAATGCCGAATGCCAGAAGACTGTCACCATCTCCAAGCCCTGTGGCAAACTGACCAAGCCCAAACCTCAAG
SEQ ID NO:319PTN的外显子5
CAGAATCTAAGAAGAAGAAAAAGGAAGGCAAGAAACAGGAGAAGATGCTGGATTAAAAGATGTCACCTGTGGAACATAAAAAGGACATCAGCAAACAGGATCAGTTAACTATTGCATTTATATGTACCGTAGGCTTTGTATTCAAAAATTATCTATAGCTAAGTACACAATAAGCAAAAACAAAAAGAAAAGAAAATTTTTGTAGTAGCGTTTTTTAAATGTATACTATAGTACCAGTAGGGGCTTATAATAAAGGACTGTAATCTTATTTAGGAAGTTGACTTATAGTACATGATAAATGATAGACAATTGAGGTAAGTTTTTTGAAATTATGTGACATTTTACATTAAATTTTTTTTACATTTTTTGGGCAGCAATTTAAATGTTATGACTATGTAAACTACTTCTCTTGTTAGGTAATTTTTTTCACCTAGATTTTTTTCCCAATTGAGAAAAATATATACTAAACAAAATAGCAATAAAACATAATCACTCTATTTGAAGAAAATATCTTGTTTTCTGCCAATAGATTTTTTAAAATGTAGTCAGCAAAATGGGGGTGGGGAAGCAGAGCATGTCCTAGTTCAATGTTGACTTTTTTTTTTTTTAAAGAAAAGCATTAAGACATAAAATTCTTTCACTTTGGCAGAAGCATTTGTTTTCTTGATGAAATTATTTTTCCATCTGAGGAAAAAAATACTAGGAAAATAAATCAAGGTGATGCTGAAAAAAAAA
SEQ ID NO:320PTN的全部5个外显子1-5按顺序排列的多核苷酸序列
SEQ ID NO:321PTN的外显子2的翻译多肽序列
MQAQQYQQQRRKFAAAFLAFIFILAAVDTAEAGKKEKP
SEQ ID NO:322PTN的外显子3的翻译多肽序列
KKVKKSDCGEWQWSVCVPTSGDCGLGTREGTRTGAECKQTMKTQRCKIPCNWKKQFG
SEQ ID NO:323PTN的外显子4的翻译多肽序列
ECKYQFQAWGECDLNTALKTRTGSLKRALHNAECQKTVTISKPCGKLTKPKPQ
SEQ ID NO:324PTN的外显子5
ESKKKKKEGKKQEKMLD
SEQ ID NO:325全蛋白质序列
MQAQQYQQQRRKFAAAFLAFIFILAAVDTAEAGKKEKPEKKVKKSDCGEWQWSVCVPTSGDCGLGTREGTRTGAECKQTMKTQRCKIPCNWKKQFGAECKYQFQAWGECDLNTALKTRTGSLKRALHNAECQKTVTISKPCGKLTKPKPQAESKKKKKEGKKQEKMLD
SEQ ID NO:326PTN的全部4个外显子1-4按顺序排列的多核苷酸序列
SEQ ID NO:327PTN的全部3个外显子2-4按顺序排列的翻译多肽序列
ST14序列信息
SEQ ID NO:328ST14-NRG1融合物5’处的ST14外显子11序列
CAACAGCAACAAGATCACAGTTCGCTTCCACTCAGATCAGTCCTACACCGACACCGGCTTCTTAGCTGAATACCTCTCCTACGACTCCAGTGACC
SEQ ID NO:329ST14-NRG1融合物3’处的NRG1外显子6序列
CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCT
SEQ ID NO:330ST14-NRG1多核苷酸序列
CAACAGCAACAAGATCACAGTTCGCTTCCACTCAGATCAGTCCTACACCGACACCGGCTTCTTAGCTGAATACCTCTCCTACGACTCCAGTGACCCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCT
SEQ ID NO:331ST14-NRG1多肽序列
NSNKITVRFHSDQSYTDTGFLAEYLSYDSSDPTSTSTTGTSHLVKCAEKEKTFCVNGGEC
SEQ ID NO:332ST14的外显子1
GTGAGAGCGGAGCTGCAGCCGGAGAAAGAGGAAGAGGGAGAGAGAGCGCGCCAGGGCGAGGGCACCGCCGCCGGTCGGGCGCGCTGGGCCTGCCCGGAATCCCGCCGCCTGCGCCCCGCGCCCCGCGCCCTGCGGGCCATGGGAGCCGGCCGCCGGCAGGGACGACGCCTGTGAGACCCGCGAGCGGCCTCGGGGACCATGGGGAGCGATCGGGCCCGCAAGGGCGGAGGGGGCCCGAAGGACTTCGGCGCGGGACTCAAGTACAACTCCCGGCACGAG
SEQ ID NO:333ST14的外显子2
AAAGTGAATGGCTTGGAGGAAGGCGTGGAGTTCCTGCCAGTCAACAACGTCAAGAAGGTGGAAAAGCATGGCCCGGGGCGCTGGGTGGTGCTGGCAGCCGTGCTGATCGGCCTCCTCTTGGTCTTGCTGGGGATCGGCTTCCTGGTGTGGCATTTGCAGT
SEQ ID NO:334ST14的外显子3
ACCGGGACGTGCGTGTCCAGAAGGTCTTCAATGGCTACATGAGGATCACAAATGAGAATTTTGTGGATGCCTACGAGAACTCCAACTCCACTGAGTTTGTAAGCCTGGCCAGCAAGGTGAAGGACGCG
SEQ ID NO:335ST14的外显子4
CTGAAGCTGCTGTACAGCGGAGTCCCATTCCTGGGCCCCTACCACAAGGAGTCGGCTGTGACGGCCTTCAG
SEQ ID NO:336ST14的外显子5
CGAGGGCAGCGTCATCGCCTACTACTGGTCTGAGTTCAGCATCCCGCAGCACCTGGTGGAGGAGGCCGAGCGCGTCATGGCCGAGGAGCGCGTAGTCATGCTGCCCCCGCGGGCGCGCTCCCTGAAGTCCTTTGTGGTCACCTCAGTGGTGGCTTTCC
SEQ ID NO:337ST14的外显子6
CCACGGACTCCAAAACAGTACAGAGGACCCAGGACA
SEQ ID NO:338ST14的外显子7
ACAGCTGCAGCTTTGGCCTGCACGCCCGCGGTGTGGAGCTGATGCGCTTCACCACGCCCGGCTTCCCTGACAGCCCCTACCCCGCTCATGCCCGCTGCCAGTGGGCCCTGCGGGGGGACGCCGACTCAGTGCTGAGCCTCACCTTCCGCAGCTTTGACCTTGCGTCCTGCGACGAGCGCGGCAGCGACCTGGTGACGGTGTACAACACCCTGAGCCCCATGGAGCCCCACGCCCTGGTGCA
SEQ ID NO:339ST14的外显子8
GTTGTGTGGCACCTACCCTCCCTCCTACAACCTGACCTTCCACTCCTCCCAGAACGTCCTGCTCATCACACTGATAACCAACACTGAGCGGCGGCATCCCGGCTTTGAGGCCACCTTCTTCCAGCTGCCTAGGATGAGCA
SEQ ID NO:340ST14的外显子9
GCTGTGGAGGCCGCTTACGTAAAGCCCAGGGGACATTCAACAGCCCCTACTACCCAGGCCACTACCCACCCAACATTGACTGCACATGGAACATTGAG
SEQ ID NO:341ST14的外显子10
GTGCCCAACAACCAGCATGTGAAGGTGCGCTTCAAATTCTTCTACCTGCTGGAGCCCGGCGTGCCTGCGGGCACCTGCCCCAAGGACTACGTGGAGATCAACGGGGAGAA
SEQ ID NO:342ST14的外显子11
ATACTGCGGAGAGAGGTCCCAGTTCGTCGTCACCAGCAACAGCAACAAGATCACAGTTCGCTTCCACTCAGATCAGTCCTACACCGACACCGGCTTCTTAGCTGAATACCTCTCCTACGACTCCAGTGACC
SEQ ID NO:343ST14的外显子12
CATGCCCGGGGCAGTTCACGTGCCGCACGGGGCGGTGTATCCGGAAGGAGCTGCGCTGTGATGGCTGGGCCGACTGCACCGACCACAGCGATGAGCTCAACTGCA
SEQ ID NO:344ST14的外显子13
GTTGCGACGCCGGCCACCAGTTCACGTGCAAGAACAAGTTCTGCAAGCCCCTCTTCTGGGTCTGCGACAGTGTGAACGACTGCGGAGACAACAGCGACGAGCAGGGGTGCA
SEQ ID NO:345ST14的外显子14
GTTGTCCGGCCCAGACCTTCAGGTGTTCCAATGGGAAGTGCCTCTCGAAAAGCCAGCAGTGCAATGGGAAGGACGACTGTGGGGACGGGTCCGACGAGGCCTCCTGCCCCAAGGSEQ ID NO:346ST14的外显子15
TGAACGTCGTCACTTGTACCAAACACACCTACCGCTGCCTCAATGGGCTCTGCTTGAGC
AAGGGCAACCCTGAGTGTGACGGGAAGGAGGACTGTAGCGACGGCTCAGATGAGAAGGACTGCG
SEQ ID NO:347ST14的外显子16
ACTGTGGGCTGCGGTCATTCACGAGACAGGCTCGTGTTGTTGGGGGCACGGATGCGGATGAGGGCGAGTGGCCCTGGCAGGTAAGCCTGCATGCTCTGGGCCAGGGCCACATCTGCGGTGCTTCCCTCATCTCTCCCAACTGGCTGGTCTCTGCCGCACACTGCTACATCGATGACAGAGGATTCAG
SEQ ID NO:348ST14的外显子17
GTACTCAGACCCCACGCAGTGGACGGCCTTCCTGGGCTTGCACGACCAGAGCCAGCGCAGCGCCCCTGGGGTGCAGGAGCGCAGGCTCAAGCGCATCATCTCCCACCCCTTCTTCAATGACTTCACCTTCGACTATGACATCGCGCTGCTGGAGCTGGAGAAACCGGCAGAGTACAGCTCCATGGTGCGGCCCATCTGCCTGCCGGACGCCTCCCATGTCTTCCCTGCCGGCAAGGCCATCTGGGTCACGGGCTGGGGACACACCCAGTATGGAG
SEQ ID NO:349ST14的外显子18
GCACTGGCGCGCTGATCCTGCAAAAGGGTGAGATCCGCGTCATCAACCAGACCACCTGCGAGAACCTCCTGCCGCAGCAGATCACGCCGCGCATGATGTGCGTGGGCTTCCTCAGCGGCGGCGTGGACTCCTGCCAG
SEQ ID NO:350ST14的外显子19
GGTGATTCCGGGGGACCCCTGTCCAGCGTGGAGGCGGATGGGCGGATCTTCCAGGCCGGTGTGGTGAGCTGGGGAGACGGCTGCGCTCAGAGGAACAAGCCAGGCGTGTACACAAGGCTCCCTCTGTTTCGGGACTGGATCAAAGAGAACACTGGGGTATAGGGGCCGGGGCCACCCAAATGTGTACACCTGCGGGGCCACCCATCGTCCACCCCAGTGTGCACGCCTGCAGGCTGGAGACTGGACCGCTGACTGCACCAGCGCCCCCAGAACATACACTGTGAACTCAATCTCCAGGGCTCCAAATCTGCCTAGAAAACCTCTCGCTTCCTCAGCCTCCAAAGTGGAGCTGGGAGGTAGAAGGGGAGGACACTGGTGGTTCTACTGACCCAACTGGGGGCAAAGGTTTGAAGACACAGCCTCCCCCGCCAGCCCCAAGCTGGGCCGAGGCGCGTTTGTGCATATCTGCCTCCCCTGTCTCTAAGGAGCAGCGGGAACGGAGCTTCGGGGCCTCCTCAGTGAAGGTGGTGGGGCTGCCGGATCTGGGCTGTGGGGCCCTTGGGCCACGCTCTTGAGGAAGCCCAGGCTCGGAGGACCCTGGAAAACAGACGGGTCTGAGACTGAAATTGTTTTACCAGCTCCCAGGGTGGACTTCAGTGTGTGTATTTGTGTAAATGAGTAAAACATTTTATTTCTTTTTA
SEQ ID NO:351全mRNA多核苷酸序列
SEQ ID NO:352ST14的外显子1的翻译多肽序列
MGSDRARKGGGGPKDFGAGLKYNSRHE
SEQ ID NO:353ST14的外显子2的翻译多肽序列
KVNGLEEGVEFLPVNNVKKVEKHGPGRWVVLAAVLIGLLLVLLGIGFLVWHLQ
SEQ ID NO:354ST14的外显子3的翻译多肽序列
RDVRVQKVFNGYMRITNENFVDAYENSNSTEFVSLASKVKDA
SEQ ID NO:355ST14的外显子4的翻译多肽序列
LKLLYSGVPFLGPYHKESAVTAF
SEQ ID NO:356ST14的外显子5的翻译多肽序列
EGSVIAYYWSEFSIPQHLVEEAERVMAEERVVMLPPRARSLKSFVVTSVVAF
SEQ ID NO:357ST14的外显子6的翻译多肽序列
TDSKTVQRTQD
SEQ ID NO:358ST14的外显子7的翻译多肽序列
SCSFGLHARGVELMRFTTPGFPDSPYPAHARCQWALRGDADSVLSLTFRSFDLASCDERGSDLVTVYNTLSPMEPHALV
SEQ ID NO:359ST14的外显子8的翻译多肽序列
LCGTYPPSYNLTFHSSQNVLLITLITNTERRHPGFEATFFQLPRMS
SEQ ID NO:360ST14的外显子9的翻译多肽序列
CGGRLRKAQGTFNSPYYPGHYPPNIDCTWNIE
SEQ ID NO:361ST14的外显子10的翻译多肽序列
VPNNQHVKVRFKFFYLLEPGVPAGTCPKDYVEINGE
SEQ ID NO:362ST14的外显子11的翻译多肽序列
YCGERSQFVVTSNSNKITVRFHSDQSYTDTGFLAEYLSYDSSD
SEQ ID NO:363ST14的外显子12的翻译多肽序列NM_021978.4
CPGQFTCRTGRCIRKELRCDGWADCTDHSDELNC
SEQ ID NO:364ST14的外显子13的翻译多肽序列
CDAGHQFTCKNKFCKPLFWVCDSVNDCGDNSDEQGC
SEQ ID NO:365ST14的外显子14的翻译多肽序列
CPAQTFRCSNGKCLSKSQQCNGKDDCGDGSDEASCPK
SEQ ID NO:366ST14的外显子15的翻译多肽序列
NVVTCTKHTYRCLNGLCLSKGNPECDGKEDCSDGSDEKDC
SEQ ID NO:367ST14的外显子16的翻译多肽序列
CGLRSFTRQARVVGGTDADEGEWPWQVSLHALGQGHICGASLISPNWLVSAAHCYIDDRGF
SEQ ID NO:368ST14的外显子17的翻译多肽序列
YSDPTQWTAFLGLHDQSQRSAPGVQERRLKRIISHPFFNDFTFDYDIALLELEKPAEYSSMVRPICLPDASHVFPAGKAIWVTGWGHTQYG
SEQ ID NO:369ST14的外显子18的翻译多肽序列
TGALILQKGEIRVINQTTCENLLPQQITPRMMCVGFLSGGVDSCQ
SEQ ID NO:370ST14的外显子19的翻译多肽序列
GDSGGPLSSVEADGRIFQAGVVSWGDGCAQRNKPGVYTRLPLFRDWIKENTGV
SEQ ID NO:371全蛋白质序列
MGSDRARKGGGGPKDFGAGLKYNSRHEKVNGLEEGVEFLPVNNVKKVEKHGPGRWVVLAAVLIGLLLVLLGIGFLVWHLQYRDVRVQKVFNGYMRITNENFVDAYENSNSTEFVSLASKVKDALKLLYSGVPFLGPYHKESAVTAFSEGSVIAYYWSEFSIPQHLVEEAERVMAEERVVMLPPRARSLKSFVVTSVVAFPTDSKTVQRTQDNSCSFGLHARGVELMRFTTPGFPDSPYPAHARCQWALRGDADSVLSLTFRSFDLASCDERGSDLVTVYNTLSPMEPHALVQLCGTYPPSYNLTFHSSQNVLLITLITNTERRHPGFEATFFQLPRMSSCGGRLRKAQGTFNSPYYPGHYPPNIDCTWNIEVPNNQHVKVRFKFFYLLEPGVPAGTCPKDYVEINGEKYCGERSQFVVTSNSNKITVRFHSDQSYTDTGFLAEYLSYDSSDPCPGQFTCRTGRCIRKELRCDGWADCTDHSDELNCSCDAGHQFTCKNKFCKPLFWVCDSVNDCGDNSDEQGCSCPAQTFRCSNGKCLSKSQQCNGKDDCGDGSDEASCPKVNVVTCTKHTYRCLNGLCLSKGNPECDGKEDCSDGSDEKDCDCGLRSFTRQARVVGGTDADEGEWPWQVSLHALGQGHICGASLISPNWLVSAAHCYIDDRGFRYSDPTQWTAFLGLHDQSQRSAPGVQERRLKRIISHPFFNDFTFDYDIALLELEKPAEYSSMVRPICLPDASHVFPAGKAIWVTGWGHTQYGGTGALILQKGEIRVINQTTCENLLPQQITPRMMCVGFLSGGVDSCQGDSGGPLSSVEADGRIFQAGVVSWGDGCAQRNKPGVYTRLPLFRDWIKENTGV
SEQ ID NO:372ST14的全部11个外显子1-11按顺序排列的多核苷酸序列
SEQ ID NO:373ST14的全部11个外显子1-11按顺序排列的翻译多肽序列
THBS1序列信息
SEQ ID NO:374THBS1-NRG1融合物5’处的THBS1外显子9序列
ACCCTGTGAAGGCGAAGCGCGGGAGACCAAAGCCTGCAAGAAAGACGCCTGCCCCA
SEQ ID NO:375THBS1-NRG1融合物3’处的NRG1外显子6序列
CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCTTC
SEQ ID NO:376THBS1-NRG1多核苷酸序列
ACCCTGTGAAGGCGAAGCGCGGGAGACCAAAGCCTGCAAGAAAGACGCCTGCCCCACTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAA
ACTTTCTGTGTGAATGGAGGGGAGTGCTTC
SEQ ID NO:377THBS1-NRG1多肽序列
PCEGEARETKACKKDACPTTSTSTTGTSHLVKCAEKEKTFCVNGGECF
SEQ ID NO:378THBS1的外显子1
AGCCGCTGCGCCCGAGCTGGCCTGCGAGTTCAGGGCTCCTGTCGCTCTCCAGGAGCAACCTCTACTCCGGACGCACAGGCATTCCCCGCGCCCCTCCAGCCCTCGCCGCCCTCGCCACCGCTCCCGGCCGCCGCGCTCCGGTACACACAG
SEQ ID NO:379THBS1的外显子2
GATCCCTGCTGGGCACCAACAGCTCCACCATGGGGCTGGCCTGGGGACTAGGCGTCCTGTTCCTGATGCATGTGTGTGGCACCAACCGCATTCCAG
SEQ ID NO:380THBS1的外显子3
AGTCTGGCGGAGACAACAGCGTGTTTGACATCTTTGAACTCACCGGGGCCGCCCGCAAGGGGTCTGGGCGCCGACTGGTGAAGGGCCCCGACCCTTCCAGCCCAGCTTTCCGCATCGAGGATGCCAACCTGATCCCCCCTGTGCCTGATGACAAGTTCCAAGACCTGGTGGATGCTGTGCGGGCAGAAAAGGGTTTCCTCCTTCTGGCATCCCTGAGGCAGATGAAGAAGACCCGGGGCACGCTGCTGGCCCTGGAGCGGAAAGACCACTCTGGCCAGGTCTTCAGCGTGGTGTCCAATGGCAAGGCGGGCACCCTGGACCTCAGCCTGACCGTCCAAGGAAAGCAGCACGTGGTGTCTGTGGAAGAAGCTCTCCTGGCAACCGGCCAGTGGAAGAGCATCACCCTGTTTGTGCAGGAAGACAGGGCCCAGCTGTACATCGACTGTGAAAAGATGGAGAATGCTGAGTTGGACGTCCCCATCCAAAGCGTCTTCACCAGAGACCTGGCCAGCATCGCCAGACTCCGCATCGCAAAGGGGGGCGTCAATGACAATTTCCAG
SEQ ID NO:381THBS1的外显子4
GGGGTGCTGCAGAATGTGAGGTTTGTCTTTGGAACCACACCAGAAGACATCCTCAGGAACAAAGGCTGCTCCAGCT
SEQ ID NO:382THBS1的外显子5
CTACCAGTGTCCTCCTCACCCTTGACAACAACGTGGTGAATGGTTCCAGCCCTGCCATCCGCACTAACTACATTGGCCACAAGACAAAGGACTTGCAAGCCATCTGCGGCATCTCCTGTGATGAGCTGTCCAGCATGGTCCTGGAACTCAGGGGCCTGCGCACCATTGTGACCACGCTGCAGGACAGCATCCGCAAAGTG
SEQ ID NO:383THBS1的外显子6
ACTGAAGAGAACAAAGAGTTGGCCAATGAGCTGAGGCGGCCTCCCCTATGCTATCACAACGGAGTTCAGTACAGAAATAACGAGGAATGGACTGTTGATAGCTGCACTGAGTGTCACTGTCAG
SEQ ID NO:384THBS1的外显子7
AACTCAGTTACCATCTGCAAAAAGGTGTCCTGCCCCATCATGCCCTGCTCCAATGCCACAGTTCCTGATGGAGAATGCTGTCCTCGCTGTTGGC
SEQ ID NO:385THBS1的外显子8
CCAGCGACTCTGCGGACGATGGCTGGTCTCCATGGTCCGAGTGGACCTCCTGTTCTACGAGCTGTGGCAATGGAATTCAGCAGCGCGGCCGCTCCTGCGATAGCCTCAACAACCGATGTGAGGGCTCCTCGGTCCAGACACGGACCTGCCACATTCAGGAGTGTGACAAGAGATSEQ ID NO:386THBS1的外显子9
TTAAACAGGATGGTGGCTGGAGCCACTGGTCCCCGTGGTCATCTTGTTCTGTGACATGTGGTGATGGTGTGATCACAAGGATCCGGCTCTGCAACTCTCCCAGCCCCCAGATGAACGGGAAACCCTGTGAAGGCGAAGCGCGGGAGACCAAAGCCTGCAAGAAAGACGCCTGCCCCA
SEQ ID NO:387THBS1的全部13个外显子10-22按顺序排列的多核苷酸序列
TTAAACAGGATGGTGGCTGGAGCCACTGGTCCCCGTGGTCATCTTGTTCTGTGACATGTGGTGATGGTGTGATCACAAGGATCCGGCTCTGCAACTCTCCCAGCCCCCAGATGAACGGGAAACCCTGTGAAGGCGAAGCGCGGGAGACCAAAGCCTGCAAGAAAGACGCCTGCCCCATCAATGGAGGCTGGGGTCCTTGGTCACCATGGGACATCTGTTCTGTCACCTGTGGAGGAGGGGTACAGAAACGTAGTCGTCTCTGCAACAACCCCACACCCCAGTTTGGAGG
CAAGGACTGCGTTGGTGATGTAACAGAAAACCAGATCTGCAACAAGCAGGACTGTCCA
ATTGATGGATGCCTGTCCAATCCCTGCTTTGCCGGCGTGAAGTGTACTAGCTACCCTGAT
GGCAGCTGGAAATGTGGTGCTTGTCCCCCTGGTTACAGTGGAAATGGCATCCAGTGCA
CAGATGTTGATGAGTGCAAAGAAGTGCCTGATGCCTGCTTCAACCACAATGGAGAGCA
CCGGTGTGAGAACACGGACCCCGGCTACAACTGCCTGCCCTGCCCCCCACGCTTCACC
GGCTCACAGCCCTTCGGCCAGGGTGTCGAACATGCCACGGCCAACAAACAGGTGTGC
AAGCCCCGTAACCCCTGCACGGATGGGACCCACGACTGCAACAAGAACGCCAAGTGC
AACTACCTGGGCCACTATAGCGACCCCATGTACCGCTGCGAGTGCAAGCCTGGCTACGC
TGGCAATGGCATCATCTGCGGGGAGGACACAGACCTGGATGGCTGGCCCAATGAGAAC
CTGGTGTGCGTGGCCAATGCGACTTACCACTGCAAAAAGGATAATTGCCCCAACCTTCC
CAACTCAGGGCAGGAAGACTATGACAAGGATGGAATTGGTGATGCCTGTGATGATGAC
GATGACAATGATAAAATTCCAGATGACAGGGACAACTGTCCATTCCATTACAACCCAGC
TCAGTATGACTATGACAGAGATGATGTGGGAGACCGCTGTGACAACTGTCCCTACAACC
ACAACCCAGATCAGGCAGACACAGACAACAATGGGGAAGGAGACGCCTGTGCTGCAG
ACATTGATGGAGACGGTATCCTCAATGAACGGGACAACTGCCAGTACGTCTACAATGTG
GACCAGAGAGACACTGATATGGATGGGGTTGGAGATCAGTGTGACAATTGCCCCTTGG
AACACAATCCGGATCAGCTGGACTCTGACTCAGACCGCATTGGAGATACCTGTGACAA
CAATCAGGATATTGATGAAGATGGCCACCAGAACAATCTGGACAACTGTCCCTATGTGC
CCAATGCCAACCAGGCTGACCATGACAAAGATGGCAAGGGAGATGCCTGTGACCACGA
TGATGACAACGATGGCATTCCTGATGACAAGGACAACTGCAGACTCGTGCCCAATCCC
GACCAGAAGGACTCTGACGGCGATGGTCGAGGTGATGCCTGCAAAGATGATTTTGACC
ATGACAGTGTGCCAGACATCGATGACATCTGTCCTGAGAATGTTGACATCAGTGAGACC
GATTTCCGCCGATTCCAGATGATTCCTCTGGACCCCAAAGGGACATCCCAAAATGACCC
TAACTGGGTTGTACGCCATCAGGGTAAAGAACTCGTCCAGACTGTCAACTGTGATCCTG
GACTCGCTGTAGGTTATGATGAGTTTAATGCTGTGGACTTCAGTGGCACCTTCTTCATCA
ACACCGAAAGGGACGATGACTATGCTGGATTTGTCTTTGGCTACCAGTCCAGCAGCCG
CTTTTATGTTGTGATGTGGAAGCAAGTCACCCAGTCCTACTGGGACACCAACCCCACGA
GGGCTCAGGGATACTCGGGCCTTTCTGTGAAAGTTGTAAACTCCACCACAGGGCCTGG
CGAGCACCTGCGGAACGCCCTGTGGCACACAGGAAACACCCCTGGCCAGGTGCGCAC
CCTGTGGCATGACCCTCGTCACATAGGCTGGAAAGATTTCACCGCCTACAGATGGCGTC
TCAGCCACAGGCCAAAGACGGGTTTCATTAGAGTGGTGATGTATGAAGGGAAGAAAAT
CATGGCTGACTCAGGACCCATCTATGATAAAACCTATGCTGGTGGTAGACTAGGGTTGT
TTGTCTTCTCTCAAGAAATGGTGTTCTTCTCTGACCTGAAATACGAATGTAGAGATCCCT
AATCATCAAATTGTTGATTGAAAGACTGATCATAAACCAATGCTGGTATTGCACCTTCTG
GAACTATGGGCTTGAGAAAACCCCCAGGATCACTTCTCCTTGGCTTCCTTCTTTTCTGT
GCTTGCATCAGTGTGGACTCCTAGAACGTGCGACCTGCCTCAAGAAAATGCAGTTTTC
AAAAACAGACTCAGCATTCAGCCTCCAATGAATAAGACATCTTCCAAGCATATAAACAA
TTGCTTTGGTTTCCTTTTGAAAAAGCATCTACTTGCTTCAGTTGGGAAGGTGCCCATTCC
ACTCTGCCTTTGTCACAGAGCAGGGTGCTATTGTGAGGCCATCTCTGAGCAGTGGACTC
AAAAGCATTTTCAGGCATGTCAGAGAAGGGAGGACTCACTAGAATTAGCAAACAAAAC
CACCCTGACATCCTCCTTCAGGAACACGGGGAGCAGAGGCCAAAGCACTAAGGGGAG
GGCGCATACCCGAGACGATTGTATGAAGAAAATATGGAGGAACTGTTACATGTTCGGTA
CTAAGTCATTTTCAGGGGATTGAAAGACTATTGCTGGATTTCATGATGCTGACTGGCGTT
AGCTGATTAACCCATGTAAATAGGCACTTAAATAGAAGCAGGAAAGGGAGACAAAGAC
TGGCTTCTGGACTTCCTCCCTGATCCCCACCCTTACTCATCACCTGCAGTGGCCAGAATT
AGGGAATCAGAATCAAACCAGTGTAAGGCAGTGCTGGCTGCCATTGCCTGGTCACATT
GAAATTGGTGGCTTCATTCTAGATGTAGCTTGTGCAGATGTAGCAGGAAAATAGGAAAA
CCTACCATCTCAGTGAGCACCAGCTGCCTCCCAAAGGAGGGGCAGCCGTGCTTATATTT
TTATGGTTACAATGGCACAAAATTATTATCAACCTAACTAAAACATTCCTTTTCTCTTTTT
TCCTGAATTATCATGGAGTTTTCTAATTCTCTCTTTTGGAATGTAGATTTTTTTTAAATGC
TTTACGATGTAAAATATTTATTTTTTACTTATTCTGGAAGATCTGGCTGAAGGATTATTCAT
GGAACAGGAAGAAGCGTAAAGACTATCCATGTCATCTTTGTTGAGAGTCTTCGTGACTGTAAGATTGTAAATACAGATTATTTATTAACTCTGTTCTGCCTGGAAATTTAGGCTTCATACGGAAAGTGTTTGAGAGCAAGTAGTTGACATTTATCAGCAAATCTCTTGCAAGAACAGCACAAGGAAAATCAGTCTAATAAGCTGCTCTGCCCCTTGTGCTCAGAGTGGATGTTATGGGATTCTTTTTTTCTCTGTTTTATCTTTTCAAGTGGAATTAGTTGGTTATCCATTTGCAAATGTTTTAAATTGCAAAGAAAGCCATGAGGTCTTCAATACTGTTTTACCCCATCCCTTGTGCATATTTCCAGGGAGAAGGAAAGCATATACACTTTTTTCTTTCATTTTTCCAAAAGAGAAAAAAATGACAAAAGGTGAAACTTACATACAAATATTACCTCATTTGTTGTGTGACTGAGTAAAGAATTTTTGGATCAAGCGGAAAGAGTTTAAGTGTCTAACAAACTTAAAGCTACTGTAGTACCTAAAAAGTCAGTGTTGTACATAGCATAAAAACTCTGCAGAGAAGTATTCCCAATAAGGAAATAGCATTGAAATGTTAAATACAATTTCTGAAAGTTATGTTTTTTTTCTATCATCTGGTATACCATTGCTTTATTTTTATAAATTATTTTCTCATTGCCATTGGAATAGATATCTCAGATTGTGTAGATATGCTATTTAAATAATTTATCAGGAAATACTGCCTGTAGAGTTAGTATTTCTATTTTTATATAATGTTTGCACACTGAATTGAAGAATTGTTGGTTTTTTCTTTTTTTTGTTTTGTTTTTTTTTTTTTTTTTTTTTGCTTTTGACCTCCCATTTTTACTATTTGCCAATACCTTTTTCTAGGAATGTGCTTTTTTTTGTACACATTTTTATCCATTTTACATTCTAAAGCAGTGTAAGTTGTATATTACTGTTTCTTATGTACAAGGAACAACAATAAATCATATGGAAATTTATATTTATACTTACTGTATCCATGCTTATTTGTTCTCTACTGGCTTTATGTCATGAAGTATATGCGTAAATACCATTCATAAATCAATATAGCATATACAAAAATAAATTACAGTAAGTCATAGCAACATTCACAGTTTGTATGTGATTGAGAAAGACTGAGTTGCTCAGGCCTAGGCTTAGAATTTGCTGCGTTTGTGGAATAAAAGAACAAAATGATACATTAGCCTGCCATATCAA
SEQ ID NO:388全mRNA多核苷酸序列
SEQ ID NO:389THBS1的外显子2的翻译多肽序列
MGLAWGLGVLFLMHVCGTNRIP
SEQ ID NO:390THBS1的外显子3的翻译多肽序列
SGGDNSVFDIFELTGAARKGSGRRLVKGPDPSSPAFRIEDANLIPPVPDDKFQDLVDAVRAEKGFLLLASLRQMKKTRGTLLALERKDHSGQVFSVVSNGKAGTLDLSLTVQGKQHVVSVEEALLATGQWKSITLFVQEDRAQLYIDCEKMENAELDVPIQSVFTRDLASIARLRIAKGGVNDNFQ
SEQ ID NO:391THBS1的外显子4的翻译多肽序列
GVLQNVRFVFGTTPEDILRNKGCSS
SEQ ID NO:392THBS1的外显子5的翻译多肽序列
TSVLLTLDNNVVNGSSPAIRTNYIGHKTKDLQAICGISCDELSSMVLELRGLRTIVTTLQDSIRKV
SEQ ID NO:393THBS1的外显子6的翻译多肽序列
TEENKELANELRRPPLCYHNGVQYRNNEEWTVDSCTECHCQ
SEQ ID NO:394THBS1的外显子7的翻译多肽序列
NSVTICKKVSCPIMPCSNATVPDGECCPRCW
SEQ ID NO:395THBS1的外显子8的翻译多肽序列
SDSADDGWSPWSEWTSCSTSCGNGIQQRGRSCDSLNNRCEGSSVQTRTCHIQECDKR
SEQ ID NO:396THBS1的外显子9的翻译多肽序列
KQDGGWSHWSPWSSCSVTCGDGVITRIRLCNSPSPQMNGKPCEGEARETKACKKDACP
SEQ ID NO:397THBS1的全部13个外显子10-22按顺序排列的翻译多肽序列
KQDGGWSHWSPWSSCSVTCGDGVITRIRLCNSPSPQMNGKPCEGEARETKACKKDACPINGGWGPWSPWDICSVTCGGGVQKRSRLCNNPTPQFGGKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTSYPDGSWKCGACPPGYSGNGIQCTDVDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEHATANKQVCKPRNPCTDGTHDCNKNAKCNYLGHYSDPMYRCECKPGYAGNGIICGEDTDLDGWPNENLVCVANATYHCKKDNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPAQYDYDRDDVGDRCDNCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQRDTDMDGVGDQCDNCPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKGDACDHDDDNDGIPDDKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVDISETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLAVGYDEFNAVDFSGTFFINTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQGYSGLSVKVVNSTTGPGEHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPKTGFIRVVMYEGKKIMADSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP
SEQ ID NO:398全蛋白质序列
MGLAWGLGVLFLMHVCGTNRIPESGGDNSVFDIFELTGAARKGSGRRLVKGPDPSSPAFRIEDANLIPPVPDDKFQDLVDAVRAEKGFLLLASLRQMKKTRGTLLALERKDHSGQVFSVVSNGKAGTLDLSLTVQGKQHVVSVEEALLATGQWKSITLFVQEDRAQLYIDCEKMENAELDVPIQSVFTRDLASIARLRIAKGGVNDNFQGVLQNVRFVFGTTPEDILRNKGCSSSTSVLLTLDNNVVNGSSPAIRTNYIGHKTKDLQAICGISCDELSSMVLELRGLRTIVTTLQDSIRKVTEENKELANELRRPPLCYHNGVQYRNNEEWTVDSCTECHCQNSVTICKKVSCPIMPCSNATVPDGECCPRCWPSDSADDGWSPWSEWTSCSTSCGNGIQQRGRSCDSLNNRCEGSSVQTRTCHIQECDKRFKQDGGWSHWSPWSSCSVTCGDGVITRIRLCNSPSPQMNGKPCEGEARETKACKKDACPINGGWGPWSPWDICSVTCGGGVQKRSRLCNNPTPQFGGKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTSYPDGSWKCGACPPGYSGNGIQCTDVDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEHATANKQVCKPRNPCTDGTHDCNKNAKCNYLGHYSDPMYRCECKPGYAGNGIICGEDTDLDGWPNENLVCVANATYHCKKDNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPAQYDYDRDDVGDRCDNCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQRDTDMDGVGDQCDNCPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKGDACDHDDDNDGIPDDKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVDISETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLAVGYDEFNAVDFSGTFFINTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQGYSGLSVKVVNSTTGPGEHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPKTGFIRVVMYEGKKIMADSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP
SEQ ID NO:399THBS1的全部9个外显子1-9按顺序排列的多核苷酸序列
SEQ ID NO:400THBS1的全部8个外显子2-9按顺序排列的翻译多肽序列
AGRN序列信息
SEQ ID NO:401AGRN-NRG1融合物5’处的AGRN外显子12序列
GTGTGCGGCTCAGATGGGGTCACCTACAGCACCGAGTGTGAGCTGAAGAAGGCCAGGTGTGAGTCACAGCGAGGGCTCTACGTAGCGGCCCAGGGAGCCTGCCGAG
SEQ ID NO:402AGRN-NRG1融合物3’处的NRG1外显子6序列
CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCTTCATGGTGAAAGAC
SEQ ID NO:403AGRN-NRG1多核苷酸序列
GTGTGCGGCTCAGATGGGGTCACCTACAGCACCGAGTGTGAGCTGAAGAAGGCCAGGTGTGAGTCACAGCGAGGGCTCTACGTAGCGGCCCAGGGAGCCTGCCGAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCTTCATGGTGAAAGAC
SEQ ID NO:404AGRN-NRG1多肽序列
VCGSDGVTYSTECELKKARCESQRGLYVAAQGACRATSTSTTGTSHLVKCAEKEKTFCVNGGECFMVKD
SEQ ID NO:405AGRN的外显子1
AGTCCCGTCCCCGGCGCGGCCCGCGCGCTCCTCCGCCGCCTCTCGCCTGCGCCATGGCCGGCCGGTCCCACCCGGGCCCGCTGCGGCCGCTGCTGCCGCTCCTTGTGGTGGCCGCGTGCGTCCTGCCCGGAGCCGGCGGGACATGCCCGGAGCGCGCGCTGGAGCGGCGCGAGGAGGAGGCGAACGTGGTGCTCACCGGGACGGTGGAGGAGATCCTCAACGTGGACCCGGTGCAGCACACGTACTCCTGCAAG
SEQ ID NO:406AGRN的外显子2
GTTCGGGTCTGGCGGTACTTGAAGGGCAAAGACCTGGTGGCCCGGGAGAGCCTGCTGGACGGCGGCAACAAGGTGGTGATCAGCGGCTTTGGAGACCCCCTCATCTGTGACAACCAGGTGTCCACTGGGGACACCAGGATCTTCTTTGTGAACCCTGCACCCCCATACCTGTGGCCAGCCCACAAGAACGAGCTGATGCTCAACTCCAGCCTCATGCGGATCACCCTGCGGAACCTGGAGGAGGTGGAGTTCTGTGTGGAAG
SEQ ID NO:407AGRN的外显子3
ATAAACCCGGGACCCACTTCACTCCAGTGCCTCCGACGCCTCCTGATG
SEQ ID NO:408AGRN的外显子4
CGTGCCGGGGAATGCTGTGCGGCTTCGGCGCCGTGTGCGAGCCCAACGCGGAGGGGCCGGGCCGGGCGTCCTGCGTCTGCAAGAAGAGCCCGTGCCCCAGCGTGGTGGCGCCTGTGTGTGGGTCGGACGCCTCCACCTACAGCAACGAATGCGAGCTGCAGCGGGCGCAGTGCAGCCAGCAGCGCCGCATCCGCCTGCTCAGCCGCGGGCCGTGCG
SEQ ID NO:409AGRN的外显子5
GCTCGCGGGACCCCTGCTCCAACGTGACCTGCAGCTTCGGCAGCACCTGTGCGCGCTCGGCCGACGGGCTGACGGCCTCGTGCCTGTGCCCCGCGACCTGCCGTGGCGCCCCCGAGGGGACCGTCTGCGGCAGCGACGGCGCCGACTACCCCGGCGAGTGCCAGCTCCTGCGCCGCGCCTGCGCCCGCCAGGAGAATGTCTTCAAGAAGTTCGACGGCCCTTGTG
SEQ ID NO:410AGRN的外显子6
ACCCCTGTCAGGGCGCCCTCCCTGACCCGAGCCGCAGCTGCCGTGTGAACCCGCGCACGCGGCGCCCTGAGATGCTCCTACGGCCCGAGAGCTGCCCTGCCCGGCAGGCGCCAGTGTGTGGGGACGACGGAGTCACCTACGAAAACGACTGTGTCATGGGCCGATCGGGGGCCGCCCGGGGTCTCCTCCTGCAGAAAGTGCGCTCCGGCCAGTGCCAGGGTCGAG
SEQ ID NO:411AGRN的外显子7
ACCAGTGCCCGGAGCCCTGCCGGTTCAATGCCGTGTGCCTGTCCCGCCGTGGCCGTCCCCGCTGCTCCTGCGACCGCGTCACCTGTGACGGGGCCTACAGGCCCGTGTGTGCCCAGGACGGGCGCACGTATGACAGTGATTGCTGGCGGCAGCAGGCTGAGTGCCGGCAGCAGCGTGCCATCCCCAGCAAGCACCAGGGCCCGTGTG
SEQ ID NO:412AGRN的外显子8
ACCAGGCCCCGTCCCCATGCCTCGGGGTGCAGTGTGCATTTGGGGCGACGTGTGCTGTGAAGAACGGGCAGGCAGCGTGTGAATGCCTGCAGGCGTGCTCGAGCCTCTACGATCCTGTGTGCGGCAGCGACGGCGTCACATACGGCAGCGCGTGCGAGCTGGAGGCCACGGCCTGTACCCTCGGGCGGGAGATCCAGGTGGCGCGCAAAGGACCCTGTG
SEQ ID NO:413AGRN的外显子9
ACCGCTGCGGGCAGTGCCGCTTTGGAGCCCTGTGCGAGGCCGAGACCGGGCGCTGCGTGTGCCCCTCTGAATGCGTGGCTTTGGCCCAGCCCGTGTGTGGCTCCGACGGGCACACGTACCCCAGCGAGTGCATGCTGCACGTGCACGCCTGCACACACCAGATCAGCCTGCACGTGGCCTCAGCTGGACCCTGTG
SEQ ID NO:414AGRN的外显子10
AGACCTGTGGAGATGCCGTGTGTGCTTTTGGGGCTGTGTGCTCCGCAGGGCAGTGTGTGTGTCCCCGGTGTGAGCACCCCCCGCCCGGCCCCGTGTGTGGCAGCGACGGTGTCACCTACGGCAGTGCCTGCGAGCTACGGGAAGCCGCCTGCCTCCAGCAGACACAGATCGAGGAGGCCCGGGCAGGGCCGTGCGAGCAGG
SEQ ID NO:415AGRN的外显子11
CCGAGTGCGGTTCCGGAGGCTCTGGCTCTGGGGAGGACGGTGACTGTGAGCAGGAGCTGTGCCGGCAGCGCGGTGGCATCTGGGACGAGGACTCGGAGGACGGGCCGTGTGTCTGTGACTTCAGCTGCCAGAGTGTCCCAGGCAGCCCG
SEQ ID NO:416AGRN的外显子12
GTGTGCGGCTCAGATGGGGTCACCTACAGCACCGAGTGTGAGCTGAAGAAGGCCAGGTGTGAGTCACAGCGAGGGCTCTACGTAGCGGCCCAGGGAGCCTGCCGAG
SEQ ID NO:417AGRN的全部27个外显子13-39按顺序排列的多核苷酸序列
GCCCCACCTTCGCCCCGCTGCCGCCTGTGGCCCCCTTACACTGTGCCCAGACGCCCTACGGCTGCTGCCAGGACAATATCACCGCAGCCCGGGGCGTGGGCCTGGCTGGCTGCCCCAGTGCCTGCCAGTGCAACCCCCATGGCTCTTACGGCGGCACCTGTGACCCAGCCAC
AGGCCAGTGCTCCTGCCGCCCAGGTGTGGGGGGCCTCAGGTGTGACCGCTGTGAGCCT
GGCTTCTGGAACTTTCGAGGCATCGTCACCGATGGCCGGAGTGGCTGTACACCCTGCA
GCTGTGATCCCCAAGGCGCCGTGCGGGATGACTGTGAGCAGATGACGGGGCTGTGCTC
GTGTAAGCCCGGGGTGGCTGGACCCAAGTGTGGGCAGTGTCCAGACGGCCGTGCCCT
GGGCCCCGCGGGCTGTGAAGCTGACGCTTCTGCGCCTGCGACCTGTGCGGAGATGCGC
TGTGAGTTCGGTGCGCGGTGCGTGGAGGAGTCTGGCTCAGCCCACTGTGTCTGCCCGA
TGCTCACCTGTCCAGAGGCCAACGCTACCAAGGTCTGTGGGTCAGATGGAGTCACATA
CGGCAACGAGTGTCAGCTGAAGACCATCGCCTGCCGCCAGGGCCTGCAAATCTCTATC
CAGAGCCTGGGCCCGTGCCAGGAGGCTGTTGCTCCCAGCACTCACCCGACATCTGCCT
CCGTGACTGTGACCACCCCAGGGCTCCTCCTGAGCCAGGCACTGCCGGCCCCCCCCGG
CGCCCTCCCCCTGGCTCCCAGCAGTACCGCACACAGCCAGACCACCCCTCCGCCCTCA
TCACGACCTCGGACCACTGCCAGCGTCCCCAGGACCACCGTGTGGCCCGTGCTGACGG
TGCCCCCCACGGCACCCTCCCCTGCACCCAGCCTGGTGGCGTCCGCCTTTGGTGAATCT
GGCAGCACTGATGGAAGCAGCGATGAGGAACTGAGCGGGGACCAGGAGGCCAGTGGG
GGTGGCTCTGGGGGGCTCGAGCCCTTGGAGGGCAGCAGCGTGGCCACCCCTGGGCCA
CCTGTCGAGAGGGCTTCCTGCTACAACTCCGCGTTGGGCTGCTGCTCTGATGGGAAGA
CGCCCTCGCTGGACGCAGAGGGCTCCAACTGCCCCGCCACCAAGGTGTTCCAGGGCGT
CCTGGAGCTGGAGGGCGTCGAGGGCCAGGAGCTGTTCTACACGCCCGAGATGGCTGA
CCCCAAGTCAGAACTGTTCGGGGAGACAGCCAGGAGCATTGAGAGCACCCTGGACGA
CCTCTTCCGGAATTCAGACGTCAAGAAGGATTTTCGGAGTGTCCGCTTGCGGGACCTG
GGGCCCGGCAAATCCGTCCGCGCCATTGTGGATGTGCACTTTGACCCCACCACAGCCTT
CAGGGCACCCGACGTGGCCCGGGCCCTGCTCCGGCAGATCCAGGTGTCCAGGCGCCG
GTCCTTGGGGGTGAGGCGGCCGCTGCAGGAGCACGTGCGATTTATGGACTTTGACTGG
TTTCCTGCGTTTATCACGGGGGCCACGTCAGGAGCCATTGCTGCGGGAGCCACGGCCA
GAGCCACCACTGCATCGCGCCTGCCGTCCTCTGCTGTGACCCCTCGGGCCCCGCACCC
CAGTCACACAAGCCAGCCCGTTGCCAAGACCACGGCAGCCCCCACCACACGTCGGCC
CCCCACCACTGCCCCCAGCCGTGTGCCCGGACGTCGGCCCCCGGCCCCCCAGCAGCCT
CCAAAGCCCTGTGACTCACAGCCCTGCTTCCACGGGGGGACCTGCCAGGACTGGGCAT
TGGGCGGGGGCTTCACCTGCAGCTGCCCGGCAGGCAGGGGAGGCGCCGTCTGTGAGA
AGGTGCTTGGCGCCCCTGTGCCGGCCTTCGAGGGCCGCTCCTTCCTGGCCTTCCCCACT
CTCCGCGCCTACCACACGCTGCGCCTGGCACTGGAATTCCGGGCGCTGGAGCCTCAGG
GGCTGCTGCTGTACAATGGCAACGCCCGGGGCAAGGACTTCCTGGCATTGGCGCTGCT
AGATGGCCGCGTGCAGCTCAGGTTTGACACAGGTTCGGGGCCGGCGGTGCTGACCAGT
GCCGTGCCGGTAGAGCCGGGCCAGTGGCACCGCCTGGAGCTGTCCCGGCACTGGCGC
CGGGGCACCCTCTCGGTGGATGGTGAGACCCCTGTTCTGGGCGAGAGTCCCAGTGGCA
CCGACGGCCTCAACCTGGACACAGACCTCTTTGTGGGCGGCGTACCCGAGGACCAGGC
TGCCGTGGCGCTGGAGCGGACCTTCGTGGGCGCCGGCCTGAGGGGGTGCATCCGTTTG
CTGGACGTCAACAACCAGCGCCTGGAGCTTGGCATTGGGCCGGGGGCTGCCACCCGA
GGCTCTGGCGTGGGCGAGTGCGGGGACCACCCCTGCCTGCCCAACCCCTGCCATGGCG
GGGCCCCATGCCAGAACCTGGAGGCTGGAAGGTTCCATTGCCAGTGCCCGCCCGGCCG
CGTCGGACCAACCTGTGCCGATGAGAAGAGCCCCTGCCAGCCCAACCCCTGCCATGGG
GCGGCGCCCTGCCGTGTGCTGCCCGAGGGTGGTGCTCAGTGCGAGTGCCCCCTGGGGC
GTGAGGGCACCTTCTGCCAGACAGCCTCGGGGCAGGACGGCTCTGGGCCCTTCCTGGC
TGACTTCAACGGCTTCTCCCACCTGGAGCTGAGAGGCCTGCACACCTTTGCACGGGAC
CTGGGGGAGAAGATGGCGCTGGAGGTCGTGTTCCTGGCACGAGGCCCCAGCGGCCTC
CTGCTCTACAACGGGCAGAAGACGGACGGCAAGGGGGACTTCGTGTCGCTGGCACTG
CGGGACCGCCGCCTGGAGTTCCGCTACGACCTGGGCAAGGGGGCAGCGGTCATCAGG
AGCAGGGAGCCAGTCACCCTGGGAGCCTGGACCAGGGTCTCACTGGAGCGAAACGGC
CGCAAGGGTGCCCTGCGTGTGGGCGACGGCCCCCGTGTGTTGGGGGAGTCCCCGAAAT
CCCGCAAGGTTCCGCACACCGTCCTCAACCTGAAGGAGCCGCTCTACGTAGGGGGCGC
TCCCGACTTCAGCAAGCTGGCCCGTGCTGCTGCCGTGTCCTCTGGCTTCGACGGTGCC
ATCCAGCTGGTCTCCCTCGGAGGCCGCCAGCTGCTGACCCCGGAGCACGTGCTGCGGCAGGTGGACGTCACGTCCTTTGCAGGTCACCCCTGCACCCGGGCCTCAGGCCACCCCTGCCTCAATGGGGCCTCCTGCGTCCCGAGGGAGGCTGCCTATGTGTGCCTGTGTCCCGGGGGATTCTCAGGACCGCACTGCGAGAAGGGGCTGGTGGAGAAGTCAGCGGGGGACGTGGATACCTTGGCCTTTGACGGGCGGACCTTTGTCGAGTACCTCAACGCTGTGACCGAGAGCGAACTGGCCAATGAGATCCCCGTCCCCGAAACTCTGGATTCCGGGGCCCTTCACAGCGAGAAGGCACTGCAGAGCAACCACTTTGAACTGAGCCTGCGCACTGAGGCCACGCAGGGGCTGGTGCTCTGGAGTGGCAAGGCCACGGAGCGGGCAGACTATGTGGCACTGGCCATTGTGGACGGGCACCTGCAACTGAGCTACAACCTGGGCTCCCAGCCCGTGGTGCTGCGTTCCACCGTGCCCGTCAACACCAACCGCTGGTTGCGGGTCGTGGCACATAGGGAGCAGAGGGAAGGTTCCCTGCAGGTGGGCAATGAGGCCCCTGTGACCGGCTCCTCCCCGCTGGGCGCCACGCAGCTGGACACTGATGGAGCCCTGTGGCTTGGGGGCCTGCCGGAGCTGCCCGTGGGCCCAGCACTGCCCAAGGCCTACGGCACAGGCTTTGTGGGCTGCTTGCGGGACGTGGTGGTGGGCCGGCACCCGCTGCACCTGCTGGAGGACGCCGTCACCAAGCCAGAGCTGCGGCCCTGCCCCACCCCATGAGCTGGCACCAGAGCCCCGCGCCCGCTGTAATTATTTTCTATTTTTGTAAACTTGTTGCTTTTTGATATGATTTTCTTGCCTGAGTGTTGGCCGGAGGGACTGCTGGCCCGGCCTCCCTTCCGTCCAGGCAGCCGTGCTGCAGACAGACCTAGTGCCGAGGGATGGACAGGCGAGGTGGCAGCGTGGAGGGCTCGGCGTGGATGGCAGCCTCAGGACACACACCCCTGCCTCAAGGTGCTGAGCCCCCGCCTTGCACTGCGCCTGCCCCACGGTGTCCCCGCCGGGAAGCAGCCCCGGCTCCTGAATCACCCTCGCTCCGTCAGGCGGGACTCGTGTCCCAGAGAGGAAGGGGCTGCTGAGGTCTGATGGGGCCCTTCCTCCGGGTGACCCCACAGGGCCTTTCCAAGCCCCCATTTGAGCTGCTCCTTCCTGTGTGTGCTCTGGGCCCTGCCTCGGCCTCCTGCGCCAATACTGTGACTTCCAAACAATGTTACTGCTGGGCACAGCTCTGCGTTGCTCCCGTGCTGCCTGCGCCAGCCCCAGGCTGCTGAGGAGCAGAGGCCAGACCAGGGCCGATCTGGGTGTCCTGACCCTCAGCTGGCCCTGCCCAGCCACCCTGGACGTGACCGTATCCCTCTGCCACACCCCAGGCCCTGCGAGGGGCTATCGAGAGGAGCTCACTGTGGGATGGGGTTGACCTCTGCCGCCTGCCTGGGTATCTGGGCCTGGCCATGGCTGTGTTCTTCATGTGTTGATTTTATTTGACCCCTGGAGTGGTGGGTCTCATCTTTCCCATCTCGCCTGAGAGCGGCTGAGGGCTGCCTCACTGCAAATCCTCCCCACAGCGTCAGTGAAAGTCGTCCTTGTCTCAGAATGACCAGGGGCCAGCCAGTGTCTGACCAAGGTCAAGGGGCAGGTGCAGAGGTGGCAGGGATGGCTCCGAAGCCAGAAATGCCTTAAACTGCAACGTCCCGTCCCTTCCCCACCCCCATCCCATCCCCACCCCCAGCCCCAGCCCAGTCCTCCTAGGAGCAGGACCCGATGAAGCGGGCGGCGGTGGGGCTGGGTGCCGTGTTACTAACTCTAGTATGTTTCTGTGTCAATCGCTGTGAAATAAAGTCTGAAAACTTTAAAA
SEQ ID NO:418全mRNA多核苷酸序列
SEQ ID NO:419AGRN的外显子1的翻译多肽序列
MAGRSHPGPLRPLLPLLVVAACVLPGAGGTCPERALERREEEANVVLTGTVEEILNVDPVQHTYSCK
SEQ ID NO:420AGRN的外显子2的翻译多肽序列
VRVWRYLKGKDLVARESLLDGGNKVVISGFGDPLICDNQVSTGDTRIFFVNPAPPYLWPAHKNELMLNSSLMRITLRNLEEVEFCVE
SEQ ID NO:421AGRN的外显子3的翻译多肽序列
KPGTHFTPVPPTPPD
SEQ ID NO:422AGRN的外显子4的翻译多肽序列
CRGMLCGFGAVCEPNAEGPGRASCVCKKSPCPSVVAPVCGSDASTYSNECELQRAQCSQQRRIRLLSRGPC
SEQ ID NO:423AGRN的外显子5的翻译多肽序列
SRDPCSNVTCSFGSTCARSADGLTASCLCPATCRGAPEGTVCGSDGADYPGECQLLRRACARQENVFKKFDGPC
SEQ ID NO:424AGRN的外显子6的翻译多肽序列
PCQGALPDPSRSCRVNPRTRRPEMLLRPESCPARQAPVCGDDGVTYENDCVMGRSGAARGLLLQKVRSGQCQGR
SEQ ID NO:425AGRN的外显子7的翻译多肽序列
QCPEPCRFNAVCLSRRGRPRCSCDRVTCDGAYRPVCAQDGRTYDSDCWRQQAECRQQRAIPSKHQGPC
SEQ ID NO:426AGRN的外显子8的翻译多肽序列
QAPSPCLGVQCAFGATCAVKNGQAACECLQACSSLYDPVCGSDGVTYGSACELEATACTLGREIQVARKGPC
SEQ ID NO:427AGRN的外显子9的翻译多肽序列
RCGQCRFGALCEAETGRCVCPSECVALAQPVCGSDGHTYPSECMLHVHACTHQISLHVASAGPC
SEQ ID NO:428AGRN的外显子10的翻译多肽序列
TCGDAVCAFGAVCSAGQCVCPRCEHPPPGPVCGSDGVTYGSACELREAACLQQTQIEEARAGPCEQ
SEQ ID NO:429AGRN的外显子11的翻译多肽序列
ECGSGGSGSGEDGDCEQELCRQRGGIWDEDSEDGPCVCDFSCQSVPGSP
SEQ ID NO:430AGRN的外显子12的翻译多肽序列
VCGSDGVTYSTECELKKARCESQRGLYVAAQGACR
SEQ ID NO:431AGRN的全部27个外显子12-39按顺序排列的翻译多肽序列
VCGSDGVTYSTECELKKARCESQRGLYVAAQGACRGPTFAPLPPVAPLHCAQTPYGCCQDNITAARGVGLAGCPSACQCNPHGSYGGTCDPATGQCSCRPGVGGLRCDRCEPGFWNFRGIVTDGRSGCTPCSCDPQGAVRDDCEQMTGLCSCKPGVAGPKCGQCPDGRALGPAGCEADASAPATCAEMRCEFGARCVEESGSAHCVCPMLTCPEANATKVCGSDGVTYGNECQLKTIACRQGLQISIQSLGPCQEAVAPSTHPTSASVTVTTPGLLLSQALPAPPGALPLAPSSTAHSQTTPPPSSRPRTTASVPRTTVWPVLTVPPTAPSPAPSLVASAFGESGSTDGSSDEELSGDQEASGGGSGGLEPLEGSSVATPGPPVERASCYNSALGCCSDGKTPSLDAEGSNCPATKVFQGVLELEGVEGQELFYTPEMADPKSELFGETARSIESTLDDLFRNSDVKKDFRSVRLRDLGPGKSVRAIVDVHFDPTTAFRAPDVARALLRQIQVSRRRSLGVRRPLQEHVRFMDFDWFPAFITGATSGAIAAGATARATTASRLPSSAVTPRAPHPSHTSQPVAKTTAAPTTRRPPTTAPSRVPGRRPPAPQQPPKPCDSQPCFHGGTCQDWALGGGFTCSCPAGRGGAVCEKVLGAPVPAFEGRSFLAFPTLRAYHTLRLALEFRALEPQGLLLYNGNARGKDFLALALLDGRVQLRFDTGSGPAVLTSAVPVEPGQWHRLELSRHWRRGTLSVDGETPVLGESPSGTDGLNLDTDLFVGGVPEDQAAVALERTFVGAGLRGCIRLLDVNNQRLELGIGPGAATRGSGVGECGDHPCLPNPCHGGAPCQNLEAGRFHCQCPPGRVGPTCADEKSPCQPNPCHGAAPCRVLPEGGAQCECPLGREGTFCQTASGQDGSGPFLADFNGFSHLELRGLHTFARDLGEKMALEVVFLARGPSGLLLYNGQKTDGKGDFVSLALRDRRLEFRYDLGKGAAVIRSREPVTLGAWTRVSLERNGRKGALRVGDGPRVLGESPKSRKVPHTVLNLKEPLYVGGAPDFSKLARAAAVSSGFDGAIQLVSLGGRQLLTPEHVLRQVDVTSFAGHPCTRASGHPCLNGASCVPREAAYVCLCPGGFSGPHCEKGLVEKSAGDVDTLAFDGRTFVEYLNAVTESELANEIPVPETLDSGALHSEKALQSNHFELSLRTEATQGLVLWSGKATERADYVALAIVDGHLQLSYNLGSQPVVLRSTVPVNTNRWLRVVAHREQREGSLQVGNEAPVTGSSPLGATQLDTDGALWLGGLPELPVGPALPKAYGTGFVGCLRDVVVGRHPLHLLEDAVTKPELRPCPTP
SEQ ID NO:432全蛋白质序列
MAGRSHPGPLRPLLPLLVVAACVLPGAGGTCPERALERREEEANVVLTGTVEEILNVDPVQHTYSCKVRVWRYLKGKDLVARESLLDGGNKVVISGFGDPLICDNQVSTGDTRIFFVNPAPPYLWPAHKNELMLNSSLMRITLRNLEEVEFCVEDKPGTHFTPVPPTPPDACRGMLCGFGAVCEPNAEGPGRASCVCKKSPCPSVVAPVCGSDASTYSNECELQRAQCSQQRRIRLLSRGPCGSRDPCSNVTCSFGSTCARSADGLTASCLCPATCRGAPEGTVCGSDGADYPGECQLLRRACARQENVFKKFDGPCDPCQGALPDPSRSCRVNPRTRRPEMLLRPESCPARQAPVCGDDGVTYENDCVMGRSGAARGLLLQKVRSGQCQGRDQCPEPCRFNAVCLSRRGRPRCSCDRVTCDGAYRPVCAQDGRTYDSDCWRQQAECRQQRAIPSKHQGPCDQAPSPCLGVQCAFGATCAVKNGQAACECLQACSSLYDPVCGSDGVTYGSACELEATACTLGREIQVARKGPCDRCGQCRFGALCEAETGRCVCPSECVALAQPVCGSDGHTYPSECMLHVHACTHQISLHVASAGPCETCGDAVCAFGAVCSAGQCVCPRCEHPPPGPVCGSDGVTYGSACELREAACLQQTQIEEARAGPCEQAECGSGGSGSGEDGDCEQELCRQRGGIWDEDSEDGPCVCDFSCQSVPGSPVCGSDGVTYSTECELKKARCESQRGLYVAAQGACRGPTFAPLPPVAPLHCAQTPYGCCQDNITAARGVGLAGCPSACQCNPHGSYGGTCDPATGQCSCRPGVGGLRCDRCEPGFWNFRGIVTDGRSGCTPCSCDPQGAVRDDCEQMTGLCSCKPGVAGPKCGQCPDGRALGPAGCEADASAPATCAEMRCEFGARCVEESGSAHCVCPMLTCPEANATKVCGSDGVTYGNECQLKTIACRQGLQISIQSLGPCQEAVAPSTHPTSASVTVTTPGLLLSQALPAPPGALPLAPSSTAHSQTTPPPSSRPRTTASVPRTTVWPVLTVPPTAPSPAPSLVASAFGESGSTDGSSDEELSGDQEASGGGSGGLEPLEGSSVATPGPPVERASCYNSALGCCSDGKTPSLDAEGSNCPATKVFQGVLELEGVEGQELFYTPEMADPKSELFGETARSIESTLDDLFRNSDVKKDFRSVRLRDLGPGKSVRAIVDVHFDPTTAFRAPDVARALLRQIQVSRRRSLGVRRPLQEHVRFMDFDWFPAFITGATSGAIAAGATARATTASRLPSSAVTPRAPHPSHTSQPVAKTTAAPTTRRPPTTAPSRVPGRRPPAPQQPPKPCDSQPCFHGGTCQDWALGGGFTCSCPAGRGGAVCEKVLGAPVPAFEGRSFLAFPTLRAYHTLRLALEFRALEPQGLLLYNGNARGKDFLALALLDGRVQLRFDTGSGPAVLTSAVPVEPGQWHRLELSRHWRRGTLSVDGETPVLGESPSGTDGLNLDTDLFVGGVPEDQAAVALERTFVGAGLRGCIRLLDVNNQRLELGIGPGAATRGSGVGECGDHPCLPNPCHGGAPCQNLEAGRFHCQCPPGRVGPTCADEKSPCQPNPCHGAAPCRVLPEGGAQCECPLGREGTFCQTASGQDGSGPFLADFNGFSHLELRGLHTFARDLGEKMALEVVFLARGPSGLLLYNGQKTDGKGDFVSLALRDRRLEFRYDLGKGAAVIRSREPVTLGAWTRVSLERNGRKGALRVGDGPRVLGESPKSRKVPHTVLNLKEPLYVGGAPDFSKLARAAAVSSGFDGAIQLVSLGGRQLLTPEHVLRQVDVTSFAGHPCTRASGHPCLNGASCVPREAAYVCLCPGGFSGPHCEKGLVEKSAGDVDTLAFDGRTFVEYLNAVTESELANEIPVPETLDSGALHSEKALQSNHFELSLRTEATQGLVLWSGKATERADYVALAIVDGHLQLSYNLGSQPVVLRSTVPVNTNRWLRVVAHREQREGSLQVGNEAPVTGSSPLGATQLDTDGALWLGGLPELPVGPALPKAYGTGFVGCLRDVVVGRHPLHLLEDAVTKPELRPCPTP
SEQ ID NO:433AGRN的全部12个外显子1-12按顺序排列的多核苷酸序列
SEQ ID NO:434AGRN的全部12个外显子1-12按顺序排列的翻译多肽序列
PVALB序列信息
SEQ ID NO:435PVALB-NRG1融合物5’处的PVAPB外显子4序列
TAAAAGGCTTCTCCCCAGATGCCAGAGACCTGTCTGCTAAAGAAACCAAGATGCTGATGGCTGCTGGAGACAAAGATGGGGACGGCAAAATTGGGGTTGACG
SEQ ID NO:436PVALB-NRG1融合物3’处的NRG1外显子6序列
CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCTTCATGGTGAAAGACCTTTCAAACCCCTCGAGATACTTG
SEQ ID NO:437PVALB-NRG1多核苷酸序列
TAAAAGGCTTCTCCCCAGATGCCAGAGACCTGTCTGCTAAAGAAACCAAGATGCTGATGGCTGCTGGAGACAAAGATGGGGACGGCAAAATTGGGGTTGACGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCTTCATGGTGAAAGACCTTTCAAACCCCTCGAGATACTTG
SEQ ID NO:438PVALB-NRG1多肽序列
KGFSPDARDLSAKETKMLMAAGDKDGDGKIGVDATSTSTTGTSHLVKCAEKEKTFCVNGGECFMVKDLSNPSRYL
SEQ ID NO:439PVALB的外显子1
ACTTCCCGACAGGACTTCCCACCAGCCCAGCCTTTCAGTGCAGGCTCCAGCCCTCCACCCCCACCCGAG
SEQ ID NO:440PVALB的外显子2
TTGCAGGATGTCGATGACAGACTTGCTGAACGCTGAGGACATCAAGAAGGCGGTGGGAGCCTTTAGCG
SEQ ID NO:441PVALB的外显子3
CTACCGACTCCTTCGACCACAAAAAGTTCTTCCAAATGGTCGGCCTGAAGAAAAAGAGTGCGGATGATGTGAAGAAGGTGTTTCACATGCTGGACAAGGACAAAAGTGGCTTCATCGAGGAGGATGAGCTGGG
SEQ ID NO:442PVALB的外显子4
ATTCATCCTAAAAGGCTTCTCCCCAGATGCCAGAGACCTGTCTGCTAAAGAAACCAAGATGCTGATGGCTGCTGGAGACAAAGATGGGGACGGCAAAATTGGGGTTGACG
SEQ ID NO:443PVALB的外显子5
AATTCTCCACTCTGGTGGCTGAAAGCTAAGAAGCACTGACTGCCCCTGGTCTTCCACCTCTCTGCCCTGAACACCCAATCTCGGCCCCTCTCGCCACCCTCCTGCATTTCTGTTCAGTTCGTTTATGTTATTTTTTACTCCCCCATCCCCTGTGGCCCTCTAATGACACCATTCTTCTGGAAAATGCTGGAGAAGCAATAAAGGTTGTACCAGTCA
SEQ ID NO:444全mRNA多核苷酸序列
ACTTCCCGACAGGACTTCCCACCAGCCCAGCCTTTCAGTGCAGGCTCCAGCCCTCCACCCCCACCCGAGTTGCAGGATGTCGATGACAGACTTGCTGAACGCTGAGGACATCAAGAAGGCGGTGGGAGCCTTTAGCGCTACCGACTCCTTCGACCACAAAAAGTTCTTCCAAATGGTCGGCCTGAAGAAAAAGAGTGCGGATGATGTGAAGAAGGTGTTTCACATGCTGGACAAGGACAAAAGTGGCTTCATCGAGGAGGATGAGCTGGGATTCATCCTAAAAGGCTTCTCCCCAGATGCCAGAGACCTGTCTGCTAAAGAAACCAAGATGCTGATGGCTGCTGGAGACAAAGATGGGGACGGCAAAATTGGGGTTGACGAATTCTCCACTCTGGTGGCTGAAAGCTAAGAAGCACTGACTGCCCCTGGTCTTCCACCTCTCTGCCCTGAACACCCAATCTCGGCCCCTCTCGCCACCCTCCTGCATTTCTGTTCAGTTCGTTTATGTTATTTTTTACTCCCCCATCCCCTGTGGCCCTCTAATGACACCATTCTTCTGGAAAATGCTGGAGAAGCAATAAAGGTTGTACCAGTCA
SEQ ID NO:445PVALB的外显子2的翻译多肽序列
MSMTDLLNAEDIKKAVGAFS
SEQ ID NO:446PVALB的外显子3的翻译多肽序列
TDSFDHKKFFQMVGLKKKSADDVKKVFHMLDKDKSGFIEEDEL
SEQ ID NO:447PVALB的外显子4的翻译多肽序列
FILKGFSPDARDLSAKETKMLMAAGDKDGDGKIGVD
SEQ ID NO:448PVALB的外显子5的翻译多肽序列
FSTLVAES
SEQ ID NO:449全蛋白质序列
MSMTDLLNAEDIKKAVGAFSATDSFDHKKFFQMVGLKKKSADDVKKVFHMLDKDKSGFIEEDELGFILKGFSPDARDLSAKETKMLMAAGDKDGDGKIGVDEFSTLVAES
SEQ ID NO:450PVALB的全部4个外显子1-4按顺序排列的多核苷酸序列
SEQ ID NO:451PVALB的全部3个外显子2-4按顺序排列的翻译多肽序列
SLC3A2转录本3序列信息
SEQ ID NO:452SLC3A2-NRG1融合物5’处的SLC3A2外显子2序列
AGTTGGGGTCTCACTGTGTTGCCCAGACTGGTCTCGAACTCTTGGCCTCAGGTGATCCTCTTCCCTCAGCTTCCCAGAATGCCGAGATGATAG
SEQ ID NO:453SLC3A2-NRG1融合物3’处的NRG1外显子6序列
CTACATCTACATCCACCACTGGGACAAG
SEQ ID NO:454SLC3A2-NRG1多核苷酸序列
AGTTGGGGTCTCACTGTGTTGCCCAGACTGGTCTCGAACTCTTGGCCTCAGGTGATCCTCTTCCCTCAGCTTCCCAGAATGCCGAGATGATAGCTACATCTACATCCACCACTGGGACAAG
SEQ ID NO:455SLC3A2-NRG1多肽序列
LGSHCVAQTGLELLASGDPLPSASQNAEMIATSTSTTGT
SEQ ID NO:456SLC3A2的外显子1
GCATTGCGGCTTGGTTTTCTCACCCAGTGCATGTGGCAGGAGCGGTGAGATCACTGCCTCACGGCGATCCTGGACTGACGGTCACGACTGCCTACCCTCTAACCCTGTTCTGAGCTGCCCCTTGCCCACACACCCCAAACCTGTGTGCAGGATCCGCCTCCATGGAGCTACAGCCTCCTGAAGCCTCGATCGCCGTCGTGTCGATTCCGCGCCAGTTGCCTGGCTCACATTCGGAGGCTGGTGTCCAGGGTCTCAGCGCGGGGGACGACTCAG
SEQ ID NO:457SLC3A2的外显子2
AGTTGGGGTCTCACTGTGTTGCCCAGACTGGTCTCGAACTCTTGGCCTCAGGTGATCCTCTTCCCTCAGCTTCCCAGAATGCCGAGATGATAG
SEQ ID NO:458SLC3A2的外显子3
AGACGGGGTCTGACTGTGTTACCCAGGCTGGTCTTCAACTCTTGGCCTCAAGTGATCCTCCTGCCTTAGCTTCCAAGAATGCTGAGGTTACAG
SEQ ID NO:459SLC3A2的外显子4
GCACCATGAGCCAGGACACCGAGGTGGATATGAAGGAGGTGGAGCTGAATGAGTTAGAGCCCGAGAAGCAGCCGATGAACGCGGCGTCTGGGGCGGCCATGTCCCTGGCGGGAGCCGAGAAGAATGGTCTGGTGAAGATCAAGGTGGCGGAAGACGAGGCGGAGGCGGCAGCCGCGGCTAAGTTCACGGGCCTGTCCAAGGAGGAGCTGCTGAAGGTGGCAGGCAGCCCCGGCTGGGTACGCACCCGCTGGGCACTGCTGCTGCTCTTCTGGCTCGGCTGGCTCGGCATGCTTGCTGGTGCCGTGGTCATAATCGTGCGAGCGCCGCGTTGTCGCGAGCTACCGGCGCAGAAGTGGTGGCACACGGGCGCCCTCTACCGCATCGGCGACCTTCAGGCCTTCCAGGGCCACGGCGCGGGCAACCTGGCGG
SEQ ID NO:460SLC3A2的外显子5
GTCTGAAGGGGCGTCTCGATTACCTGAGCTCTCTGAAGGTGAAGGGCCTTGTGCTGGGTCCAATTCACAAGAACCAGAAGGATGATGTCGCTCAGACTGACTTGCTGCAGATCGACCCCAATTTTGGCTCCAAGGAAGATTTTGACAGTCTCTTGCAATCGGCTAAAAAAAAGASEQ ID NO:461SLC3A2的外显子6
GCATCCGTGTCATTCTGGACCTTACTCCCAACTACCGGGGTGAGAACTCGTGGTTCTCCACTCAGGTTGACACTGTGGCCACCAAGGTGAAG
SEQ ID NO:462SLC3A2的外显子7
GATGCTCTGGAGTTTTGGCTGCAAGCTGGCGTGGATGGGTTCCAGGTTCGGGACATAGAGAATCTGAAG
SEQ ID NO:463SLC3A2的外显子8
GATGCATCCTCATTCTTGGCTGAGTGGCAAAATATCACCAAGGGCTTCAGTGAAGACAG
SEQ ID NO:464SLC3A2的外显子9
GCTCTTGATTGCGGGGACTAACTCCTCCGACCTTCAGCAGATCCTGAGCCTACTCGAATCCAACAAAGACTTGCTGTTGACTAGCTCATACCTGTCTGATTCTGGTTCTACTGGGGAGCATACAAAATCCCTAGTCACACAGTATTTGAATGCCACTGGCAATCGCTGGTGCAGCTGGAGT
SEQ ID NO:465SLC3A2的外显子10
TTGTCTCAGGCAAGGCTCCTGACTTCCTTCTTGCCGGCTCAACTTCTCCGACTCTACCAGCTGATGCTCTTCACCCTGCCAGGGACCCCTGTTTTCAGCTACGGGGATGAGATTGGCCTGGATGCAGCTGCCCTTCCTGGACAG
SEQ ID NO:466SLC3A2的外显子11
CCTATGGAGGCTCCAGTCATGCTGTGGGATGAGTCCAGCTTCCCTGACATCCCAGGGGCTGTAAGTGCCAACATGACTGTGAAG
SEQ ID NO:467SLC3A2的外显子12
GGCCAGAGTGAAGACCCTGGCTCCCTCCTTTCCTTGTTCCGGCGGCTGAGTGACCAGCGGAGTAAGGAGCGCTCCCTACTGCATGGGGACTTCCACGCGTTCTCCGCTGGGCCTGGACTCTTCTCCTATATCCGCCACTGGGACCAGAATGAGCGTTTTCTGGTAGTGCTTAACTTTGGGGATGTGGGCCTCTCGGCTGGACTGCAGGCCTCCGACCTGCCTGCCAGCGCCAGCCTGCCAGCCAAGGCTGACCTCCTGCTCAGCACCCAGCCAGGCCGTGAGGAGGGCTCCCCTCTTGAGCTGGAACGCCTGAAACTGGAGCCTCACGAAGGGCTGCTGCTCCGCTTCCCCTACGCGGCCTGACTTCAGCCTGACATGGACCCACTACCCTTCTCCTTTCCTTCCCAGGCCCTTTGGCTTCTGATTTTTCTCTTTTTTAAAAACAAACAAACAAACTGTTGCAGATTATGAGTGAACCCCCAAATAGGGTGTTTTCTGCCTTCAAATAAAAGTCACCCCTGCATGGTGAA
SEQ ID NO:468SLC3A2的全mRNA多核苷酸序列
SEQ ID NO:469SLC3A2的外显子1的翻译多肽序列
MELQPPEASIAVVSIPRQLPGSHSEAGVQGLSAGDDS
SEQ ID NO:470SLC3A2的外显子2的翻译多肽序列
LGSHCVAQTGLELLASGDPLPSASQNAEMI
SEQ ID NO:471SLC3A2的外显子3的翻译多肽序列
TGSDCVTQAGLQLLASSDPPALASKNAEVT
SEQ ID NO:472SLC3A2的外显子4的翻译多肽序列
TMSQDTEVDMKEVELNELEPEKQPMNAASGAAMSLAGAEKNGLVKIKVAEDEAEAAAAAKFTGLSKEELLKVAGSPGWVRTRWALLLLFWLGWLGMLAGAVVIIVRAPRCRELPAQKWWHTGALYRIGDLQAFQGHGAGNLA
SEQ ID NO:473SLC3A2的外显子5的翻译多肽序列
LKGRLDYLSSLKVKGLVLGPIHKNQKDDVAQTDLLQIDPNFGSKEDFDSLLQSAKKK
SEQ ID NO:474SLC3A2的外显子6的翻译多肽序列
IRVILDLTPNYRGENSWFSTQVDTVATKVK
SEQ ID NO:475SLC3A2的外显子7的翻译多肽序列
DALEFWLQAGVDGFQVRDIENLK
SEQ ID NO:476SLC3A2的外显子8的翻译多肽序列
DASSFLAEWQNITKGFSED
SEQ ID NO:477SLC3A2的外显子9的翻译多肽序列
LLIAGTNSSDLQQILSLLESNKDLLLTSSYLSDSGSTGEHTKSLVTQYLNATGNRWCSWS
SEQ ID NO:478SLC3A2的外显子10的翻译多肽序列
LSQARLLTSFLPAQLLRLYQLMLFTLPGTPVFSYGDEIGLDAAALPGQ
SEQ ID NO:479SLC3A2的外显子11的翻译多肽序列
PMEAPVMLWDESSFPDIPGAVSANMTVK
SEQ ID NO:480SLC3A2的外显子12的翻译多肽序列
GQSEDPGSLLSLFRRLSDQRSKERSLLHGDFHAFSAGPGLFSYIRHWDQNERFLVVLNFGDVGLSAGLQASDLPASASLPAKADLLLSTQPGREEGSPLELERLKLEPHEGLLLRFPYAA
SEQ ID NO:481SLC3A2的全蛋白质序列
MELQPPEASIAVVSIPRQLPGSHSEAGVQGLSAGDDSELGSHCVAQTGLELLASGDPLPSASQNAEMIETGSDCVTQAGLQLLASSDPPALASKNAEVTGTMSQDTEVDMKEVELNELEPEKQPMNAASGAAMSLAGAEKNGLVKIKVAEDEAEAAAAAKFTGLSKEELLKVAGSPGWVRTRWALLLLFWLGWLGMLAGAVVIIVRAPRCRELPAQKWWHTGALYRIGDLQAFQGHGAGNLAGLKGRLDYLSSLKVKGLVLGPIHKNQKDDVAQTDLLQIDPNFGSKEDFDSLLQSAKKKSIRVILDLTPNYRGENSWFSTQVDTVATKVKDALEFWLQAGVDGFQVRDIENLKDASSFLAEWQNITKGFSEDRLLIAGTNSSDLQQILSLLESNKDLLLTSSYLSDSGSTGEHTKSLVTQYLNATGNRWCSWSLSQARLLTSFLPAQLLRLYQLMLFTLPGTPVFSYGDEIGLDAAALPGQPMEAPVMLWDESSFPDIPGAVSANMTVKGQSEDPGSLLSLFRRLSDQRSKERSLLHGDFHAFSAGPGLFSYIRHWDQNERFLVVLNFGDVGLSAGLQASDLPASASLPAKADLLLSTQPGREEGSPLELERLKLEPHEGLLLRFPYAA
SEQ ID NO:482SLC3A2的外显子1和2按顺序排列的多核苷酸序列
SEQ ID NO:483SLC3A2的外显子1-2按顺序排列的翻译多肽序列
APP序列信息
SEQ ID NO:484来自APP-NRG1融合物5’处的APP外显子14的序列
TTGAGCCTGTTGATGCCCGCCCTGCTGCCGACCGAGGACTGACCACTCGACCAG
SEQ ID NO:485APP-NRG1融合物3’处的NRG1外显子6序列
CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCT
SEQ ID NO:486APP-NRG1多核苷酸序列
TTGAGCCTGTTGATGCCCGCCCTGCTGCCGACCGAGGACTGACCACTCGACCAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCT
SEQ ID NO:487APP-NRG1多肽序列
EPVDARPAADRGLTTRPATSTSTTGTSHLVKCAEKEKTFCVNGGEC
SEQ ID NO:488APP的外显子1
GTCAGTTTCCTCGGCAGCGGTAGGCGAGAGCACGCGGAGGAGCGTGCGCGGGGGCCCCGGGAGACGGCGGCGGTGGCGGCGCGGGCAGAGCAAGGACGCGGCGGATCCCACTCGCACAGCAGCGCACTCGGTGCCCCGCGCAGGGTCGCGATGCTGCCCGGTTTGGCACTGCTCCTGCTGGCCGCCTGGACGGCTCGGGCGCTGGAG
SEQ ID NO:489APP的外显子2
GTCTACCCTGAACTGCAGATCACCAATGTGGTAGAAGCCAACCAACCAGTGACCATCCAGAACTGGTGCAAGCGGGGCCGCAAGCAGTGCAAGACCCATCCCCACTTTGTGATTCCCTACCGCTGCTTAG
SEQ ID NO:490APP的外显子3
TTGGTGAGTTTGTAAGTGATGCCCTTCTCGTTCCTGACAAGTGCAAATTCTTACACCAGGAGAGGATGGATGTTTGCGAAACTCATCTTCACTGGCACACCGTCGCCAAAGAG
SEQ ID NO:491APP的外显子4
ACATGCAGTGAGAAGAGTACCAACTTGCATGACTACGGCATGTTGCTGCCCTGCGGAATTGACAAGTTCCGAGGGGTAGAGTTTGTGTGTTGCCCACTGGCTGAAGAAAGTGACAATGTGGATTCTGCTGATGCGGAGGAGGATGACTCGGATGTCTGGTGGGGCGGAGCAGACACAGACTATGCAGATGGGAG
SEQ ID NO:492APP的外显子5
TGAAGACAAAGTAGTAGAAGTAGCAGAGGAGGAAGAAGTGGCTGAGGTGGAAGAAGAAGAAGCCGATGATGACGAGGACGATGAGGATGGTGATGAGGTAGAGGAAGAGGCTGAGGAACCCTACGAAGAAGCCACAGAGAGAACCACCAGCATTGCCACCACCACCACCACCACCACAGAGTCTGTGGAAGAGGTGGTTCGAG
SEQ ID NO:493APP的外显子6
AGGTGTGCTCTGAACAAGCCGAGACGGGGCCGTGCCGAGCAATGATCTCCCGCTGGTACTTTGATGTGACTGAAGGGAAGTGTGCCCCATTCTTTTACGGCGGATGTGGCGGCAACCGGAACAACTTTGACACAGAAGAGTACTGCATGGCCGTGTGTGGCAGCGCCA
SEQ ID NO:494APP的外显子7
TGTCCCAAAGTTTACTCAAGACTACCCAGGAACCTCTTGCCCGAGATCCTGTTAAAC
SEQ ID NO:495APP的外显子8
TTCCTACAACAGCAGCCAGTACCCCTGATGCCGTTGACAAGTATCTCGAGACACCTGGGGATGAGAATGAACATGCCCATTTCCAGAAAGCCAAAGAGAGGCTTGAGGCCAAGCACCGAGAGAGAATGTCCCAG
SEQ ID NO:496APP的外显子9
GTCATGAGAGAATGGGAAGAGGCAGAACGTCAAGCAAAGAACTTGCCTAAAGCTGATAAGAAGGCAGTTATCCAG
SEQ ID NO:497APP的外显子10
CATTTCCAGGAGAAAGTGGAATCTTTGGAACAGGAAGCAGCCAACGAGAGACAGCAGCTGGTGGAGACACACATGGCCAGAGTGGAAGCCATGCTCAATGACCGCCGCCGCCTGGCCCTGGAGAACTACATCACCGCTCTGCAGGCTGTTCCTCCTCGG
SEQ ID NO:498APP的外显子11
CCTCGTCACGTGTTCAATATGCTAAAGAAGTATGTCCGCGCAGAACAGAAGGACAGACAGCACACCCTAAAGCATTTCGAGCATGTGCGCATGGTGGATCCCAAGAAAGCCGCTCAGATCCGGTCCCAG
SEQ ID NO:499APP的外显子12GTTATGACACACCTCCGTGTGATTTATGAGCGCATGAATCAGTCTCTCTCCCTGCTCTACAACGTGCCTGCAGTGGCCGAGGAGATTCAGGATGAAGTTG
SEQ ID NO:500APP的外显子13
ATGAGCTGCTTCAGAAAGAGCAAAACTATTCAGATGACGTCTTGGCCAACATGATTAGTGAACCAAGGATCAGTTACGGAAACGATGCTCTCATGCCATCTTTGACCGAAACGAAAACCACCGTGGAGCTCCTTCCCGTGAATGGAGAGTTCAGCCTGGACGATCTCCAGCCGTGGCATTCTTTTGGGGCTGACTCTGTGCCAGCCAACACAGAAAACGAAG
SEQ ID NO:501APP的外显子14
TTGAGCCTGTTGATGCCCGCCCTGCTGCCGACCGAGGACTGACCACTCGACCAG
SEQ ID NO:502APP的外显子15
GTTCTGGGTTGACAAATATCAAGACGGAGGAGATCTCTGAAGTGAAGATGGATGCAGAATTCCGACATGACTCAGGATATGAAGTTCATCATCAAAAATTG
SEQ ID NO:503APP的外显子16
GTGTTCTTTGCAGAAGATGTGGGTTCAAACAAAGGTGCAATCATTGGACTCATGGTGGGCGGTGTTGTCATAGCGACAGTGATCGTCATCACCTTGGTGATGCTGAAGAAGAAACAGTACACATCCATTCATCATGGTGTGGTGGAG
SEQ ID NO:504APP的外显子17
GTTGACGCCGCTGTCACCCCAGAGGAGCGCCACCTGTCCAAGATGCAGCAGAACGGCTACGAAAATCCAACCTACAAGTTCTTTGAGCAGATGCAGAACTAGACCCCCGCCACAGCAGCCTCTGAAGTTGGACAGCAAAACCATTGCTTCACTACCCATCGGTGTCCATTTATAGAATAATGTGGGAAGAAACAAACCCGTTTTATGATTTACTCATTATCGCCTTTTGACAGCTGTGCTGTAACACAAGTAGATGCCTGAACTTGAATTAATCCACACATCAGTAATGTATTCTATCTCTCTTTACATTTTGGTCTCTATACTACATTATTAATGGGTTTTGTGTACTGTAAAGAATTTAGCTGTATCAAACTAGTGCATGAATAGATTCTCTCCTGATTATTTATCACATAGCCCCTTAGCCAGTTGTATATTATTCTTGTGGTTTGTGACCCAATTAAGTCCTACTTTACATATGCTTTAAGAATCGATGGGGGATGCTTCATGTGAACGTGGGAGTTCAGCTGCTTCTCTTGCCTAAGTATTCCTTTCCTGATCACTATGCATTTTAAAGTTAAACATTTTTAAGTATTTCAGATGCTTTAGAGAGATTTTTTTTCCATGACTGCATTTTACTGTACAGATTGCTGCTTCTGCTATATTTGTGATATAGGAATTAAGAGGATACACACGTTTGTTTCTTCGTGCCTGTTTTATGTGCACACATTAGGCATTGAGACTTCAAGCTTTTCTTTTTTTGTCCACGTATCTTTGGGTCTTTGATAAAGAAAAGAATCCCTGTTCATTGTAAGCACTTTTACGGGGCGGGTGGGGAGGGGTGCTCTGCTGGTCTTCAATTACCAAGAATTCTCCAAAACAATTTTCTGCAGGATGATTGTACAGAATCATTGCTTATGACATGATCGCTTTCTACACTGTATTACATAAATAAATTAAATAAAATAACCCCGGGCAAGACTTTTCTTTGAAGGATGACTACAGACATTAAATAATCGAAGTAATTTTGGGTGGGGAGAAGAGGCAGATTCAATTTTCTTTAACCAGTCTGAAGTTTCATTTATGATACAAAAGAAGATGAAAATGGAAGTGGCAATATAAGGGGATGAGGAAGGCATGCCTGGACAAACCCTTCTTTTAAGATGTGTCTTCAATTTGTATAAAATGGTGTTTTCATGTAAATAAATACATTCTTGGAGGAGCA
SEQ ID NO:505APP的全mRNA多核苷酸序列
GTCAGTTTCCTCGGCAGCGGTAGGCGAGAGCACGCGGAGGAGCGTGCGCGGGGGCCCCGGGAGACGGCGGCGGTGGCGGCGCGGGCAGAGCAAGGACGCGGCGGATCCCACTCGCACAGCAGCGCACTCGGTGCCCCGCGCAGGGTCGCGATGCTGCCCGGTTTGGCACTGCTCCTGCTGGCCGCCTGGACGGCTCGGGCGCTGGAGGTCTACCCTGAACTGCAGATCACCAATGTGGTAGAAGCCAACCAACCAGTGACCATCCAGAACTGGTGCAAGCGGGGCCGCAAGCAGTGCAAGACCCATCCCCACTTTGTGATTCCCTACCGCTGCTTAGTTGGTGAGTTTGTAAGTGATGCCCTTCTCGTTCCTGACAAGTGCAAATTCTTACACCAGGAGAGGATGGATGTTTGCGAAACTCATCTTCACTGGCACACCGTCGCCAAAGAGACATGCAGTGAGAAGAGTACCAACTTGCATGACTACGGCATGTTGCTGCCCTGCGGAATTGACAAGTTCCGAGGGGTAGAGTTTGTGTGTTGCCCACTGGCTGAAGAAAGTGACAATGTGGATTCTGCTGATGCGGAGGAGGATGACTCGGATGTCTGGTGGGGCGGAGCAGACACAGACTATGCAGATGGGAGTGAAGACAAAGTAGTAGAAGTAGCAGAGGAGGAAGAAGTGGCTGAGGTGGAAGAAGAAGAAGCCGATGATGACGAGGACGATGAGGATGGTGATGAGGTAGAGGAAGAGGCTGAGGAACCCTACGAAGAAGCCACAGAGAGAACCACCAGCATTGCCACCACCACCACCACCACCACAGAGTCTGTGGAAGAGGTGGTTCGAGAGGTGTGCTCTGAACAAGCCGAGACGGGGCCGTGCCGAGCAATGATCTCCCGCTGGTACTTTGATGTGACTGAAGGGAAGTGTGCCCCATTCTTTTACGGCGGATGTGGCGGCAACCGGAACAACTTTGACACAGAAGAGTACTGCATGGCCGTGTGTGGCAGCGCCATGTCCCAAAGTTTACTCAAGACTACCCAGGAACCTCTTGCCCGAGATCCTGTTAAACTTCCTACAACAGCAGCCAGTACCCCTGATGCCGTTGACAAGTATCTCGAGACACCTGGGGATGAGAATGAACATGCCCATTTCCAGAAAGCCAAAGAGAGGCTTGAGGCCAAGCACCGAGAGAGAATGTCCCAGGTCATGAGAGAATGGGAAGAGGCAGAACGTCAAGCAAAGAACTTGCCTAAAGCTGATAAGAAGGCAGTTATCCAGCATTTCCAGGAGAAAGTGGAATCTTTGGAACAGGAAGCAGCCAACGAGAGACAGCAGCTGGTGGAGACACACATGGCCAGAGTGGAAGCCATGCTCAATGACCGCCGCCGCCTGGCCCTGGAGAACTACATCACCGCTCTGCAGGCTGTTCCTCCTCGGCCTCGTCACGTGTTCAATATGCTAAAGAAGTATGTCCGCGCAGAACAGAAGGACAGACAGCACACCCTAAAGCATTTCGAGCATGTGCGCATGGTGGATCCCAAGAAAGCCGCTCAGATCCGGTCCCAGGTTATGACACACCTCCGTGTGATTTATGAGCGCATGAATCAGTCTCTCTCCCTGCTCTACAACGTGCCTGCAGTGGCCGAGGAGATTCAGGATGAAGTTGATGAGCTGCTTCAGAAAGAGCAAAACTATTCAGATGACGTCTTGGCCAACATGATTAGTGAACCAAGGATCAGTTACGGAAACGATGCTCTCATGCCATCTTTGACCGAAACGAAAACCACCGTGGAGCTCCTTCCCGTGAATGGAGAGTTCAGCCTGGACGATCTCCAGCCGTGGCATTCTTTTGGGGCTGACTCTGTGCCAGCCAACACAGAAAACGAAGTTGAGCCTGTTGATGCCCGCCCTGCTGCCGACCGAGGACTGACCACTCGACCAGGTTCTGGGTTGACAAATATCAAGACGGAGGAGATCTCTGAAGTGAAGATGGATGCAGAATTCCGACATGACTCAGGATATGAAGTTCATCATCAAAAATTGGTGTTCTTTGCAGAAGATGTGGGTTCAAACAAAGGTGCAATCATTGGACTCATGGTGGGCGGTGTTGTCATAGCGACAGTGATCGTCATCACCTTGGTGATGCTGAAGAAGAAACAGTACACATCCATTCATCATGGTGTGGTGGAGGTTGACGCCGCTGTCACCCCAGAGGAGCGCCACCTGTCCAAGATGCAGCAGAACGGCTACGAAAATCCAACCTACAAGTTCTTTGAGCAGATGCAGAACTAGACCCCCGCCACAGCAGCCTCTGAAGTTGGACAGCAAAACCATTGCTTCACTACCCATCGGTGTCCATTTATAGAATAATGTGGGAAGAAACAAACCCGTTTTATGATTTACTCATTATCGCCTTTTGACAGCTGTGCTGTAACACAAGTAGATGCCTGAACTTGAATTAATCCACACATCAGTAATGTATTCTATCTCTCTTTACATTTTGGTCTCTATACTACATTATTAATGGGTTTTGTGTACTGTAAAGAATTTAGCTGTATCAAACTAGTGCATGAATAGATTCTCTCCTGATTATTTATCACATAGCCCCTTAGCCAGTTGTATATTATTCTTGTGGTTTGTGACCCAATTAAGTCCTACTTTACATATGCTTTAAGAATCGATGGGGGATGCTTCATGTGAACGTGGGAGTTCAGCTGCTTCTCTTGCCTAAGTATTCCTTTCCTGATCACTATGCATTTTAAAGTTAAACATTTTTAAGTATTTCAGATGCTTTAGAGAGATTTTTTTTCCATGACTGCATTTTACTGTACAGATTGCTGCTTCTGCTATATTTGTGATATAGGAATTAAGAGGATACACACGTTTGTTTCTTCGTGCCTGTTTTATGTGCACACATTAGGCATTGAGACTTCAAGCTTTTCTTTTTTTGTCCACGTATCTTTGGGTCTTTGATAAAGAAAAGAATCCCTGTTCATTGTAAGCACTTTTACGGGGCGGGTGGGGAGGGGTGCTCTGCTGGTCTTCAATTACCAAGAATTCTCCAAAACAATTTTCTGCAGGATGATTGTACAGAATCATTGCTTATGACATGATCGCTTTCTACACTGTATTACATAAATAAATTAAATAAAATAACCCCGGGCAAGACTTTTCTTTGAAGGATGACTACAGACATTAAATAATCGAAGTAATTTTGGGTGGGGAGAAGAGGCAGATTCAATTTTCTTTAACCAGTCTGAAGTTTCATTTATGATACAAAAGAAGATGAAAATGGAAGTGGCAATATAAGGGGATGAGGAAGGCATGCCTGGACAAACCCTTCTTTTAAGATGTGTCTTCAATTTGTATAAAATGGTGTTTTCATGTAAATAAATACATTCTTGGAGGAGCA
SEQ ID NO:506APP的外显子1的翻译多肽序列
MLPGLALLLLAAWTARALE
SEQ ID NO:507APP的外显子2的翻译多肽序列
VYPELQITNVVEANQPVTIQNWCKRGRKQCKTHPHFVIPYRCL
SEQ ID NO:508APP的外显子3的翻译多肽序列
GEFVSDALLVPDKCKFLHQERMDVCETHLHWHTVAKE
SEQ ID NO:509APP的外显子4的翻译多肽序列
TCSEKSTNLHDYGMLLPCGIDKFRGVEFVCCPLAEESDNVDSADAEEDDSDVWWGGADTDYADG
SEQ ID NO:510APP的外显子5的翻译多肽序列
EDKVVEVAEEEEVAEVEEEEADDDEDDEDGDEVEEEAEEPYEEATERTTSIATTTTTTTESVEEVVR
SEQ ID NO:511APP的外显子6的翻译多肽序列
VCSEQAETGPCRAMISRWYFDVTEGKCAPFFYGGCGGNRNNFDTEEYCMAVCGSA
SEQ ID NO:512APP的外显子7的翻译多肽序列
SQSLLKTTQEPLARDPVK
SEQ ID NO:513APP的外显子8的翻译多肽序列
PTTAASTPDAVDKYLETPGDENEHAHFQKAKERLEAKHRERMSQ
SEQ ID NO:514APP的外显子9的翻译多肽序列
VMREWEEAERQAKNLPKADKKAVIQ
SEQ ID NO:515APP的外显子10的翻译多肽序列
HFQEKVESLEQEAANERQQLVETHMARVEAMLNDRRRLALENYITALQAVPPR
SEQ ID NO:516APP的外显子11的翻译多肽序列
PRHVFNMLKKYVRAEQKDRQHTLKHFEHVRMVDPKKAAQIRSQ
SEQ ID NO:517APP的外显子12的翻译多肽序列
VMTHLRVIYERMNQSLSLLYNVPAVAEEIQDEV
SEQ ID NO:518APP的外显子13的翻译多肽序列
ELLQKEQNYSDDVLANMISEPRISYGNDALMPSLTETKTTVELLPVNGEFSLDDLQPWHSFGADSVPANTENE
SEQ ID NO:519APP的外显子14的翻译多肽序列
EPVDARPAADRGLTTRP
SEQ ID NO:520APP的外显子15的翻译多肽序列
SGLTNIKTEEISEVKMDAEFRHDSGYEVHHQKL
SEQ ID NO:521APP的外显子16的翻译多肽序列
VFFAEDVGSNKGAIIGLMVGGVVIATVIVITLVMLKKKQYTSIHHGVVE
SEQ ID NO:522APP的外显子17的翻译多肽序列
VDAAVTPEERHLSKMQQNGYENPTYKFFEQMQN
SEQ ID NO:523APP的全蛋白质序列
MLPGLALLLLAAWTARALEVYPELQITNVVEANQPVTIQNWCKRGRKQCKTHPHFVIPYRCLVGEFVSDALLVPDKCKFLHQERMDVCETHLHWHTVAKETCSEKSTNLHDYGMLLPCGIDKFRGVEFVCCPLAEESDNVDSADAEEDDSDVWWGGADTDYADGSEDKVVEVAEEEEVAEVEEEEADDDEDDEDGDEVEEEAEEPYEEATERTTSIATTTTTTTESVEEVVREVCSEQAETGPCRAMISRWYFDVTEGKCAPFFYGGCGGNRNNFDTEEYCMAVCGSAMSQSLLKTTQEPLARDPVKLPTTAASTPDAVDKYLETPGDENEHAHFQKAKERLEAKHRERMSQVMREWEEAERQAKNLPKADKKAVIQHFQEKVESLEQEAANERQQLVETHMARVEAMLNDRRRLALENYITALQAVPPRPRHVFNMLKKYVRAEQKDRQHTLKHFEHVRMVDPKKAAQIRSQVMTHLRVIYERMNQSLSLLYNVPAVAEEIQDEVDELLQKEQNYSDDVLANMISEPRISYGNDALMPSLTETKTTVELLPVNGEFSLDDLQPWHSFGADSVPANTENEVEPVDARPAADRGLTTRPGSGLTNIKTEEISEVKMDAEFRHDSGYEVHHQKLVFFAEDVGSNKGAIIGLMVGGVVIATVIVITLVMLKKKQYTSIHHGVVEVDAAVTPEERHLSKMQQNGYENPTYKFFEQMQN
SEQ ID NO:524APP的全部外显子1-14按顺序排列的多核苷酸序列
SEQ ID NO:525APP的全部外显子1-14按顺序排列的翻译多肽序列
WRN序列信息
SEQ ID NO:526来自WRN-NRG1融合物5’处的WRN外显子33的序列
AAGCTGGCTGCCCCCTTGATTTGGAGCGAGCAGGCCTGACTCCAGAGGTTCAGAAGATTATTGCTGATGTTATCCGAAACCCTCCCGTCAACTCAG
SEQ ID NO:527WRN-NRG1融合物3’处的NRG1外显子6序列
CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGCT
SEQ ID NO:528WRN-NRG1多核苷酸序列
AAGCTGGCTGCCCCCTTGATTTGGAGCGAGCAGGCCTGACTCCAGAGGTTCAGAAGATTATTGCTGATGTTATCCGAAACCCTCCCGTCAACTCAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATGGAGGGGAGTGC
SEQ ID NO:529WRN-NRG1多肽序列
AGCPLDLERAGLTPEVQKIIADVIRNPPVNSATSTSTTGTSHLVKCAEKEKTFCVNGGEC
SEQ ID NO:530WRN的外显子1
GTGTACTGTGTGCGCCGGGGAGGCGCCGGCTTGTACTCGGCAGCGCGGGAATAAAGTTTGCTGATTTGGTGTCTAGCCTGGATGCCTGGGTTGCAGGCCCTGCTTGTGGTGGCGCTCCACAGTCATCCGGCTGAAGAAGACCTGTTGGACTGGATCTTCTCGGG
SEQ ID NO:531WRN的外显子2
TTTTCTTTCAGATATTGTTTTGTATTTACCCATGAAGACATTGTTTTTTGGACTCTGCAAATAGGACATTTCAAAGATGAGTGAAAAAAAATTGGAAACAACTGCACAGCAGCGGAAATGTCCTGAATGGATGAATGTGCAGAATAAAAGATGTGCTGTAGAAGAAAGAAAG
SEQ ID NO:532WRN的外显子3
GCATGTGTTCGGAAGAGTGTTTTTGAAGATGACCTCCCCTTCTTAGAATTCACTGGATCCATTGTGTATAGTTACGATGCTAGTGATTGCTCTTTCCTGTCAGAAGATATTAG
SEQ ID NO:533WRN的外显子4
CATGAGTCTATCAGATGGGGATGTGGTGGGATTTGACATGGAGTGGCCACCATTATACAATAGAGGGAAACTTGGCAAAGTTGCACTAATTCAGTTGTGTGTTTCTGAGAGCAAATGTTACTTGTTCCACGTTTCTTCCATGTCAG
SEQ ID NO:534WRN的外显子5
TTTTTCCCCAGGGATTAAAAATGTTGCTTGAAAATAAAGCAGTTAAAAAGGCAGGTGTAGGAATTGAAGGAGATCAGTGGAAACTTCTACGTGACTTTGATATCAAATTGAAGAATTTTGTGGAGTTGACAGATGTTGCCAATAAAAAG
SEQ ID NO:535WRN的外显子6
CTGAAATGCACAGAGACCTGGAGCCTTAACAGTCTGGTTAAACACCTCTTAGGTAAACAGCTCCTGAAAGACAAGTCTATCCGCTGTAGCAATTGGAGTAAATTTCCTCTCACTGAGGACCAGAAACTGTATGCAGCCACTGATGCTTAT
SEQ ID NO:536WRN的外显子7
GCTGGTTTTATTATTTACCGAAATTTAGAGATTTTGGATGATACTGTGCAAAGGTTTGCTATAAATAAAG
SEQ ID NO:537WRN的外显子8
AGGAAGAAATCCTACTTAGCGACATGAACAAACAGTTGACTTCAATCTCTGAGGAAGTGATGGATCTGGCTAAGCATCTTCCTCATGCTTTCAGTAAATTGGAAAACCCACGGAG
SEQ ID NO:538WRN的外显子9
GGTTTCTATCTTACTAAAGGATATTTCAGAAAATCTATATTCACTGAGGAGGATGATAATTGGGTCTACTAACATTGAGACTGAACTGAGGCCCAGCAATAATTTAAACTTATTATCCTTTGAAGATTCAACTACTGGGGGAGTACAACAGAAACAAATTAGAGAACATGAAGTTTTAATTCACGTTGAAGATGAAACATGGGACCCAACACTTGATCATTTAGCTAAACATGATGGAGAAGATGTACTTGGAAATAAAGTGGAACGAAAAGAAGATGGATTTGAAGATGGAGTAGAAGACAACAAATTGAAAGAGAATATGGAAAGAGCTTGTTTGATGTCGTTAGATATTACAGAACATGAACTCCAAATTTTGGAACAGCAGTCTCAGGAAGAATATCTTAGTGATATTGCTTATAAATCTACTGAG
SEQ ID NO:539WRN的外显子10
CATTTATCTCCCAATGATAATGAAAACGATACGTCCTATGTAATTGAGAGTGATGAAGATTTAGAAATGGAGATGCTTAAG
SEQ ID NO:540WRN的外显子11
CATTTATCTCCCAATGATAATGAAAACGATACGTCCTATGTAATTGAGAGTGATGAAGATTTAGAAATGGAGATGCTTAAG
SEQ ID NO:541WRN的外显子12
TCTTTAGAAAACCTCAATAGTGGCACGGTAGAACCAACTCATTCTAAATGCTTAAAAATGGAAAGAAATCTGGGTCTTCCTACTAAAGAAGAAGAAGAAGATGATGAAAATGAAGCTAATGAAGGGGAAGAAGATGATGATAAGG
SEQ ID NO:542WRN的外显子13
ACTTTTTGTGGCCAGCACCCAATGAAGAGCAAGTTACTTGCCTCAAGATGTACTTTGGCCATTCCAGTTTTAAACC
SEQ ID NO:543WRN的外显子14
AGTTCAGTGGAAAGTGATTCATTCAGTATTAGAAGAAAGAAGAGATAATGTTGCTGTCATGGCAACTG
SEQ ID NO:544WRN的外显子15
GATATGGAAAGAGTTTGTGCTTCCAGTATCCACCTGTTTATGTAGGCAAGATTGGCCTTGTTATCTCTCCCCTTATTTCTCTGATGGAAGACCAAGTGCTACAGCTTAA
SEQ ID NO:545WRN的外显子16
AATGTCCAACATCCCAGCTTGCTTCCTTGGATCAGCACAGTCAGAAAATGTTCTAACAGATATTAAATT
SEQ ID NO:546WRN的外显子17
AGGTAAATACCGGATTGTATACGTAACTCCAGAATACTGTTCAGGTAACATGGGCCTGCTCCAGCAACTTGAGGCTGATATTG
SEQ ID NO:547WRN的外显子18
GTATCACGCTCATTGCTGTGGATGAGGCTCACTGTATTTCTGAGTGGGGGCATGATTTTAGGGATTCATTCAGGAAGTTGGGCTCCCTAAAGACAGCACTGCCAATG
SEQ ID NO:548WRN的外显子19
GTTCCAATCGTTGCACTTACTGCTACTGCAAGTTCTTCAATCCGGGAAGACATTGTACGTTGCTTAAATCTGAGAAATCCTCAGATCACCTGTACTGGTTTTGATCGACCAAACCTGTATTTAGAAGTTAGGCGAAAAACAGGGAATATCCTTCAGGATCTGCAGCCATTTCTTGTCAAAACAAG
SEQ ID NO:549WRN的外显子20
TTCCCACTGGGAATTTGAAGGTCCAACAATCATCTACTGTCCTTCTAGAAAAATGACACAACAAGTTACAGGTGAACTTAGGAAACTGAATCTATCCTGTGGAACATACCATGCGGGCATGAGTTTTAGCACAAGGAAAGACATTCATCATAGGTTTGTAAGAGATGAAATTCAG
SEQ ID NO:550WRN的外显子21
TGTGTCATAGCTACCATAGCTTTTGGAATGGGCATTAATAAAGCTGACATTCGCCAAGTCATTCATTACGGTGCTCCTAAGGACATGGAATCATATTATCAGGAGATTGGTAGAGCTGGTCGTGATGGACTTCAAAGTTCTTGTCACGTCCTCTGGGCTCCTGCAGACATTAACTTAAATAG
SEQ ID NO:551WRN的外显子22
GCACCTTCTTACTGAGATACGTAATGAGAAGTTTCGATTATACAAATTAAAGATGATGGCAAAGATGGAAAAATATCTTCATTCTAGCAGATGTAGGAGACA
SEQ ID NO:552WRN的外显子23
AATCATCTTGTCTCATTTTGAGGACAAACAAGTACAAAAAGCCTCCTTGGGAATTATGGGAACTGAAAAATGCTGTGATAATTGCAGGTCCAG
SEQ ID NO:553WRN的外显子24
ATTGGATCATTGCTATTCCATGGATGACTCAGAGGATACATCCTGGGACTTTGGTCCACAAGCATTTAAGCTTTTGTCTGCTGTGGACATCTTAGGCGAAAAATTTGGAATTGGGCTTCCAATTTTATTTCTCCGAGGATCT
SEQ ID NO:554WRN的外显子25
AATTCTCAGCGTCTTGCCGATCAATATCGCAGGCACAGTTTATTTGGCACTGGCAAGGATCAAACAGAGAGTTGGTGGAAGGCTTTTTCCCGTCAGCTGATCACTGAGGGATTCTTGGTAGAAGTTTCTCGGTATAACAAATTTATGAAGATTTGCGCCCTTACGAAAAAG
SEQ ID NO:555WRN的外显子26
GGTAGAAATTGGCTTCATAAAGCTAATACAGAATCTCAGAGCCTCATCCTTCAAGCTAATGAAGAATTGTGTCCAAAGAAGTTGCTTCTGCCTAG
SEQ ID NO:556WRN的外显子27
TTCGAAAACTGTATCTTCGGGCACCAAAGAGCATTGTTATAATCAAGTACCAGTTGAATTAAGTACAGAGAAGAAG
SEQ ID NO:557WRN的外显子28
TCTAACTTGGAGAAGTTATATTCTTATAAACCATGTGATAAGATTTCTTCTGGGAGTAACATTTCTAAAAAAAG
SEQ ID NO:558WRN的外显子29
TATCATGGTACAGTCACCAGAAAAAGCTTACAGTTCCTCACAGCCTGTTATTTCGGCACAAGAGCAGGAGACTCAG
SEQ ID NO:559WRN的外显子30
ATTGTGTTATATGGCAAATTGGTAGAAGCTAGGCAGAAACATGCCAATAAAATGGATGTTCCCCCAGCTATTCTGGCAACAAACAAGATACTGGTGGATATGGCCAAAATGAG
SEQ ID NO:560WRN的外显子31
ACCAACTACGGTTGAAAACGTAAAAAGGATTGATGGTGTTTCTGAAGGCAAAGCTGCCATGTTGGCCCCTCTGTTGGAAGTCATCAAACATTTCTGCCAAACAAATAGTGTTCAG
SEQ ID NO:561WRN的外显子32
ACAGACCTCTTTTCAAGTACAAAACCTCAAGAAGAACAGAAGACGAGTCTGGTAGCAAAAAATAAAATATGCACACTTTCACAGTCTATGGCCATCACATACTCTTTATTCCAAGAAAAGAAGATGCCTTTG
SEQ ID NO:562WRN的外显子33
AAGAGCATAGCTGAGAGCAGGATTCTGCCTCTCATGACAATTGGCATGCACTTATCCCAAGCGGTGAAAGCTGGCTGCCCCCTTGATTTGGAGCGAGCAGGCCTGACTCCAGAGGTTCAGAAGATTATTGCTGATGTTATCCGAAACCCTCCCGTCAACTCAG
SEQ ID NO:563WRN的外显子34
ATATGAGTAAAATTAGCCTAATCAGAATGTTAGTTCCTGAAAACATTGACACGTACCTTATCCACATGGCAATTGAGATCCTTAAACATGGTCCTGACAGCGGACTTCAACCTTCATGTGATGTCAACAAAAGGAGATGTTTTCCCGGTTCTGAAGAGATCTGTTCAAGTTCTAAGAGAAGCAAGGAAGAAGTAGGCATCAATACTGAG
SEQ ID NO:564WRN的外显子35
ACTTCATCTGCAGAGAGAAAGAGACGATTACCTGTGTGGTTTGCCAAAGGAAGTGATACCAGCAAGAAATTAATGGACAAAACGAAAAGGGGAGGTCTTTTTAGTTAAGCTGGCAATTACCAGAACAATTATGTTTCTTGCTGTATTATAAGAGGATAGCTATATTTTATTTCTGAAGAGTAAGGAGTAGTATTTTGGCTTAAAAATCATTCTAATTACAAAGTTCACTGTTTATTGAAGAACTGGCATCTTAAATCAGCCTTCCGCAATTCATGTAGTTTCTGGGTCTTCTGGGAGCCTACGTGAGTACATCACCTAACAGAATATTAAATTAGACTTCCTGTAAGATTGCTTTAAGAAACTGTTACTGTCCTGTTTTCTAATCTCTTTATTAAAACAGTGTATTTGGAAAATGTTATGTGCTCTGATTTGATATAGATAACAGATTAGTAGTTACATGGTAATTATGTGATATAAAATATTCATATATTATCAAAATTCTGTTTTGTAAATGTAAGAAAGCATAGTTATTTTACAAATTGTTTTTACTGTCTTTTGAAGAAGTTCTTAAATACGTTGTTAAATGGTATTAGTTGACCAGGGCAGTGAAAATGAAACCGCATTTTGGGTGCCATTAAATAGGGAAAAAACATGTAAAAAATGTAAAATGGAGACCAATTGCACTAGGCAAGTGTATATTTTGTATTTTATATACAATTTCTATTATTTTTCAAGTAATAAAACAATGTTTTTCATACTGAATATTATATATATATTTTTTAGCTTTCATTTACTTAATTATTTTAAGTACCTTTATTTTTCCAGGATGTCAGAATTTGATTCTAATCTCTCTTATGTAGCACATGTGACTTAATTTAAAACCTATACTGTGACACAGAGTTGGGTAAACGATGATTATTTAACTTTAAGCAGTTCACCATCCATTTCAAAGCCTTTGATTGGCTTTTTTGTAAATAAAAATAACTTGTTAAGAAACAAATATATCTGTCATAGAAGAACTAGAAAATCCAGGGAAGTGAGAAAAATGAAAATAAAAATCATTCATAGTTTTACTAGTAGCTAATCACAGTCAACCTCTTTTGTGTATCCCACCAGACTTTTTTATATTCATTTGTTTTTAGTTAAAATATAAAAGTCTCGTATATTCCCATTTTTCTGCATTGCATTACCAGAAGGTAGTGGCGCCTATTAAATATGTGATATGTTGTTGTCCAGCCATGGCTTCTGCATTTGCATGCTTTTGTGTGTGCATCTGCAATACCCTGTGAATATCCTGTGTGATGGAGTGGCAAGTACGCACAGACACGTCTGCTGCATGCCTAGGTACGAGGCTGTCTCCAGGAGAAGCACTTGTTTGATTATTTGAGTTGCCAATTGAATTTGCTGCTTTTTTTCATGGCTTGCCATTTTCACTGAAAAGAATGACTAATGAAAAACGATGATTGGTTATTAGATTTGGATGTTTGGCAGACATTTTCTCAAAATTGAACTAAGTTGGCCTCTTCACGGAAAACAACTGGTATTTGTTGTGCCAATGATAAAATTGGAGATTTCTAGCAAAATGTATAATTTTGGAAAAGTTGTGTTCCTCCACTGGAAGCTTGACAGCTTTCCTTAACATAAAGACTTCTCTTTCTCTTCGCTTTCACTACTACTACTACTAATTCTTCTTCTGATTCTTCTTCTTCTCCTTCTTCCTTCTTCCTTCCTTCCTCCTCCTCCTCCTTCTTCTTCCTCTTCCTCTTCTTCTTTCTCTCTTTCCTTCCTTCCCTTCCCTTCCCCTTCCTTCCTTCCTTCCTTCCTTCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCTTTCTTTTTCTTTCTCTTTCTTTCTTTCTTTCTCTCTCTCTCTCTCTTTCTTTCTTTTTCTTTCTCTTTTTCTTTCTTTCAAGCAGTCCTCCCGCCTCAGTCCCCCAAAATAGTGGGATTACAGGTGTGAGCCACCATGCACAGCCTTACATAAAGCCTTTTCTAATGAGATGGATAGTAATTAACAAATGTGAGTTTTTGATATTATATAAAGATTTTTTCTGTGTTTCGAAGATCCGTATAACTCAGTGAATCAGTATGTTCTGGATGACTAATATGTGATGTTAAGAAATCATGACTGAGGCCGGGCGCGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGGCGGGCGGATCACGAGATCAGGAGATCGAGACCACCCTGGCCAACATGGTGAAACCCCGTCTCTACTAAAAATACAAAAATTAGCTGGGTGTGTTGGTGCGTGCCTATAATCCCAGCTACTCGGGAGGCTGAGGCAGGAGAATCGCTTGAACTCAGGAGGCGGAGATTGCAGTGAGCTGAGACTGCGCCACTGCACCCCAGCCTGGCGACAGAGCAAGACTCCGTCTCAAAAATAAAAAAAGAAATCATGACTGGGTAAAAGATCTGTTCAGAGTACAAGATGGACCAATGGATTTGATATATTTGAATATAACAGAGTATGAAAAAGTTTATTGATATAGTTTCAGATTACACACTGCAACTAATCTTTAAGAAACTATTACTTGTCCACTTTTTGGTAAAATTTCAGAGAACAATGTCCACCATTATCTGAACAGGCTATTAAAATACTCTTCTCTTTTCCAACTACGTGCCTGTGCAAAGTCAGATTTTTTTCATATACTTCAGCCAAAACAGCATATCAAAATGGATTGAATGCAGAAGTAGATCTGAGAATACAGCCACTTTTGTTAAGCCAGACAATGAGATTTGCAAAATGTAAACAATGCTGCTGTTCTCAGTTTTTAAAAATATGTTTTTTAAAAGTATTTATGTTAATGTGTACTTGGTTTACTACTGCTATTTTTAAATAAAACAAGAAACATTTTTAAATGTCTGTTTTAATTTCTAAAGTGGTAGTGATAGATATAACCCATATTAATAAAAGCTCTTTGGGGTCCTCAGTGATTTTTTTTTAAGAGTATGGAAGGGTTCTCAGACCTAAGAGATTGAGAAATGCTGATGTAATGTTTTATTATAAAGGTGTACCATGAATTATGTACCTTACTTCATATTGTTGGACATTAAAGTTGCTTTCAGTTTTTTTGTTTTAAA
SEQ ID NO:565WRN的全mRNA多核苷酸序列
GTGTACTGTGTGCGCCGGGGAGGCGCCGGCTTGTACTCGGCAGCGCGGGAATAAAGTTTGCTGATTTGGTGTCTAGCCTGGATGCCTGGGTTGCAGGCCCTGCTTGTGGTGGCGCTCCACAGTCATCCGGCTGAAGAAGACCTGTTGGACTGGATCTTCTCGGGTTTTCTTTCAGATATTGTTTTGTATTTACCCATGAAGACATTGTTTTTTGGACTCTGCAAATAGGACATTTCAAAGATGAGTGAAAAAAAATTGGAAACAACTGCACAGCAGCGGAAATGTCCTGAATGGATGAATGTGCAGAATAAAAGATGTGCTGTAGAAGAAAGAAAGGCATGTGTTCGGAAGAGTGTTTTTGAAGATGACCTCCCCTTCTTAGAATTCACTGGATCCATTGTGTATAGTTACGATGCTAGTGATTGCTCTTTCCTGTCAGAAGATATTAGCATGAGTCTATCAGATGGGGATGTGGTGGGATTTGACATGGAGTGGCCACCATTATACAATAGAGGGAAACTTGGCAAAGTTGCACTAATTCAGTTGTGTGTTTCTGAGAGCAAATGTTACTTGTTCCACGTTTCTTCCATG
TCAGTTTTTCCCCAGGGATTAAAAATGTTGCTTGAAAATAAAGCAGTTAAAAAGGCAG
GTGTAGGAATTGAAGGAGATCAGTGGAAACTTCTACGTGACTTTGATATCAAATTGAAG
AATTTTGTGGAGTTGACAGATGTTGCCAATAAAAAGCTGAAATGCACAGAGACCTGGA
GCCTTAACAGTCTGGTTAAACACCTCTTAGGTAAACAGCTCCTGAAAGACAAGTCTATC
CGCTGTAGCAATTGGAGTAAATTTCCTCTCACTGAGGACCAGAAACTGTATGCAGCCAC
TGATGCTTATGCTGGTTTTATTATTTACCGAAATTTAGAGATTTTGGATGATACTGTGCAA
AGGTTTGCTATAAATAAAGAGGAAGAAATCCTACTTAGCGACATGAACAAACAGTTGA
CTTCAATCTCTGAGGAAGTGATGGATCTGGCTAAGCATCTTCCTCATGCTTTCAGTAAAT
TGGAAAACCCACGGAGGGTTTCTATCTTACTAAAGGATATTTCAGAAAATCTATATTCAC
TGAGGAGGATGATAATTGGGTCTACTAACATTGAGACTGAACTGAGGCCCAGCAATAAT
TTAAACTTATTATCCTTTGAAGATTCAACTACTGGGGGAGTACAACAGAAACAAATTAG
AGAACATGAAGTTTTAATTCACGTTGAAGATGAAACATGGGACCCAACACTTGATCATT
TAGCTAAACATGATGGAGAAGATGTACTTGGAAATAAAGTGGAACGAAAAGAAGATGG
ATTTGAAGATGGAGTAGAAGACAACAAATTGAAAGAGAATATGGAAAGAGCTTGTTTG
ATGTCGTTAGATATTACAGAACATGAACTCCAAATTTTGGAACAGCAGTCTCAGGAAGA
ATATCTTAGTGATATTGCTTATAAATCTACTGAGCATTTATCTCCCAATGATAATGAAAAC
GATACGTCCTATGTAATTGAGAGTGATGAAGATTTAGAAATGGAGATGCTTAAGCATTTA
TCTCCCAATGATAATGAAAACGATACGTCCTATGTAATTGAGAGTGATGAAGATTTAGAA
ATGGAGATGCTTAAGTCTTTAGAAAACCTCAATAGTGGCACGGTAGAACCAACTCATTC
TAAATGCTTAAAAATGGAAAGAAATCTGGGTCTTCCTACTAAAGAAGAAGAAGAAGAT
GATGAAAATGAAGCTAATGAAGGGGAAGAAGATGATGATAAGGACTTTTTGTGGCCAG
CACCCAATGAAGAGCAAGTTACTTGCCTCAAGATGTACTTTGGCCATTCCAGTTTTAAA
CCAGTTCAGTGGAAAGTGATTCATTCAGTATTAGAAGAAAGAAGAGATAATGTTGCTGT
CATGGCAACTGGATATGGAAAGAGTTTGTGCTTCCAGTATCCACCTGTTTATGTAGGCA
AGATTGGCCTTGTTATCTCTCCCCTTATTTCTCTGATGGAAGACCAAGTGCTACAGCTTA
AAATGTCCAACATCCCAGCTTGCTTCCTTGGATCAGCACAGTCAGAAAATGTTCTAACA
GATATTAAATTAGGTAAATACCGGATTGTATACGTAACTCCAGAATACTGTTCAGGTAAC
ATGGGCCTGCTCCAGCAACTTGAGGCTGATATTGGTATCACGCTCATTGCTGTGGATGA
GGCTCACTGTATTTCTGAGTGGGGGCATGATTTTAGGGATTCATTCAGGAAGTTGGGCT
CCCTAAAGACAGCACTGCCAATGGTTCCAATCGTTGCACTTACTGCTACTGCAAGTTCT
TCAATCCGGGAAGACATTGTACGTTGCTTAAATCTGAGAAATCCTCAGATCACCTGTAC
TGGTTTTGATCGACCAAACCTGTATTTAGAAGTTAGGCGAAAAACAGGGAATATCCTTC
AGGATCTGCAGCCATTTCTTGTCAAAACAAGTTCCCACTGGGAATTTGAAGGTCCAAC
AATCATCTACTGTCCTTCTAGAAAAATGACACAACAAGTTACAGGTGAACTTAGGAAAC
TGAATCTATCCTGTGGAACATACCATGCGGGCATGAGTTTTAGCACAAGGAAAGACATT
CATCATAGGTTTGTAAGAGATGAAATTCAGTGTGTCATAGCTACCATAGCTTTTGGAATG
GGCATTAATAAAGCTGACATTCGCCAAGTCATTCATTACGGTGCTCCTAAGGACATGGA
ATCATATTATCAGGAGATTGGTAGAGCTGGTCGTGATGGACTTCAAAGTTCTTGTCACGT
CCTCTGGGCTCCTGCAGACATTAACTTAAATAGGCACCTTCTTACTGAGATACGTAATGA
GAAGTTTCGATTATACAAATTAAAGATGATGGCAAAGATGGAAAAATATCTTCATTCTAG
CAGATGTAGGAGACAAATCATCTTGTCTCATTTTGAGGACAAACAAGTACAAAAAGCC
TCCTTGGGAATTATGGGAACTGAAAAATGCTGTGATAATTGCAGGTCCAGATTGGATCA
TTGCTATTCCATGGATGACTCAGAGGATACATCCTGGGACTTTGGTCCACAAGCATTTAA
GCTTTTGTCTGCTGTGGACATCTTAGGCGAAAAATTTGGAATTGGGCTTCCAATTTTATT
TCTCCGAGGATCTAATTCTCAGCGTCTTGCCGATCAATATCGCAGGCACAGTTTATTTGG
CACTGGCAAGGATCAAACAGAGAGTTGGTGGAAGGCTTTTTCCCGTCAGCTGATCACT
GAGGGATTCTTGGTAGAAGTTTCTCGGTATAACAAATTTATGAAGATTTGCGCCCTTACG
AAAAAGGGTAGAAATTGGCTTCATAAAGCTAATACAGAATCTCAGAGCCTCATCCTTCA
AGCTAATGAAGAATTGTGTCCAAAGAAGTTGCTTCTGCCTAGTTCGAAAACTGTATCTT
CGGGCACCAAAGAGCATTGTTATAATCAAGTACCAGTTGAATTAAGTACAGAGAAGAA
GTCTAACTTGGAGAAGTTATATTCTTATAAACCATGTGATAAGATTTCTTCTGGGAGTAA
CATTTCTAAAAAAAGTATCATGGTACAGTCACCAGAAAAAGCTTACAGTTCCTCACAGC
CTGTTATTTCGGCACAAGAGCAGGAGACTCAGATTGTGTTATATGGCAAATTGGTAGAA
GCTAGGCAGAAACATGCCAATAAAATGGATGTTCCCCCAGCTATTCTGGCAACAAACAA
GATACTGGTGGATATGGCCAAAATGAGACCAACTACGGTTGAAAACGTAAAAAGGATT
GATGGTGTTTCTGAAGGCAAAGCTGCCATGTTGGCCCCTCTGTTGGAAGTCATCAAACA
TTTCTGCCAAACAAATAGTGTTCAGACAGACCTCTTTTCAAGTACAAAACCTCAAGAA
GAACAGAAGACGAGTCTGGTAGCAAAAAATAAAATATGCACACTTTCACAGTCTATGG
CCATCACATACTCTTTATTCCAAGAAAAGAAGATGCCTTTGAAGAGCATAGCTGAGAGC
AGGATTCTGCCTCTCATGACAATTGGCATGCACTTATCCCAAGCGGTGAAAGCTGGCTG
CCCCCTTGATTTGGAGCGAGCAGGCCTGACTCCAGAGGTTCAGAAGATTATTGCTGATG
TTATCCGAAACCCTCCCGTCAACTCAGATATGAGTAAAATTAGCCTAATCAGAATGTTAG
TTCCTGAAAACATTGACACGTACCTTATCCACATGGCAATTGAGATCCTTAAACATGGTC
CTGACAGCGGACTTCAACCTTCATGTGATGTCAACAAAAGGAGATGTTTTCCCGGTTCT
GAAGAGATCTGTTCAAGTTCTAAGAGAAGCAAGGAAGAAGTAGGCATCAATACTGAGA
CTTCATCTGCAGAGAGAAAGAGACGATTACCTGTGTGGTTTGCCAAAGGAAGTGATAC
CAGCAAGAAATTAATGGACAAAACGAAAAGGGGAGGTCTTTTTAGTTAAGCTGGCAAT
TACCAGAACAATTATGTTTCTTGCTGTATTATAAGAGGATAGCTATATTTTATTTCTGAAG
AGTAAGGAGTAGTATTTTGGCTTAAAAATCATTCTAATTACAAAGTTCACTGTTTATTGA
AGAACTGGCATCTTAAATCAGCCTTCCGCAATTCATGTAGTTTCTGGGTCTTCTGGGAG
CCTACGTGAGTACATCACCTAACAGAATATTAAATTAGACTTCCTGTAAGATTGCTTTAA
GAAACTGTTACTGTCCTGTTTTCTAATCTCTTTATTAAAACAGTGTATTTGGAAAATGTT
ATGTGCTCTGATTTGATATAGATAACAGATTAGTAGTTACATGGTAATTATGTGATATAAA
ATATTCATATATTATCAAAATTCTGTTTTGTAAATGTAAGAAAGCATAGTTATTTTACAAAT
TGTTTTTACTGTCTTTTGAAGAAGTTCTTAAATACGTTGTTAAATGGTATTAGTTGACCA
GGGCAGTGAAAATGAAACCGCATTTTGGGTGCCATTAAATAGGGAAAAAACATGTAAA
AAATGTAAAATGGAGACCAATTGCACTAGGCAAGTGTATATTTTGTATTTTATATACAATT
TCTATTATTTTTCAAGTAATAAAACAATGTTTTTCATACTGAATATTATATATATATTTTTTA
GCTTTCATTTACTTAATTATTTTAAGTACCTTTATTTTTCCAGGATGTCAGAATTTGATTCT
AATCTCTCTTATGTAGCACATGTGACTTAATTTAAAACCTATACTGTGACACAGAGTTGG
GTAAACGATGATTATTTAACTTTAAGCAGTTCACCATCCATTTCAAAGCCTTTGATTGGC
TTTTTTGTAAATAAAAATAACTTGTTAAGAAACAAATATATCTGTCATAGAAGAACTAGA
AAATCCAGGGAAGTGAGAAAAATGAAAATAAAAATCATTCATAGTTTTACTAGTAGCTA
ATCACAGTCAACCTCTTTTGTGTATCCCACCAGACTTTTTTATATTCATTTGTTTTTAGTT
AAAATATAAAAGTCTCGTATATTCCCATTTTTCTGCATTGCATTACCAGAAGGTAGTGGC
GCCTATTAAATATGTGATATGTTGTTGTCCAGCCATGGCTTCTGCATTTGCATGCTTTTGT
GTGTGCATCTGCAATACCCTGTGAATATCCTGTGTGATGGAGTGGCAAGTACGCACAGA
CACGTCTGCTGCATGCCTAGGTACGAGGCTGTCTCCAGGAGAAGCACTTGTTTGATTAT
TTGAGTTGCCAATTGAATTTGCTGCTTTTTTTCATGGCTTGCCATTTTCACTGAAAAGAA
TGACTAATGAAAAACGATGATTGGTTATTAGATTTGGATGTTTGGCAGACATTTTCTCAA
AATTGAACTAAGTTGGCCTCTTCACGGAAAACAACTGGTATTTGTTGTGCCAATGATAA
AATTGGAGATTTCTAGCAAAATGTATAATTTTGGAAAAGTTGTGTTCCTCCACTGGAAG
CTTGACAGCTTTCCTTAACATAAAGACTTCTCTTTCTCTTCGCTTTCACTACTACTACTAC
TAATTCTTCTTCTGATTCTTCTTCTTCTCCTTCTTCCTTCTTCCTTCCTTCCTCCTCCTCCT
CCTTCTTCTTCCTCTTCCTCTTCTTCTTTCTCTCTTTCCTTCCTTCCCTTCCCTTCCCCTTC
CTTCCTTCCTTCCTTCCTTCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCTTTCTTTTT
CTTTCTCTTTCTTTCTTTCTTTCTCTCTCTCTCTCTCTTTCTTTCTTTTTCTTTCTCTTTTTC
TTTCTTTCAAGCAGTCCTCCCGCCTCAGTCCCCCAAAATAGTGGGATTACAGGTGTGAG
CCACCATGCACAGCCTTACATAAAGCCTTTTCTAATGAGATGGATAGTAATTAACAAATG
TGAGTTTTTGATATTATATAAAGATTTTTTCTGTGTTTCGAAGATCCGTATAACTCAGTGA
ATCAGTATGTTCTGGATGACTAATATGTGATGTTAAGAAATCATGACTGAGGCCGGGCGC
GGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGGCGGGCGGATCACGAGA
TCAGGAGATCGAGACCACCCTGGCCAACATGGTGAAACCCCGTCTCTACTAAAAATAC
AAAAATTAGCTGGGTGTGTTGGTGCGTGCCTATAATCCCAGCTACTCGGGAGGCTGAGGCAGGAGAATCGCTTGAACTCAGGAGGCGGAGATTGCAGTGAGCTGAGACTGCGCCACTGCACCCCAGCCTGGCGACAGAGCAAGACTCCGTCTCAAAAATAAAAAAAGAAATCATGACTGGGTAAAAGATCTGTTCAGAGTACAAGATGGACCAATGGATTTGATATATTTGAATATAACAGAGTATGAAAAAGTTTATTGATATAGTTTCAGATTACACACTGCAACTAATCTTTAAGAAACTATTACTTGTCCACTTTTTGGTAAAATTTCAGAGAACAATGTCCACCATTATCTGAACAGGCTATTAAAATACTCTTCTCTTTTCCAACTACGTGCCTGTGCAAAGTCAGATTTTTTTCATATACTTCAGCCAAAACAGCATATCAAAATGGATTGAATGCAGAAGTAGATCTGAGAATACAGCCACTTTTGTTAAGCCAGACAATGAGATTTGCAAAATGTAAACAATGCTGCTGTTCTCAGTTTTTAAAAATATGTTTTTTAAAAGTATTTATGTTAATGTGTACTTGGTTTACTACTGCTATTTTTAAATAAAACAAGAAACATTTTTAAATGTCTGTTTTAATTTCTAAAGTGGTAGTGATAGATATAACCCATATTAATAAAAGCTCTTTGGGGTCCTCAGTGATTTTTTTTTAAGAGTATGGAAGGGTTCTCAGACCTAAGAGATTGAGAAATGCTGATGTAATGTTTTATTATAAAGGTGTACCATGAATTATGTACCTTACTTCATATTGTTGGACATTAAAGTTGCTTTCAGTTTTTTTGTTTTAAA
SEQ ID NO:566WRN的外显子2的翻译多肽序列
MSEKKLETTAQQRKCPEWMNVQNKRCAVEERK
SEQ ID NO:567WRN的外显子3的翻译多肽序列
ACVRKSVFEDDLPFLEFTGSIVYSYDASDCSFLSEDI
SEQ ID NO:568WRN的外显子4的翻译多肽序列
MSLSDGDVVGFDMEWPPLYNRGKLGKVALIQLCVSESKCYLFHVSSMS
SEQ ID NO:569WRN的外显子5的翻译多肽序列
FPQGLKMLLENKAVKKAGVGIEGDQWKLLRDFDIKLKNFVELTDVANKK
SEQ ID NO:570WRN的外显子6的翻译多肽序列
LKCTETWSLNSLVKHLLGKQLLKDKSIRCSNWSKFPLTEDQKLYAATDAY
SEQ ID NO:571WRN的外显子7的翻译多肽序列
AGFIIYRNLEILDDTVQRFAINK
SEQ ID NO:572WRN的外显子8的翻译多肽序列
EEILLSDMNKQLTSISEEVMDLAKHLPHAFSKLENPR
SEQ ID NO:573WRN的外显子9的翻译多肽序列
VSILLKDISENLYSLRRMIIGSTNIETELRPSNNLNLLSFEDSTTGGVQQKQIREHEVLIHVEDETWDPTLDHLAKHDGEDVLGNKVERKEDGFEDGVEDNKLKENMERACLMSLDITEHELQILEQQSQEEYLSDIAYKSTE
SEQ ID NO:574WRN的外显子10的翻译多肽序列
HLSPNDNENDTSYVIESDEDLEMEMLK
SEQ ID NO:575WRN的外显子11的翻译多肽序列
HLSPNDNENDTSYVIESDEDLEMEMLK
SEQ ID NO:576WRN的外显子12的翻译多肽序列
SLENLNSGTVEPTHSKCLKMERNLGLPTKEEEEDDENEANEGEEDDDK
SEQ ID NO:577WRN的外显子13的翻译多肽序列
FLWPAPNEEQVTCLKMYFGHSSFK
SEQ ID NO:578WRN的外显子14的翻译多肽序列
VQWKVIHSVLEERRDNVAVMAT
SEQ ID NO:579WRN的外显子15的翻译多肽序列
YGKSLCFQYPPVYVGKIGLVISPLISLMEDQVLQL
SEQ ID NO:580WRN的外显子16的翻译多肽序列
MSNIPACFLGSAQSENVLTDIK
SEQ ID NO:581WRN的外显子17的翻译多肽序列
GKYRIVYVTPEYCSGNMGLLQQLEADI
SEQ ID NO:582WRN的外显子18的翻译多肽序列
ITLIAVDEAHCISEWGHDFRDSFRKLGSLKTALPM
SEQ ID NO:583WRN的外显子19的翻译多肽序列
VPIVALTATASSSIREDIVRCLNLRNPQITCTGFDRPNLYLEVRRKTGNILQDLQPFLVKT
SEQ ID NO:584WRN的外显子20的翻译多肽序列
SHWEFEGPTIIYCPSRKMTQQVTGELRKLNLSCGTYHAGMSFSTRKDIHHRFVRDEIQ
SEQ ID NO:585WRN的外显子21的翻译多肽序列
CVIATIAFGMGINKADIRQVIHYGAPKDMESYYQEIGRAGRDGLQSSCHVLWAPADINLN
SEQ ID NO:586WRN的外显子22的翻译多肽序列
HLLTEIRNEKFRLYKLKMMAKMEKYLHSSRCRR
SEQ ID NO:587WRN的外显子23的翻译多肽序列
IILSHFEDKQVQKASLGIMGTEKCCDNCRS
SEQ ID NO:588WRN的外显子24的翻译多肽序列
LDHCYSMDDSEDTSWDFGPQAFKLLSAVDILGEKFGIGLPILFLRGS
SEQ ID NO:589WRN的外显子25的翻译多肽序列
NSQRLADQYRRHSLFGTGKDQTESWWKAFSRQLITEGFLVEVSRYNKFMKICALTKK
SEQ ID NO:590WRN的外显子26的翻译多肽序列
GRNWLHKANTESQSLILQANEELCPKKLLLP
SEQ ID NO:591WRN的外显子27的翻译多肽序列
SKTVSSGTKEHCYNQVPVELSTEKK
SEQ ID NO:592WRN的外显子28的翻译多肽序列
SNLEKLYSYKPCDKISSGSNISKK
SEQ ID NO:593WRN的外显子29的翻译多肽序列
IMVQSPEKAYSSSQPVISAQEQETQ
SEQ ID NO:594WRN的外显子30的翻译多肽序列
IVLYGKLVEARQKHANKMDVPPAILATNKILVDMAKM
SEQ ID NO:595WRN的外显子31的翻译多肽序列
PTTVENVKRIDGVSEGKAAMLAPLLEVIKHFCQTNSVQ
SEQ ID NO:596WRN的外显子32的翻译多肽序列
TDLFSSTKPQEEQKTSLVAKNKICTLSQSMAITYSLFQEKKMPL
SEQ ID NO:597WRN的外显子33的翻译多肽序列
KSIAESRILPLMTIGMHLSQAVKAGCPLDLERAGLTPEVQKIIADVIRNPPVNS
SEQ ID NO:598WRN的外显子34的翻译多肽序列
MSKISLIRMLVPENIDTYLIHMAIEILKHGPDSGLQPSCDVNKRRCFPGSEEICSSSKRSKEEVGINTE
SEQ ID NO:599WRN的外显子35的翻译多肽序列
TSSAERKRRLPVWFAKGSDTSKKLMDKTKRGGLFS
SEQ ID NO:600WRN的全蛋白质序列
MSEKKLETTAQQRKCPEWMNVQNKRCAVEERKACVRKSVFEDDLPFLEFTGSIVYSYDASDCSFLSEDISMSLSDGDVVGFDMEWPPLYNRGKLGKVALIQLCVSESKCYLFHVSSMSVFPQGLKMLLENKAVKKAGVGIEGDQWKLLRDFDIKLKNFVELTDVANKKLKCTETWSLNSLVKHLLGKQLLKDKSIRCSNWSKFPLTEDQKLYAATDAYAGFIIYRNLEILDDTVQRFAINKEEEILLSDMNKQLTSISEEVMDLAKHLPHAFSKLENPRRVSILLKDISENLYSLRRMIIGSTNIETELRPSNNLNLLSFEDSTTGGVQQKQIREHEVLIHVEDETWDPTLDHLAKHDGEDVLGNKVERKEDGFEDGVEDNKLKENMERACLMSLDITEHELQILEQQSQEEYLSDIAYKSTEHLSPNDNENDTSYVIESDEDLEMEMLKHLSPNDNENDTSYVIESDEDLEMEMLKSLENLNSGTVEPTHSKCLKMERNLGLPTKEEEEDDENEANEGEEDDDKDFLWPAPNEEQVTCLKMYFGHSSFKPVQWKVIHSVLEERRDNVAVMATGYGKSLCFQYPPVYVGKIGLVISPLISLMEDQVLQLKMSNIPACFLGSAQSENVLTDIKLGKYRIVYVTPEYCSGNMGLLQQLEADIGITLIAVDEAHCISEWGHDFRDSFRKLGSLKTALPMVPIVALTATASSSIREDIVRCLNLRNPQITCTGFDRPNLYLEVRRKTGNILQDLQPFLVKTSSHWEFEGPTIIYCPSRKMTQQVTGELRKLNLSCGTYHAGMSFSTRKDIHHRFVRDEIQCVIATIAFGMGINKADIRQVIHYGAPKDMESYYQEIGRAGRDGLQSSCHVLWAPADINLNRHLLTEIRNEKFRLYKLKMMAKMEKYLHSSRCRRQIILSHFEDKQVQKASLGIMGTEKCCDNCRSRLDHCYSMDDSEDTSWDFGPQAFKLLSAVDILGEKFGIGLPILFLRGSNSQRLADQYRRHSLFGTGKDQTESWWKAFSRQLITEGFLVEVSRYNKFMKICALTKKGRNWLHKANTESQSLILQANEELCPKKLLLPSSKTVSSGTKEHCYNQVPVELSTEKKSNLEKLYSYKPCDKISSGSNISKKSIMVQSPEKAYSSSQPVISAQEQETQIVLYGKLVEARQKHANKMDVPPAILATNKILVDMAKMRPTTVENVKRIDGVSEGKAAMLAPLLEVIKHFCQTNSVQTDLFSSTKPQEEQKTSLVAKNKICTLSQSMAITYSLFQEKKMPLKSIAESRILPLMTIGMHLSQAVKAGCPLDLERAGLTPEVQKIIADVIRNPPVNSDMSKISLIRMLVPENIDTYLIHMAIEILKHGPDSGLQPSCDVNKRRCFPGSEEICSSSKRSKEEVGINTETSSAERKRRLPVWFAKGSDTSKKLMDKTKRGGLFS
SEQ ID NO:601WRN的全部外显子1-33按顺序排列的多核苷酸序列
SEQ ID NO:602WRN的全部外显子1-33按顺序排列的翻译多肽序列
DAAM1序列信息
SEQ ID NO:603来自DAAM1-NRG1融合物5’处的DAAM1的5'UTR/外显子1的序列
GAAGGAAACTGTTTAACCGGATCCCATTGTACCCAGAGTGCAGAGCCGCCTTTCCAGCATGCAGGGGCTGCTCAG
SEQ ID NO:604DAAM1-NRG1融合物3’处的NRG1的5’UTR/外显子1序列
GACAGAGAGGGAGGAGGCGCGCGGGGACGGGGACGCCCAGGAGGACCCACTCGCGGGTCCCGCTCCGCTCCGGCA
SEQ ID NO:605DAAM1-NRG1多核苷酸序列
GAAGGAAACTGTTTAACCGGATCCCATTGTACCCAGAGTGCAGAGCCGCCTTTCCAGCATGCAGGGGCTGCTCAGGACAGAGAGGGAGGAGGCGCGCGGGGACGGGGACGCCCAGGAGGACCCACTCGCGGGTCCCGCTCCGCTCCGGCA
SEQ ID NO:606DAAM1的外显子1
GCGAGTTAGTAACCTACGAGCGGCTGTGAAGGAAACTGTTTAACCGGATCCCATTGTACCCAGAGTGCAGAGCCGCCTTTCCAGCATGCAGGGGCTGCTCAG
SEQ ID NO:607DAAM1的外显子2
CGTTTAGTCACATCAAGAAATAGAACAGAATTCAGCCATGGCCCCAAGAAAGAGAGGTGGACGAGGTATTTCATTCATCTTTTGCTGTTTCCGAAATAATGATCACCCAGAAATCACGTATCGGCTGCGAAATGATAGCAACTTTGCGCTTCAGACCATGGAACCAGCATTGCCCATGCCCCCTGTGGAGGAGCTGGATGTCATGTTCAGTGAACTGGTG
SEQ ID NO:608DAAM1的外显子3
GATGAACTGGACCTCACAGACAAACACAGAGAAGCCATGTTTGCACTTCCAGCTGAGAAAAAATGGCAAATATACTGTAGCAAGAAAAAG
SEQ ID NO:609DAAM1的外显子4
GACCAGGAAGAAAACAAGGGAGCTACAAGTTGGCCTGAATTCTACATTGATCAGCTCAATTCCATGGCTGCT
SEQ ID NO:610DAAM1的外显子5
AGAAAATCTCTGCTGGCTTTAGAGAAGGAAGAAGAAGAAGAAAGAAGTAAAACTATAGAGAGTTTAAAGACAGCACTGAGGACAAAACCAATGAG
SEQ ID NO:611DAAM1的外显子6
GTTTGTAACCAGATTCATCGACTTGGATGGCCTATCATGTATCCTCAACTTTCTAAAGACCATGGACTACGAGACCTCAGAGTCTCGAATACATACTTCTCTCATTGGCTGTATAAAGGCGTTAATGAACAACTCTCAAGGCCGGGCTCACGTCCTGGCTCATTCTGAGAGTATTAATGTAATTGCTCAGAGTCTGAGCACAGAGAACATTAAAACGAAGGTGGCCGTGCTGGAAATCTTGGGCGCCGTGTGCCTGGTTCCCGGGGGCCACAAGAAGGTTCTGCAGGCCATGCTGCACTACCAGAAGTATGCCAGCGAAAGGACCCGCTTTCAG
SEQ ID NO:612DAAM1的外显子7
ACATTAATTAACGACTTGGATAAAAGCACTGGGCGGTATCGAGATGAAGTGAGTCTCAAGACTGCCATCATGTCCTTCATTAATGCAGTGCTCAGCCAAGGTGCAGGAGTG
SEQ ID NO:613DAAM1的外显子8
GAGAGTTTGGACTTTAGACTTCATCTTCGCTATGAATTTCTGATGTTAGGAATTCAACCTGTAATAGATAAATTAAGGGAACACGAAAATTCAACATTAGATAG
SEQ ID NO:614DAAM1的外显子9
GCATTTAGACTTTTTTGAAATGCTCCGAAATGAAGATGAACTAGAATTTGCCAAAAGATTTGAACTG
SEQ ID NO:615DAAM1的外显子10
GTTCACATAGACACAAAAAGTGCAACTCAGATGTTTGAGCTGACCAGGAAGAGGCTGACACATAGTGAAGCTTACCCGCATTTCATGTCCATCCTGCACCACTGCCTCCAAATGCCTTSEQ ID NO:616DAAM1的外显子11
ACAAGAGGAGTGGCAACACTGTTCAGTACTGGCTACTACTAGATAGAATTATACAGCAGATAGTTATCCAGAATGACAAAGGACAGGACCCTGACTCCACACCTTTGGAAAACTTTAATATTAAGAATGTCGTACGAAT
SEQ ID NO:617DAAM1的外显子12
GTTGGTTAATGAAAATGAAGTTAAGCAGTGGAAAGAACAAGCGGAAAAAATGAGAAAAG
SEQ ID NO:618DAAM1的外显子13
AGCACAATGAGCTACAACAGAAACTGGAAAAGAAAGAACGAGAATGTGATGCTAAGACTCAAGAGAAGGAAGAGATGATGCAGACCTTAAATAAAATGAAAGAGAAACTTGAAAAGGAGACTACTGAGCATAAGCAAGTCAAGCAGCAGGTGGCGGACCTCACAGCACAGCTCCATGAGCTCAGCAGG
SEQ ID NO:619DAAM1的外显子14
AGGGCCGTCTGTGCTTCAATCCCAGGTGGACCCTCGCCTGGAGCACCAGGAGGGCCCTTTCCTTCCTCTGTGCCTGGATCTCTCCTTCCTCCCCCACCACCCCCACCTCTACCAGGTGGGATGCTTCCCCCTCCACCGCCTCCCCTCCCTCCAGGTGGCCCTCCTCCTCCCCCAGGGCCTCCTCCCTTAGGGGCAATCATGCCACCTCCTGGTGCTCCAATGGGCCTAGCACTGAAGAAGAAAAGCATTCCTCAGCCCACAAATGCCCTGAAATCCTTCAACTGGTCTAAACTGCCCGAG
SEQ ID NO:620DAAM1的外显子15
AACAAACTGGAAGGAACAGTATGGACCGAAATTGATGATACAAAAGTCTTCAAAATTCTAGATCTTGAAGACCTGGAAAGAACCTTCTCTGCCTATCAAAGACAGCAG
SEQ ID NO:621DAAM1的外显子16
AAAGAAGCAGATGCCATTGATGACACTCTGAGTTCCAAACTTAAAGTTAAAGAGCTTTCGGTGATTGATGGTCGGAGAGCTCAGAATTGCAACATCCTTCTATCGAG
SEQ ID NO:622DAAM1的外显子17
GTTGAAATTATCCAATGACGAAATCAAACGGGCAATTCTAACAATGGACGAACAGGAAGATCTGCCCAAGGACATGTTGGAACAG
SEQ ID NO:623DAAM1的外显子18
CTCTTGAAATTTGTTCCTGAAAAAAGTGACATTGACCTATTGGAGGAACATAAACACGAACTGGATCGGATGGCCAAGGCTGATAGGTTCCTTTTTGAGATGAGCCG
SEQ ID NO:624DAAM1的外显子19
AATTAATCACTATCAGCAAAGGTTGCAATCGCTGTACTTCAAAAAGAAGTTTGCAGAGCGTGTGGCAGAAGTGAAACCTAAAGTGGAAG
SEQ ID NO:625DAAM1的外显子20
CAATTCGTTCTGGCTCAGAAGAGGTGTTTAGGAGTGGTGCCCTCAAGCAGTTGCTGGAGGTGGTTTTGGCATTTGGAAATTATATGAATAAAGGTCAAAGAGGGAATGCATATGGATTCAAGATATCTAGCCTAAACAAAATTGCTGACACAAAATCCAGCATCGACAA
SEQ ID NO:626DAAM1的外显子21
AAACATTACCCTTTTGCACTATCTCATCACTATTGTGGAAAATAAGTACCCCAGTGTTCTCAATCTAAATGAAGAATTGCGAGATATTCCTCAAGCTGCGAAAGTAAA
SEQ ID NO:627DAAM1的外显子22
CATGACTGAGCTGGACAAAGAAATAAGTACCTTGAGAAGTGGCTTGAAAGCAGTAGAGACA
SEQ ID NO:628DAAM1的外显子23
GAGCTGGAATATCAGAAGTCTCAGCCCCCACAGCCCGGAGATAAGTTTGTGTCTGTTGTCAGCCAGTTCATCACAGTAGCCAGCTTCAGCTTCTCTGATGTTGAAGACCTTCTAGCAGAAGCTAAAGACCTG
SEQ ID NO:629DAAM1的外显子24
TTTACTAAAGCAGTGAAGCACTTTGGGGAAGAGGCTGGCAAAATACAACCAGATGAGTTCTTTGGCATTTTTGATCAATTTCTTCAAGCTGTGTCAGAAGCCAAACAAGAAAACGAAAATATGAGAAAGAAAAAGGAGGAAGAAGAACGTCGAGCTCGCATGGAAGCTCAG
SEQ ID NO:630DAAM1的外显子25
CTCAAAGAACAACGTGAAAGGGAACGTAAAATGAGAAAAGCTAAAGAGAATAGTGAAGAAAGCGGAGAGTTTGATGACCTTGTTTCAGCTTTACGCTCAGGAGAAGTGTTTGACAAAGACCTTTCTAAATTGAAACGGAATCGCAAACGTATTACCAACCAGATGACTGACAGCAGCAGAGAGAGACCAATCACAAAACTTAATTTCTAATTTTCCATGAATACTTTTTTTTAGAAAGCTCATTAGCAGCCCTCTAAAGTGACTAGAACGTTTCATTACACTGCCTTGCAATCCAAACAGTGGCAATTTTTTCCTTCATCTGTGAGTGAATGTGTGAACGTGTGTATGTAAATGTATGTGTGTATATATTAAAAAATGTATATAGATGTCTGAGTGTTGTCTGGAGACCTATACGTATGGTTAAAAAGATTTATGTTAATGTATGTGCTCCAAAACCTTTCGTGTATGCATTCACATTGAGTGTGGCTCATTTTCTTTCCCCGAACGCCATGACTGTTCAGAAGCACAATACTATCTCCTGAAAGAGATAAGAGACATTCCCTAGATTCAAAGGCAAAACAGAAGAAACAAACAAACAAACAAAAAAAGCTTGCAAAATATTTTATGGTTTCCAAGCTTGATATCCTTTAAAATTATTTTCATTGATGGAACTGGAGTTGTTGGAAAAACATAGATTTAAAATGATTTTTGATAGCTGACATTGTGATGTTGATGTATCACATCAGTAATAGGACCAGCTTTGAATTTCTGACATTGGTGTGGGGATACAGTCTGTAAATGTTTATTGAGAACATCTTGCACACAATTTGAATTATGTAGAATGTCAATCAAGTTTTTGTATATTTAAAAGTTGGACATCAATTTTTTCCCCTGATTTCATCAAGTTATCTCTGCCAAGTGCTCTTGATAATTTCTTCAGATTTTTGGAAAAAAACACTATATAAATGCAATCCATGCTTTTTTTAAAGAACAACATTGCCAGAGTATGCTTGTTCTAACAATATAGATATATAAACCTTAAAAATAATAAAATATCTCACCCAAGACTTAAAGGAAGAATTCTCTGAAGGGATAAAGATTACTAAAAAAAAAAAAAAAAAAAAAAAATTAATGGGGTGCCTTTTTGTTATAGTTTCTATTTTCTGTTTTGTAGGACAAGCTGCATTTTCTGTAAATATAGGTCTGGACTAAAGGATACATAAAGAATGCACAAAATGTCAACATCAGCAGAGATGCCCAGATCTATTTATCTCTAAGTATATTTGAAGTGATTGCTGTTTATATGTTGTCATTTTAAAATTGTGTGTCAGTAAAGCTACCTGTAAAATTTCAGTCCAAAAAAATAAAGCTCTCAGGGAGACATGAATAAAATCAATGAACATTAGAAAATAAAATATAGATGCTTACCATTAACCTACCAACTCTTAATATCCTTAAATTATGTGATATATAAAGAGGACTGTTACTTTTTTACTTTTTTTTTTTTTTTTTTTTTTTTTTGGCTTTGCTTTATTTATTTGTAGTTGGGGGCTAACGTTTTCTCTTTTCTTTCTATTGATCCTGTTGTGGTTGGGTTTCCTGTGGAGAGAGTAGTTTGTCCTGTTGCACTAGAACATTATTTACTCACTAAATTGAGTTTTTCAGTCAATTAACAAATATTTATTAAGTTCCTACTATGTACCAGGCATAGTAGGGCTACAATGGTAAGCAAGACAGAGTCCCTGCCCCCAAAGAGCTTATATTCTAATGGGGATATTAAGGGATGAATAGAATACCAATGTGTGCACTGTACAGGAATCATACTATTTAAAAATAATTTGTATAAACTATAATGCTTAGCACAGATGGCGAGTTATCTGTGCTATGTGAAAGCTGTGAAATAGTGCTCTAAGAGTTGTCAAGAGCTGTGGTTTTACATCTTTTCCTCATTGCAAATTTAGTGACTTTCTACACACTATATGGAAATAAATGACTAGCAAATAAAACAGTCATAAATACAAAGCAGAGGTTGCACTCCCCCAATCCCGAGTTAACCCAGGTCTGCAATAACACCATGTTAAAGGTGCAGATAGAGACTTGGCTCAAAAAGGCTTGGAGATGAGGAAGATTGGAATATAATGATGGTTTTGTCTGTTCCTTAACTAAAGTGCCTCTATGTATATTCTTTTCTATTTGTAGCAGGATAAATTTGGTCTGGCTCAGTTTTGGAACTGTATTTTGAAAATGGCTTTGTCTTACAGTTTAAGGAATAGACAGGTGGAGGGAAAGTCACATAAAGGAGCAAGTTTGTGTAGCTGTCCCTCTTGCCCCTTTTAATCATCCTCCTTTGATATGGCCATCCTGGTGGGCCTCCTTTGCCATTTCCATTTTTGGTTTCTTTCCCTGAAAACTGTGTGCAGGTAATTCCATGTGCCATTGTTGAAAAGAAAAAAAAAAAACAAAAAAAAAACCTACTTTTTAGATTGGTGCTGGTGTAAGTAGCCACTTTTCTCTCTTGGGTGTGTATTTTAAACTTTTTTTGTTTTTTTAAATTAATGCCAAAAAGAAAATGCATAATTTGTAAACTTAATTATATGTCTTATATCTTATTAGCTTAGTAGTTGGAACCACTTAGTCTTTAGGTGCAAGACTGTTGTTAGATAGTACTGAGAAAAAAAAAGTATGTGTTATGAGACTGTACATGTTTTTTTAAAAATAGCAATATGCAATAAAGAGATGAATTCATTGGGTGTA
SEQ ID NO:631DAAM1的全mRNA多核苷酸序列
GCGAGTTAGTAACCTACGAGCGGCTGTGAAGGAAACTGTTTAACCGGATCCCATTGTACCCAGAGTGCAGAGCCGCCTTTCCAGCATGCAGGGGCTGCTCAGCGTTTAGTCACATCAAGAAATAGAACAGAATTCAGCCATGGCCCCAAGAAAGAGAGGTGGACGAGGTATTTCATTCATCTTTTGCTGTTTCCGAAATAATGATCACCCAGAAATCACGTATCGGCTGCGAAATGATAGCAACTTTGCGCTTCAGACCATGGAACCAGCATTGCCCATGCCCCCTGTGGAGGAGCTGGATGTCATGTTCAGTGAACTGGTGGATGAACTGGACCTCACAGACAAACACAGAGAAGCCATGTTTGCACTTCCAGCTGAGAAAAAATGGCAAATATACTGTAGCAAGAAAAAGGACCAGGAAGAAAACAAGGGAGCTACAAGTTGGCCTGAATTCTACATTGATCAGCTCAATTCCATGGCTGCTAGAAAATCTCTGCTGGCTTTAGAGAAGGAAGAAGAAGAAGAAAGAAGTAAAACTATAGAGAGTTTAAAGACAGCACTGAGGACAAAACCAATGAGGTTTGTAACCAGATTCATCGACTTGGATGGCCTATCATGTATCCTCAACTTTCTAAAGACCATGGACTACGAGACCTCAGAGTCTCGAATACATACTTCTCTCATTGGCTGTATAAAGGCGTTAATGAACAACTCTCAAGGCCGGGCTCACGTCCTGGCTCATTCTGAGAGTATTAATGTAATTGCTCAGAGTCTGAGCACAGAGAACATTAAAACGAAGGTGGCCGTGCTGGAAATCTTGGGCGCCGTGTGCCTGGTTCCCGGGGGCCACAAGAAGGTTCTGCAGGCCATGCTGCACTACCAGAAGTATGCCAGCGAAAGGACCCGCTTTCAGACATTAATTAACGACTTGGATAAAAGCACTGGGCGGTATCGAGATGAAGTGAGTCTCAAGACTGCCATCATGTCCTTCATTAATGCAGTGCTCAGCCAAGGTGCAGGAGTGGAGAGTTTGGACTTTAGACTTCATCTTCGCTATGAATTTCTGATGTTAGGAATTCAACCTGTAATAGATAAATTAAGGGAACACGAAAATTCAACATTAGATAGGCATTTAGACTTTTTTGAAATGCTCCGAAATGAAGATGAACTAGAATTTGCCAAAAGATTTGAACTGGTTCACATAGACACAAAAAGTGCAACTCAGATGTTTGAGCTGACCAGGAAGAGGCTGACACATAGTGAAGCTTACCCGCATTTCATGTCCATCCTGCACCACTGCCTCCAAATGCCTTACAAGAGGAGTGGCAACACTGTTCAGTACTGGCTACTACTAGATAGAATTATACAGCAGATAGTTATCCAGAATGACAAAGGACAGGACCCTGACTCCACACCTTTGGAAAACTTTAATATTAAGAATGTCGTACGAATGTTGGTTAATGAAAATGAAGTTAAGCAGTGGAAAGAACAAGCGGAAAAAATGAGAAAAGAGCACAATGAGCTACAACAGAAACTGGAAAAGAAAGAACGAGAATGTGATGCTAAGACTCAAGAGAAGGAAGAGATGATGCAGACCTTAAATAAAATGAAAGAGAAACTTGAAAAGGAGACTACTGAGCATAAGCAAGTCAAGCAGCAGGTGGCGGACCTCACAGCACAGCTCCATGAGCTCAGCAGGAGGGCCGTCTGTGCTTCAATCCCAGGTGGACCCTCGCCTGGAGCACCAGGAGGGCCCTTTCCTTCCTCTGTGCCTGGATCTCTCCTTCCTCCCCCACCACCCCCACCTCTACCAGGTGGGATGCTTCCCCCTCCACCGCCTCCCCTCCCTCCAGGTGGCCCTCCTCCTCCCCCAGGGCCTCCTCCCTTAGGGGCAATCATGCCACCTCCTGGTGCTCCAATGGGCCTAGCACTGAAGAAGAAAAGCATTCCTCAGCCCACAAATGCCCTGAAATCCTTCAACTGGTCTAAACTGCCCGAGAACAAACTGGAAGGAACAGTATGGACCGAAATTGATGATACAAAAGTCTTCAAAATTCTAGATCTTGAAGACCTGGAAAGAACCTTCTCTGCCTATCAAAGACAGCAGAAAGAAGCAGATGCCATTGATGACACTCTGAGTTCCAAACTTAAAGTTAAAGAGCTTTCGGTGATTGATGGTCGGAGAGCTCAGAATTGCAACATCCTTCTATCGAGGTTGAAATTATCCAATGACGAAATCAAACGGGCAATTCTAACAATGGACGAACAGGAAGATCTGCCCAAGGACATGTTGGAACAGCTCTTGAAATTTGTTCCTGAAAAAAGTGACATTGACCTATTGGAGGAACATAAACACGAACTGGATCGGATGGCCAAGGCTGATAGGTTCCTTTTTGAGATGAGCCGAATTAATCACTATCAGCAAAGGTTGCAATCGCTGTACTTCAAAAAGAAGTTTGCAGAGCGTGTGGCAGAAGTGAAACCTAAAGTGGAAGCAATTCGTTCTGGCTCAGAAGAGGTGTTTAGGAGTGGTGCCCTCAAGCAGTTGCTGGAGGTGGTTTTGGCATTTGGA
AATTATATGAATAAAGGTCAAAGAGGGAATGCATATGGATTCAAGATATCTAGCCTAAAC
AAAATTGCTGACACAAAATCCAGCATCGACAAAAACATTACCCTTTTGCACTATCTCAT
CACTATTGTGGAAAATAAGTACCCCAGTGTTCTCAATCTAAATGAAGAATTGCGAGATAT
TCCTCAAGCTGCGAAAGTAAACATGACTGAGCTGGACAAAGAAATAAGTACCTTGAGA
AGTGGCTTGAAAGCAGTAGAGACAGAGCTGGAATATCAGAAGTCTCAGCCCCCACAGC
CCGGAGATAAGTTTGTGTCTGTTGTCAGCCAGTTCATCACAGTAGCCAGCTTCAGCTTC
TCTGATGTTGAAGACCTTCTAGCAGAAGCTAAAGACCTGTTTACTAAAGCAGTGAAGC
ACTTTGGGGAAGAGGCTGGCAAAATACAACCAGATGAGTTCTTTGGCATTTTTGATCAA
TTTCTTCAAGCTGTGTCAGAAGCCAAACAAGAAAACGAAAATATGAGAAAGAAAAAG
GAGGAAGAAGAACGTCGAGCTCGCATGGAAGCTCAGCTCAAAGAACAACGTGAAAGG
GAACGTAAAATGAGAAAAGCTAAAGAGAATAGTGAAGAAAGCGGAGAGTTTGATGAC
CTTGTTTCAGCTTTACGCTCAGGAGAAGTGTTTGACAAAGACCTTTCTAAATTGAAACG
GAATCGCAAACGTATTACCAACCAGATGACTGACAGCAGCAGAGAGAGACCAATCACA
AAACTTAATTTCTAATTTTCCATGAATACTTTTTTTTAGAAAGCTCATTAGCAGCCCTCTA
AAGTGACTAGAACGTTTCATTACACTGCCTTGCAATCCAAACAGTGGCAATTTTTTCCT
TCATCTGTGAGTGAATGTGTGAACGTGTGTATGTAAATGTATGTGTGTATATATTAAAAA
ATGTATATAGATGTCTGAGTGTTGTCTGGAGACCTATACGTATGGTTAAAAAGATTTATGT
TAATGTATGTGCTCCAAAACCTTTCGTGTATGCATTCACATTGAGTGTGGCTCATTTTCTT
TCCCCGAACGCCATGACTGTTCAGAAGCACAATACTATCTCCTGAAAGAGATAAGAGA
CATTCCCTAGATTCAAAGGCAAAACAGAAGAAACAAACAAACAAACAAAAAAAGCTT
GCAAAATATTTTATGGTTTCCAAGCTTGATATCCTTTAAAATTATTTTCATTGATGGAACT
GGAGTTGTTGGAAAAACATAGATTTAAAATGATTTTTGATAGCTGACATTGTGATGTTGA
TGTATCACATCAGTAATAGGACCAGCTTTGAATTTCTGACATTGGTGTGGGGATACAGTC
TGTAAATGTTTATTGAGAACATCTTGCACACAATTTGAATTATGTAGAATGTCAATCAAG
TTTTTGTATATTTAAAAGTTGGACATCAATTTTTTCCCCTGATTTCATCAAGTTATCTCTG
CCAAGTGCTCTTGATAATTTCTTCAGATTTTTGGAAAAAAACACTATATAAATGCAATCC
ATGCTTTTTTTAAAGAACAACATTGCCAGAGTATGCTTGTTCTAACAATATAGATATATAA
ACCTTAAAAATAATAAAATATCTCACCCAAGACTTAAAGGAAGAATTCTCTGAAGGGAT
AAAGATTACTAAAAAAAAAAAAAAAAAAAAAAAATTAATGGGGTGCCTTTTTGTTATA
GTTTCTATTTTCTGTTTTGTAGGACAAGCTGCATTTTCTGTAAATATAGGTCTGGACTAA
AGGATACATAAAGAATGCACAAAATGTCAACATCAGCAGAGATGCCCAGATCTATTTAT
CTCTAAGTATATTTGAAGTGATTGCTGTTTATATGTTGTCATTTTAAAATTGTGTGTCAGT
AAAGCTACCTGTAAAATTTCAGTCCAAAAAAATAAAGCTCTCAGGGAGACATGAATAA
AATCAATGAACATTAGAAAATAAAATATAGATGCTTACCATTAACCTACCAACTCTTAAT
ATCCTTAAATTATGTGATATATAAAGAGGACTGTTACTTTTTTACTTTTTTTTTTTTTTTTT
TTTTTTTTTGGCTTTGCTTTATTTATTTGTAGTTGGGGGCTAACGTTTTCTCTTTTCTTTCT
ATTGATCCTGTTGTGGTTGGGTTTCCTGTGGAGAGAGTAGTTTGTCCTGTTGCACTAGA
ACATTATTTACTCACTAAATTGAGTTTTTCAGTCAATTAACAAATATTTATTAAGTTCCTA
CTATGTACCAGGCATAGTAGGGCTACAATGGTAAGCAAGACAGAGTCCCTGCCCCCAA
AGAGCTTATATTCTAATGGGGATATTAAGGGATGAATAGAATACCAATGTGTGCACTGTA
CAGGAATCATACTATTTAAAAATAATTTGTATAAACTATAATGCTTAGCACAGATGGCGA
GTTATCTGTGCTATGTGAAAGCTGTGAAATAGTGCTCTAAGAGTTGTCAAGAGCTGTGG
TTTTACATCTTTTCCTCATTGCAAATTTAGTGACTTTCTACACACTATATGGAAATAAATG
ACTAGCAAATAAAACAGTCATAAATACAAAGCAGAGGTTGCACTCCCCCAATCCCGAG
TTAACCCAGGTCTGCAATAACACCATGTTAAAGGTGCAGATAGAGACTTGGCTCAAAA
AGGCTTGGAGATGAGGAAGATTGGAATATAATGATGGTTTTGTCTGTTCCTTAACTAAA
GTGCCTCTATGTATATTCTTTTCTATTTGTAGCAGGATAAATTTGGTCTGGCTCAGTTTTG
GAACTGTATTTTGAAAATGGCTTTGTCTTACAGTTTAAGGAATAGACAGGTGGAGGGAA
AGTCACATAAAGGAGCAAGTTTGTGTAGCTGTCCCTCTTGCCCCTTTTAATCATCCTCCT
TTGATATGGCCATCCTGGTGGGCCTCCTTTGCCATTTCCATTTTTGGTTTCTTTCCCTGAA
AACTGTGTGCAGGTAATTCCATGTGCCATTGTTGAAAAGAAAAAAAAAAAACAAAAAA
AAAACCTACTTTTTAGATTGGTGCTGGTGTAAGTAGCCACTTTTCTCTCTTGGGTGTGTATTTTAAACTTTTTTTGTTTTTTTAAATTAATGCCAAAAAGAAAATGCATAATTTGTAAACTTAATTATATGTCTTATATCTTATTAGCTTAGTAGTTGGAACCACTTAGTCTTTAGGTGCAAGACTGTTGTTAGATAGTACTGAGAAAAAAAAAGTATGTGTTATGAGACTGTACATGTTTTTTTAAAAATAGCAATATGCAATAAAGAGATGAATTCATTGGGTGTA
SEQ ID NO:632DAAM1的全蛋白质序列
MAPRKRGGRGISFIFCCFRNNDHPEITYRLRNDSNFALQTMEPALPMPPVEELDVMFSELVDELDLTDKHREAMFALPAEKKWQIYCSKKKDQEENKGATSWPEFYIDQLNSMAARKSLLALEKEEEEERSKTIESLKTALRTKPMRFVTRFIDLDGLSCILNFLKTMDYETSESRIHTSLIGCIKALMNNSQGRAHVLAHSESINVIAQSLSTENIKTKVAVLEILGAVCLVPGGHKKVLQAMLHYQKYASERTRFQTLINDLDKSTGRYRDEVSLKTAIMSFINAVLSQGAGVESLDFRLHLRYEFLMLGIQPVIDKLREHENSTLDRHLDFFEMLRNEDELEFAKRFELVHIDTKSATQMFELTRKRLTHSEAYPHFMSILHHCLQMPYKRSGNTVQYWLLLDRIIQQIVIQNDKGQDPDSTPLENFNIKNVVRMLVNENEVKQWKEQAEKMRKEHNELQQKLEKKERECDAKTQEKEEMMQTLNKMKEKLEKETTEHKQVKQQVADLTAQLHELSRRAVCASIPGGPSPGAPGGPFPSSVPGSLLPPPPPPPLPGGMLPPPPPPLPPGGPPPPPGPPPLGAIMPPPGAPMGLALKKKSIPQPTNALKSFNWSKLPENKLEGTVWTEIDDTKVFKILDLEDLERTFSAYQRQQKEADAIDDTLSSKLKVKELSVIDGRRAQNCNILLSRLKLSNDEIKRAILTMDEQEDLPKDMLEQLLKFVPEKSDIDLLEEHKHELDRMAKADRFLFEMSRINHYQQRLQSLYFKKKFAERVAEVKPKVEAIRSGSEEVFRSGALKQLLEVVLAFGNYMNKGQRGNAYGFKISSLNKIADTKSSIDKNITLLHYLITIVENKYPSVLNLNEELRDIPQAAKVNMTELDKEISTLRSGLKAVETELEYQKSQPPQPGDKFVSVVSQFITVASFSFSDVEDLLAEAKDLFTKAVKHFGEEAGKIQPDEFFGIFDQFLQAVSEAKQENENMRKKKEEEERRARMEAQLKEQRERERKMRKAKENSEESGEFDDLVSALRSGEVFDKDLSKLKRNRKRITNQMTDSSRERPITKLNF
ASPH序列信息
SEQ ID NO:633来自ASPH-NRG1融合物5’处的ASPH外显子22的序列
AAGGTCTCTTCCTGCCTGAGGATGAAAACCTGAGGGAAAAAGGGGACTGGAGCCAGTTCACGCTGTGGCAGCAAG
SEQ ID NO:634ASPH-NRG1融合物3’处的NRG1外显子2序列
CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA
SEQ ID NO:635ASPH-NRG1多核苷酸序列
AAGGTCTCTTCCTGCCTGAGGATGAAAACCTGAGGGAAAAAGGGGACTGGAGCCAGTTCACGCTGTGGCAGCAAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA
SEQ ID NO:636ASPH-NRG1多肽序列
GLFLPEDENLREKGDWSQFTLWQQALPPRLKEMKSQESAAGSKLVLRCE
SEQ ID NO:637ASPH的外显子1
AGTCTCAAGCTCTGGTAGGCAAGTGCATGCAGTGTGCCTAAAACCTGCCAGCAGTACTTTTGAGTTTTTTTTTTTGTTTTGTTTTACTTTAGCATTTATTATTCATGGATTGAAGAAATCAAAATGGCTGAAGATAAAG
SEQ ID NO:638ASPH的外显子2
AGACAAAGCATGGAGGACACAAGAATGGGAGGAAAGGCGGACTCTCAGGAACTTCATTCTTCACGTGGTTTATGGTGATTGCATTGCTGGGCGTCTGGACATCTGTAGCTGTCGTTTGGTTTGATCTTGTTGACTATGAGGAAGTTCTAG
SEQ ID NO:639ASPH的外显子3
GAAAACTAGGAATCTATGATGCTGATGGTGATGGAGATTTTGATGTGGATGATGCCAAAGTTTTATTAG
SEQ ID NO:640ASPH的外显子4
GACTTAAAGAGAGATCTACTTCAGAGCCAGCAGTCCCGCCAGAAGAGGCTGAGCCACACACTGAGCCCGAGGAGCAGGTTCCTGTGGAGGCAG
SEQ ID NO:641ASPH的外显子5AACCCCAGAATATCGAAGATGAAGCAAAAGAACAAATTCAGTCCCTTCTCCATGAAATGGTACACGCAGAACATG
SEQ ID NO:642ASPH的外显子6
TTGAGGGAGAAGACTTGCAACAAGAAGATGGACCCACAGGAGAACCACAACAAGAGGATGATGAGTTTCTTATGGCGACTGATGTAGATGATAGATTTGAGACCCTGGAACCTGAAGTATCTCATGAAG
SEQ ID NO:643ASPH的外显子7
AAACCGAGCATAGTTACCACGTGGAAGAGACAG
SEQ ID NO:644ASPH的外显子8
TTTCACAAGACTGTAATCAGGATATGGAAGAGATGATGTCTGAGCAGGAAAATCCAG
SEQ ID NO:645ASPH的外显子9
ATTCCAGTGAACCAGTAGTAGAAGATGAAAGATTGCACCATGATACAG
SEQ ID NO:646ASPH的外显子10
ATGATGTAACATACCAAGTCTATGAGGAACAAG
SEQ ID NO:647ASPH的外显子11
CAGTATATGAACCTCTAGAAAATGAAGGGATAGAAATCACAG
SEQ ID NO:648ASPH的外显子12
AAGTAACTGCTCCCCCTGAGGATAATCCTGTAGAAGATTCACAGGTAATTGTAGAAG
SEQ ID NO:649ASPH的外显子13
AAGTAAGCATTTTTCCTGTGGAAGAACAGCAGGAAGTACCACCAG
SEQ ID NO:650ASPH的外显子14
AAACAAATAGAAAAACAGATGATCCAGAACAAAAAGCAAAAG
SEQ ID NO:651ASPH的外显子15
TTAAGAAAAAGAAGCCTAAACTTTTAAATAAATTTGATAAGACTATTAAAGCTGAACTTGATGCTGCAGAAAAACTCCGTAAAAGG
SEQ ID NO:652ASPH的外显子16
GGAAAAATTGAGGAAGCAGTGAATGCATTTAAAGAACTAGTACGCAAATACCCTCAGAGTCCACGAGCAAGATATGGGAAGGCGCAG
SEQ ID NO:653ASPH的外显子17
TGTGAGGATGATTTGGCTGAGAAGAGGAGAAGTAATGAGGTGCTACGTGGAGCCATCGAGACCTACCAAGAGGTGGCCAGCCTACCTGATGTCCCTGCAGACCTGCTGAAGCTGAGTTTGAAGCGTCGCTCAGACAGGCAACAATTTCTAG
SEQ ID NO:654ASPH的外显子18
GTCATATGAGAGGTTCCCTGCTTACCCTGCAGAGATTAGTTCAACTATTTCCCAATGATACTTCCTTAAAAAATGACCTTGGCGTGGGATACCTCTTGATAGGAGATAATGACAATGCAAAGAAAGTTTATGAAGAG
SEQ ID NO:655ASPH的外显子19
GTGCTGAGTGTGACACCTAATGATGGCTTTGCTAAAGTCCATTATGGCTTCATCCTGAAGGCACAGAACAAAATTGCTGAGAGCATCCCATATTTAAAG
SEQ ID NO:656ASPH的外显子20
GAAGGAATAGAATCCGGAGATCCTGGCACTGATGATGGGAGATTTTATTTCCACCTGGGGGATGCCATGCAGAGGGTTGGGAACAAAGAG
SEQ ID NO:657ASPH的外显子21
GCATATAAGTGGTATGAGCTTGGGCACAAGAGAGGACACTTTGCATCTGTCTGGCAACGCTCACTCTACAATGTGAATGGACTGAAAGCACAGCCTTGGTGGACCCCAAAAGAAACGGGCTACACAGAGTTAGTAAAG
SEQ ID NO:658ASPH的外显子22
TCTTTAGAAAGAAACTGGAAGTTAATCCGAGATGAAGGCCTTGCAGTGATGGATAAAGCCAAAGGTCTCTTCCTGCCTGAGGATGAAAACCTGAGGGAAAAAGGGGACTGGAGCCAGTTCACGCTGTGGCAGCAAG
SEQ ID NO:659ASPH的外显子23
GAAGAAGAAATGAAAATGCCTGCAAAGGAGCTCCTAAAACCTGTACCTTACTAGAAAAGTTCCCCGAGACAACAGGATGCAGAAGAGGACAG
SEQ ID NO:660ASPH的外显子24
ATCAAATATTCCATCATGCACCCCGGGACTCACGTGTGGCCGCACACAGGGCCCACAAACTGCAGGCTCCGAATGCACCTGGGCTTGGTGATTCCCAAGGAAGGCTGCAAGATTCGATGTGCCAACGAGACCAA
SEQ ID NO:661ASPH的外显子25
GACCTGGGAGGAAGGCAAGGTGCTCATCTTTGATGACTCCTTTGAGCACGAGGTATGGCAGGATGCCTCATCTTTCCGGCTGATATTCATCGTGGATGTGTGGCATCCGGAACTGACACCACAGCAGAGACGCAGCCTTCCAGCAATTTAGCATGAATTCATGCAAGCTTGGGAAACTCTGGAGAGAGGCTGCCTTTCTGGTTCCATCTCCTTGGGTGTGAGGATAGAATTTCGAACACCAAGAGTCAATTCCCTTGACTTGCAGCCCGAGTAATTCAAAGCCTCCTCCTAGGGTCAGAAGACACTAAAGGGAATATTTGCCTCGCTGCAATTCATTTAGGAAACACCCTGCTGTGTGTCATCTCATGACAGCACTGGTCTTCTGCCAGTATTTAAGGTGAACATTTGATAGCTTCTACCTTACCAGCCAAAGATATTTTTTCCACATAGAATAGGTCTAATTCAATGTATAATGAGAACATATGTAGAAACTGTGAATGGATTGCTTTAGTTTGTAATTTTTCTATGCAGTTATATTTTTCTAGTGTAGCTAGACTATTTTGTCATCATGTACCACTACATTTTTGTTTATTTTAATGACAAGCTGTATAAATGCTTTACTTCTAGCTATTTAATGGTAGCATTACTGGGGAACTCAGACTTCCCTCTTTTAATTCTTCTTAGTAAAAGATACTCATGAAAAAAGCAGTTTTATTTTCCTAACAAAAAAGAAAGAGCTCATTATGTCAGTGTCTATGAACTGTACCCATCCCAACTCTCAAATCGTTTGGTTTTTTTTATCTTGATTGAGATCCTCTTCTCACTATGCTAGTGGTGGAGATATTGACAAAATCCTATTTCTTTCAAAGAGGAACTTTTCACACCGAAAAAAGAGCATGGAATTATTTTATATTGTTATAAAAATCCCAGATGCAAATTTTTTTAATGCCAATTATTAGAGCTTCTGGGGAAAAAGTATAGTTCACGGAAATAAAACTATGTTCTTTCAGGGTTGGGTGGATAGGTGGCTGCTAGGGTGTCTGGCTCCTGGCGGCTTTGCCATCCATGAGGCAAGGGCTGGGAACACAGTGTCTTTGCCTATGGTAGATCCATGTGAATGTCAGGAAGCCAGCTCTTCAGTCTTGGAGATGATTTCTGCTACAATTCTGTAGAAAGATTAAGGATGGCAGAGTAAAAGGTTACCAAGAATGCCAGGATGTTTTTCTTGGGCGTAGGAGGTCCAGATTACTTTCCTTTTTGATGAAAGAGTTTGGAAGACTGTCCCATCTCTCTGGCTTGAGAAATCTCTGCCATTTTAAACATCACTGTGAAATAGCAATTATTATCATCTGTATTTAGTTTTAACATTACCCACAACATAGAAATAATAGGTAAAAATCGTCTTGCCTACTCATTCCAAAGATGATCAAGTCATTAATCTAGCAAAGTATTCATGTATCAGATTTTGTATATTTTGAATCAAAGCTAACTAGGAATGTTAGATATAAGAATGTAATGATATTCATGCACTGAATTCTAAGCCAATATGAACAAAAATGCTGCATGAATGGCACATATAGGTCACCAAAGTTCATTCACAGGTAGAAAAAACTTGTGCTTTCTTTTCCATCTAAAAACAAAAGGAGACTTTCTTTATCTCATTTAAAGAACAGCTCTTTGAAATTGAAATTGACCCTTTTTGCTTGACCTTAAGGAGATTAGCTTCCAGTAGATGAGTTTGCAAAATACTTTTCCTGTTCTTTTGTTTTGCTGGTATTGAAAACATCCCACTAAATCAGATGAAGAGGCATGGGAGGAAAAATATCCAAATTAATTACTAAAATCGAGAAGAGAAGGCAAACTCTTGAAAAGTAAAAAGGTGTTTGTGACCTTCAGTATTTATTGAACAGAGGAAATAACTGACAAGGGCAATACAATTCAATGTTCATGTAGTAACATTCATGTCACTTGTTGAATTTGGTTCTCATATGTATATTGCATACACATAAATTCAAACTATAAGTCGTCATTTTTGAGCCATCATCTTACATTCATGTAATGAAATTATGGAAGAGAGTAAAAACTAGCTCTTAACTTAGTAAATATAATATGGTATTTAAAATCAGGTCACTACAGTAAGGTTCTAAGTATTGCCAATTGAAAAGCTAGAAATGGTATTACTGTTGCAAAGTGTTGTCAATAATTGACTCCAATAGCATTGTAAATACTTGTATCCCACAACTATTTTAAACCCAAGCAATAAAATGGATTTTCTAATTCACTTCAATTCTTTATTTCTCTTACCTATCTATGTCTTGGTACATAAGAAAAGTGTTTCCATCACTGCATTGGTAGAATTATTTCAGTGTTATTATTTTTGTGATTTCGTATGTCTACACAAAAATGAATTAGTTTAATTTATATTGTGATACAGTTGTTTGAGAAATATTTTTAATTCTGTTTCAACTTTATTTCTCCAAGTGTATAATATAAAAATTACTTCTGTTATTGTTCTCTACCAATAGGGGAAAAAATTAAAACATTAGATCCATTGAGAAAGAGATGATGTAATAAATAATTAAGATTAGTAATAATATTATCAGGGGTGATTATGACCAGTTGAATAATCTCTTTCCCTTGAATTATTTAGCTAACAAATTAACTCTCCCAAATATTTAAAATAATGTAAAATCATATTTTACTGCCCATTATTAACTAAAATATTTTTGTTTGACTTTGAGCACCAACTGGTAATACTAATAAATACCCATGTCATGCAGATGGCTGGGCGAATAAGAGATGTCTAAAAATATGCACTGGTCTTGGAAAACATGGCACAAGTAAGGATATCATATATGATGTCTGTTTATTTTATGTCTGATTTCTTTTGAATGAGTAGTTGGGGACTCCATTTCTAAGGAGACTAGGTAAATAAAATGACCTTTGACATTTCA
SEQ ID NO:662ASPH的全mRNA多核苷酸序列
AGTCTCAAGCTCTGGTAGGCAAGTGCATGCAGTGTGCCTAAAACCTGCCAGCAGTACTTTTGAGTTTTTTTTTTTGTTTTGTTTTACTTTAGCATTTATTATTCATGGATTGAAGAAATCAAAATGGCTGAAGATAAAGAGACAAAGCATGGAGGACACAAGAATGGGAGGAAAGGCGGACTCTCAGGAACTTCATTCTTCACGTGGTTTATGGTGATTGCATTGCTGGGCGTCTGGACATCTGTAGCTGTCGTTTGGTTTGATCTTGTTGACTATGAGGAAGTTCTAGGAAAACTAGGAATCTATGATGCTGATGGTGATGGAGATTTTGATGTGGATGATGCCAAAGTTTTATTAGGACTTAAAGAGAGATCTACTTCAGAGCCAGCAGTCCCGCCAGAAGAGGCTGAGCCACACACTGAGCCCGAGGAGCAGGTTCCTGTGGAGGCAGAACCCCAGAATATCGAAGATGAAGCAAAAGAACAAATTCAGTCCCTTCTCCATGAAATGGTACACGCAGAACATGTTGAGGGAGAAGACTTGCAACAAGAAGATGGACCCACAGGAGAACCACAACAAGAGGATGATGAGTTTCTTATGGCGACTGATGTAGATGATAGATTTGAGACCCTGGAACCTGAAGTATCTCATGAAGAAACCGAGCATAGTTACCACGTGGAAGAGACAGTTTCACAAGACTGTAATCAGGATATGGAAGAGATGATGTCTGAGCAGGAAAATCCAGATTCCAGTGAACCAGTAGTAGAAGATGAAAGATTGCACCATGATACAGATGATGTAACATACCAAGTCTATGAGGAACAAGCAGTATATGAACCTCTAGAAAATGAAGGGATAGAAATCACAGAAGTAACTGCTCCCCCTGAGGATAATCCTGTAGAAGATTCACAGGTAATTGTAGAAGAAGTAAGCATTTTTCCTGTGGAAGAACAGCAGGAAGTACCACCAGAAACAAATAGAAAAACAGATGATCCAGAACAAAAAGCAAAAGTTAAGAAAAAGAAGCCTAAACTTTTAAATAAATTTGATAAGACTATTAAAGCTGAACTTGATGCTGCAGAAAAACTCCGTAAAAGGGGAAAAATTGAGGAAGCAGTGAATGCATTTAAAGAACTAGTACGCAAATACCCTCAGAGTCCACGAGCAAGATATGGGAAGGCGCAGTGTGAGGATGATTTGGCTGAGAAGAGGAGAAGTAATGAGGTGCTACGTGGAGCCATCGAGACCTACCAAGAGGTGGCCAGCCTACCTGATGTCCCTGCAGACCTGCTGAAGCTGAGTTTGAAGCGTCGCTCAGACAGGCAACAATTTCTAGGTCATATGAGAGGTTCCCTGCTTACCCTGCAGAGATTAGTTCAACTATTTCCCAATGATACTTCCTTAAAAAATGACCTTGGCGTGGGATACCTCTTGATAGGAGATAATGACAATGCAAAGAAAGTTTATGAAGAGGTGCTGAGTGTGACACCTAATGATGGCTTTGCTAAAGTCCATTATGGCTTCATCCTGAAGGCACAGAACAAAATTGCTGAGAGCATCCCATATTTAAAGGAAGGAATAGAATCCGGAGATCCTGGCACTGATGATGGGAGATTTTATTTCCACCTGGGGGATGCCATGCAGAGGGTTGGGAACAAAGAGGCATATAAGTGGTATGAGCTTGGGCACAAGAGAGGACACTTTGCATCTGTCTGGCAACGCTCACTCTACAATGTGAATGGACTGAAAGCACAGCCTTGGTGGACCCCAAAAGAAACGGGCTACACAGAGTTAGTAAAGTCTTTAGAAAGAAACTGGAAGTTAATCCGAGATGAAGGCCTTGCAGTGATGGATAAAGCCAAAGGTCTCTTCCTGCCTGAGGATGAAAACCTGAGGGAAAAAGGGGACTGGAGCCAGTTCACGCTGTGGCAGCAAGGAAGAAGAAATGAAAATGCCTGCAAAGGAGCTCCTAAAACCTGTACCTTACTAGAAAAGTTCCCCGAGACAACAGGATGCAGAAGAGGACAGATCAAATATTCCATCATGCACCCCGGGACTCACGTGTGGCCGCACACAGGGCCCACAAACTGCAGGCTCCGAATGCACCTGGGCTTGGTGATTCCCAAGGAAGGCTGCAAGATTCGATGTGCCAACGAGACCAAGACCTGGGAGGAAGGCAAGGTGCTCATCTTTGATGACTCCTTTGAGCACGAGGTATGGCAGGATGCCTCATCTTTCCGGCTGATATTCATCGTGGATGTGTGGCATCCGGAACTGACACCACAGCAGAGACGCAGCCTTCCAGCAATTTAGCATGAATTCATGCAAGCTTGGGAAACTCTGGAGAGAGGCTGCCTTTCTGGTTCCATCTCCTTGGGTGTGAGGATAGAATTTCGAACACCAAGAGTCAATTCCCTTGACTTGCAGCCCGAGTAATTCAAAGCCTCCTCCTAGGGTCAGAAGACACTAAAGGGAATATTTGCCTCGCTGCAATTCATTTAGGAAACACCCTGCTGTGTGTCATCTCATGACAGCACTGGTCTTCTGCCAGTATTTAAGGTGAACATTTGATAGCTTCTACCTTACCAGCCAAAGATATTTTTTCCACATAGAATAGGTCTAATTCAATGTATAATGAGAACATATGTAGAAACTGTGAATGGATTGCTTTAGTTTGTAATTTTTCTATGCAGTTATATTTTTCTAGTGTAGCTAGACTATTTTGTCATCATGTACCACTACATTTTTGTTTATTTTAATGACAAGCTGTATAAATGCTTTACTTCTAGCTATTTAATGGTAGCATTACTGGGGAACTCAGACTTCCCTCTTTTAATTCTTCTTAGTAAAAGATACTCATGAAAAAAGCAGTTTTATTTTCCTAACAAAAAAGAAAGAGCTCATTATGTCAGTGTCTATGAACTGTACCCATCCCAACTCTCAAATCGTTTGGTTTTTTTTATCTTGATTGAGATCCTCTTCTCACTATGCTAGTGGTGGAGATATTGACAAAATCCTATTTCTTTCAAAGAGGAACTTTTCACACCGAAAAAAGAGCATGGAATTATTTTATATTGTTATAAAAATCCCAGATGCAAATTTTTTTAATGCCAATTATTAGAGCTTCTGGGGAAAAAGTATAGTTCACGGAAATAAAACTATGTTCTTTCAGGGTTGGGTGGATAGGTGGCTGCTAGGGTGTCTGGCTCCTGGCGGCTTTGCCATCCATGAGGCAAGGGCTGGGAACACAGTGTCTTTGCCTATGGTAGATCCATGTGAATGTCAGGAAGCCAGCTCTTCAGTCTTGGAGATGATTTCTGCTACAATTCTGTAGAAAGATTAAGGATGGCAGAGTAAAAGGTTACCAAGAATGCCAGGATGTTTTTCTTGGGCGTAGGAGGTCCAGATTACTTTCCTTTTTGATGAAAGAGTTTGGAAGACTGTCCCATCTCTCTGGCTTGAGAAATCTCTGCCATTTTAAACATCACTGTGAAATAGCAATTATTATCATCTGTATTTAGTTTTAACATTACCCACAACATAGAAATAATAGGTAAAAATCGTCTTGCCTACTCATTCCAAAGATGATCAAGTCATTAATCTAGCAAAGTATTCATGTATCAGATTTTGTATATTTTGAATCAAAGCTAACTAGGAATGTTAGATATAAGAATGTAATGATATTCATGCACTGAATTCTAAGCCAATATGAACAAAAATGCTGCATGAATGGCACATATAGGTCACCAAAGTTCATTCACAGGTAGAAAAAACTTGTGCTTTCTTTTCCATCTAAAAACAAAAGGAGACTTTCTTTATCTCATTTAAAGAACAGCTCTTTGAAATTGAAATTGACCCTTTTTGCTTGACCTTAAGGAGATTAGCTTCCAGTAGATGAGTTTGCAAAATACTTTTCCTGTTCTTTTGTTTTGCTGGTATTGAAAACATCCCACTAAATCAGATGAAGAGGCATGGGAGGAAAAATATCCAAATTAATTACTAAAATCGAGAAGAGAAGGCAAACTCTTGAAAAGTAAAAAGGTGTTTGTGACCTTCAGTATTTATTGAACAGAGGAAATAACTGACAAGGGCAATACAATTCAATGTTCATGTAGTAACATTCATGTCACTTGTTGAATTTGGTTCTCATATGTATATTGCATACACATAAATTCAAACTATAAGTCGTCATTTTTGAGCCATCATCTTACATTCATGTAATGAAATTATGGAAGAGAGTAAAAACTAGCTCTTAACTTAGTAAATATAATATGGTATTTAAAATCAGGTCACTACAGTAAGGTTCTAAGTATTGCCAATTGAAAAGCTAGAAATGGTATTACTGTTGCAAAGTGTTGTCAATAATTGACTCCAATAGCATTGTAAATACTTGTATCCCACAACTATTTTAAACCCAAGCAATAAAATGGATTTTCTAATTCACTTCAATTCTTTATTTCTCTTACCTATCTATGTCTTGGTACATAAGAAAAGTGTTTCCATCACTGCATTGGTAGAATTATTTCAGTGTTATTATTTTTGTGATTTCGTATGTCTACACAAAAATGAATTAGTTTAATTTATATTGTGATACAGTTGTTTGAGAAATATTTTTAATTCTGTTTCAACTTTATTTCTCCAAGTGTATAATATAAAAATTACTTCTGTTATTGTTCTCTACCAATAGGGGAAAAAATTAAAACATTAGATCCATTGAGAAAGAGATGATGTAATAAATAATTAAGATTAGTAATAATATTATCAGGGGTGATTATGACCAGTTGAATAATCTCTTTCCCTTGAATTATTTAGCTAACAAATTAACTCTCCCAAATATTTAAAATAATGTAAAATCATATTTTACTGCCCATTATTAACTAAAATATTTTTGTTTGACTTTGAGCACCAACTGGTAATACTAATAAATACCCATGTCATGCAGATGGCTGGGCGAATAAGAGATGTCTAAAAATATGCACTGGTCTTGGAAAACATGGCACAAGTAAGGATATCATATATGATGTCTGTTTATTTTATGTCTGATTTCTTTTGAATGAGTAGTTGGGGACTCCATTTCTAAGGAGACTAGGTAAATAAAATGACCTTTGACATTTCA
SEQ ID NO:663ASPH的外显子1的翻译多肽序列
MAEDK
SEQ ID NO:664ASPH的外显子2的翻译多肽序列
TKHGGHKNGRKGGLSGTSFFTWFMVIALLGVWTSVAVVWFDLVDYEEVL
SEQ ID NO:665ASPH的外显子3的翻译多肽序列
KLGIYDADGDGDFDVDDAKVLL
SEQ ID NO:666ASPH的外显子4的翻译多肽序列
LKERSTSEPAVPPEEAEPHTEPEEQVPVEA
SEQ ID NO:667ASPH的外显子5的翻译多肽序列
PQNIEDEAKEQIQSLLHEMVHAEH
SEQ ID NO:668ASPH的外显子6的翻译多肽序列
EGEDLQQEDGPTGEPQQEDDEFLMATDVDDRFETLEPEVSHE
SEQ ID NO:669ASPH的外显子7的翻译多肽序列
TEHSYHVEET
SEQ ID NO:670ASPH的外显子8的翻译多肽序列
SQDCNQDMEEMMSEQENP
SEQ ID NO:671ASPH的外显子9的翻译多肽序列
SSEPVVEDERLHHDT
SEQ ID NO:672ASPH的外显子10的翻译多肽序列
DVTYQVYEEQ
SEQ ID NO:673ASPH的外显子11的翻译多肽序列
VYEPLENEGIEIT
SEQ ID NO:674ASPH的外显子12的翻译多肽序列
VTAPPEDNPVEDSQVIVE
SEQ ID NO:675ASPH的外显子13的翻译多肽序列
VSIFPVEEQQEVPP
SEQ ID NO:676ASPH的外显子14的翻译多肽序列
TNRKTDDPEQKAK
SEQ ID NO:677ASPH的外显子15的翻译多肽序列
KKKKPKLLNKFDKTIKAELDAAEKLRKR
SEQ ID NO:678ASPH的外显子16的翻译多肽序列
GKIEEAVNAFKELVRKYPQSPRARYGKAQ
SEQ ID NO:679ASPH的外显子17的翻译多肽序列
CEDDLAEKRRSNEVLRGAIETYQEVASLPDVPADLLKLSLKRRSDRQQFL
SEQ ID NO:680ASPH的外显子18的翻译多肽序列
HMRGSLLTLQRLVQLFPNDTSLKNDLGVGYLLIGDNDNAKKVYEE
SEQ ID NO:681ASPH的外显子19的翻译多肽序列
VLSVTPNDGFAKVHYGFILKAQNKIAESIPYLK
SEQ ID NO:682ASPH的外显子20的翻译多肽序列
EGIESGDPGTDDGRFYFHLGDAMQRVGNKE
SEQ ID NO:683ASPH的外显子21的翻译多肽序列
AYKWYELGHKRGHFASVWQRSLYNVNGLKAQPWWTPKETGYTELVK
SEQ ID NO:684ASPH的外显子22的翻译多肽序列
SLERNWKLIRDEGLAVMDKAKGLFLPEDENLREKGDWSQFTLWQQ
SEQ ID NO:685ASPH的外显子23的翻译多肽序列
RRNENACKGAPKTCTLLEKFPETTGCRRGQ
SEQ ID NO:686ASPH的外显子24的翻译多肽序列
IKYSIMHPGTHVWPHTGPTNCRLRMHLGLVIPKEGCKIRCANET
SEQ ID NO:687ASPH的外显子25的翻译多肽序列TWEEGKVLIFDDSFEHEVWQDASSFRLIFIVDVWHPELTPQQRRSLPAI
SEQ ID NO:688ASPH的全蛋白质序列
MAEDKETKHGGHKNGRKGGLSGTSFFTWFMVIALLGVWTSVAVVWFDLVDYEEVLGKLGIYDADGDGDFDVDDAKVLLGLKERSTSEPAVPPEEAEPHTEPEEQVPVEAEPQNIEDEAKEQIQSLLHEMVHAEHVEGEDLQQEDGPTGEPQQEDDEFLMATDVDDRFETLEPEVSHEETEHSYHVEETVSQDCNQDMEEMMSEQENPDSSEPVVEDERLHHDTDDVTYQVYEEQAVYEPLENEGIEITEVTAPPEDNPVEDSQVIVEEVSIFPVEEQQEVPPETNRKTDDPEQKAKVKKKKPKLLNKFDKTIKAELDAAEKLRKRGKIEEAVNAFKELVRKYPQSPRARYGKAQCEDDLAEKRRSNEVLRGAIETYQEVASLPDVPADLLKLSLKRRSDRQQFLGHMRGSLLTLQRLVQLFPNDTSLKNDLGVGYLLIGDNDNAKKVYEEVLSVTPNDGFAKVHYGFILKAQNKIAESIPYLKEGIESGDPGTDDGRFYFHLGDAMQRVGNKEAYKWYELGHKRGHFASVWQRSLYNVNGLKAQPWWTPKETGYTELVKSLERNWKLIRDEGLAVMDKAKGLFLPEDENLREKGDWSQFTLWQQGRRNENACKGAPKTCTLLEKFPETTGCRRGQIKYSIMHPGTHVWPHTGPTNCRLRMHLGLVIPKEGCKIRCANETKTWEEGKVLIFDDSFEHEVWQDASSFRLIFIVDVWHPELTPQQRRSLPAI
SEQ ID NO:689ASPH的全部外显子1-22按顺序排列的多核苷酸序列
SEQ ID NO:690ASPH的全部外显子1-22按顺序排列的翻译多肽序列
NOTCH2序列信息
SEQ ID NO:691来自NOTCH2-NRG1融合物5’处的NOTCH2外显子6的序列
CCTCCTGTACTCCAGGCTCCACCTGCATCGACCGTGTGGCCTCCTTCTCTTGCATGTGCCCAGAGGGGAAGGCAG
SEQ ID NO:692NOTCH2-NRG1融合物3’处的NRG1外显子6序列
CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG
SEQ ID NO:693Notch2-NRG1多核苷酸序列
CCTCCTGTACTCCAGGCTCCACCTGCATCGACCGTGTGGCCTCCTTCTCTTGCATGTGCCCAGAGGGGAAGGCAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG
SEQ ID NO:694Notch2-NRG1多肽序列
SCTPGSTCIDRVASFSCMCPEGKAATSTSTTGTSHLVKCAEKEKTFCVN
SEQ ID NO:695NOTCH2的外显子1
AGGCTGCTTCGTTGCACACCCGAGAAAGTTTCAGCCAAACTTCGGGCGGCGGCTGAGGCGGCGGCCGAGGAGCGGCGGACTCGGGGCGCGGGGAGTCGAGGCATTTGCGCCTGGGCTTCGGAGCGTAGCGCCAGGGCCTGAGCCTTTGAAGCAGGAGGAGGGGAGGAGAGAGTGGGGCTCCTCTATCGGGACCCCCTCCCCATGTGGATCTGCCCAGGCGGCGGCGGCGGCGGCGGAGGAGGAGGCGACCGAGAAGATGCCCGCCCTGCGCCCCGCTCTGCTGTGGGCGCTGCTGGCGCTCTGGCTGTGCTGCGCGGCCCCCGCGCATG
SEQ ID NO:696NOTCH2的外显子2
CATTGCAGTGTCGAGATGGCTATGAACCCTGTGTAAATGAAGGAATGTGTGTTACCTACCACAATGGCACAGGATACTGCAA
SEQ ID NO:697NOTCH2的外显子3
ATGTCCAGAAGGCTTCTTGGGGGAATATTGTCAACATCGAGACCCCTGTGAGAAGAACCGCTGCCAGAATGGTGGGACTTGTGTGGCCCAGGCCATGCTGGGGAAAGCCACGTGCCGATGTGCCTCAGGGTTTACAGGAGAGGACTGCCAGTACTCAACATCTCATCCATGCTTTGTGTCTCGACCCTGCCTGAATGGCGGCACATGCCATATGCTCAGCCGGGATACCTATGAGTGCACCTGTCAAGTCGGGTTTACAG
SEQ ID NO:698NOTCH2的外显子4
GTAAGGAGTGCCAATGGACGGATGCCTGCCTGTCTCATCCCTGTGCAAATGGAAGTACCTGTACCACTGTGGCCAACCAGTTCTCCTGCAAATGCCTCACAGGCTTCACAGGGCAGAAATGTGAGACTGATGTCAATGAGTGTGACATTCCAGGACACTGCCAGCATGGTGGCACCTGCCTCAACCTGCCTGGTTCCTACCAGTGCCAGTGCCCTCAGGGCTTCACAGGCCAGTACTGTGACAGCCTGTATGTGCCCTGTGCACCCTCACCTTGTGTCAATGGAGGCACCTGTCGGCAGACTGGTGACTTCACTTTTGAGTGCAACTGCCTTCCAG
SEQ ID NO:699NOTCH2的外显子5
GTTTTGAAGGGAGCACCTGTGAGAGGAATATTGATGACTGCCCTAACCACAGGTGTCAGAATGGAGGGGTTTGTGTGGATGGGGTCAACACTTACAACTGCCGCTGTCCCCCACAATGGACAG
SEQ ID NO:700NOTCH2的外显子6
GACAGTTCTGCACAGAGGATGTGGATGAATGCCTGCTGCAGCCCAATGCCTGTCAAAATGGGGGCACCTGTGCCAACCGCAATGGAGGCTATGGCTGTGTATGTGTCAACGGCTGGAGTGGAGATGACTGCAGTGAGAACATTGATGATTGTGCCTTCGCCTCCTGTACTCCAGGCTCCACCTGCATCGACCGTGTGGCCTCCTTCTCTTGCATGTGCCCAGAGGGGAAGGCAG
SEQ ID NO:701NOTCH2的外显子7
GTCTCCTGTGTCATCTGGATGATGCATGCATCAGCAATCCTTGCCACAAGGGGGCACTGTGTGACACCAACCCCCTAAATGGGCAATATATTTGCACCTGCCCACAAGGCTACAAAGGGGCTGACTGCACAGAAGATGTGGATGAATGTGCCATGG
SEQ ID NO:702NOTCH2的外显子8-34
CCAATAGCAATCCTTGTGAGCATGCAGGAAAATGTGTGAACACGGATGGCGCCTTCCACTGTGAGTGTCTGAAGGGTTATGCAGGACCTCGTTGTGAGATGGACATCAATGAGTGCCATTCAGACCCCTGCCAGAATGATGCTACCTGTCTGGATAAGATTGGAGGCTTCACATGTCTGTGCATGCCAGGTTTCAAAGGTGTGCATTGTGAATTAGAAATAAATGAATGTCAGAGCAACCCTTGTGTGAACAATGGGCAGTGTGTGGATAAAGTCAATCGTTTCCAGTGCCTGTGTCCTCCTGGTTTCACTGGGCCAGTTTGCCAGATTGATATTGATGACTGTTCCAGTACTCCGTGTCTGAATGGGGCAAAGTGTATCGATCACCCGAATGGCTATGAATGCCAGTGTGCCACAGGTTTCACTGGTGTGTTGTGTGAGGAGAACATTGACAACTGTGACCCCGATCCTTGCCACCATGGTCAGTGTCAGGATGGTATTGATTCCTACACCTGCATCTGCAATCCCGGGTACATGGGCGCCATCTGCAGTGACCAGATTGATGAATGTTACAGCAGCCCTTGCCTGAACGATGGTCGCTGCATTGACCTGGTCAATGGCTACCAGTGCAACTGCCAGCCAGGCACGTCAGGGGTTAATTGTGAAATTAATTTTGATGACTGTGCAAGTAACCCTTGTATCCATGGAATCTGTATGGATGGCATTAATCGCTACAGTTGTGTCTGCTCACCAGGATTCACAGGGCAGAGATGTAACATTGACATTGATGAGTGTGCCTCCAATCCCTGTCGCAAGGGTGCAACATGTATCAACGGTGTGAATGGTTTCCGCTGTATATGCCCCGAGGGACCCCATCACCCCAGCTGCTACTCACAGGTGAACGAATGCCTGAGCAATCCCTGCATCCATGGAAACTGTACTGGAGGTCTCAGTGGATATAAGTGTCTCTGTGATGCAGGCTGGGTTGGCATCAACTGTGAAGTGGACAAAAATGAATGCCTTTCGAATCCATGCCAGAATGGAGGAACTTGTGACAATCTGGTGAATGGATACAGGTGTACTTGCAAGAAGGGCTTTAAAGGCTATAACTGCCAGGTGAATATTGATGAATGTGCCTCAAATCCATGCCTGAACCAAGGAACCTGCTTTGATGACATAAGTGGCTACACTTGCCACTGTGTGCTGCCATACACAGGCAAGAATTGTCAGACAGTATTGGCTCCCTGTTCCCCAAACCCTTGTGAGAATGCTGCTGTTTGCAAAGAGTCACCAAATTTTGAGAGTTATACTTGCTTGTGTGCTCCTGGCTGGCAAGGTCAGCGGTGTACCATTGACATTGACGAGTGTATCTCCAAGCCCTGCATGAACCATGGTCTCTGCCATAACACCCAGGGCAGCTACATGTGTGAATGTCCACCAGGCTTCAGTGGTATGGACTGTGAGGAGGACATTGATGACTGCCTTGCCAATCCTTGCCAGAATGGAGGTTCCTGTATGGATGGAGTGAATACTTTCTCCTGCCTCTGCCTTCCGGGTTTCACTGGGGATAAGTGCCAGACAGACATGAATGAGTGTCTGAGTGAACCCTGTAAGAATGGAGGGACCTGCTCTGACTACGTCAACAGTTACACTTGCAAGTGCCAGGCAGGATTTGATGGAGTCCATTGTGAGAACAACATCAATGAGTGCACTGAGAGCTCCTGTTTCAATGGTGGCACATGTGTTGATGGGATTAACTCCTTCTCTTGCTTGTGCCCTGTGGGTTTCACTGGATCCTTCTGCCTCCATGAGATCAATGAATGCAGCTCTCATCCATGCCTGAATGAGGGAACGTGTGTTGATGGCCTGGGTACCTACCGCTGCAGCTGCCCCCTGGGCTACACTGGGAAAAACTGTCAGACCCTGGTGAATCTCTGCAGTCGGTCTCCATGTAAAAACAAAGGTACTTGCGTTCAGAAAAAAGCAGAGTCCCAGTGCCTATGTCCATCTGGATGGGCTGGTGCCTATTGTGACGTGCCCAATGTCTCTTGTGACATAGCAG
CCTCCAGGAGAGGTGTGCTTGTTGAACACTTGTGCCAGCACTCAGGTGTCTGCATCAAT
GCTGGCAACACGCATTACTGTCAGTGCCCCCTGGGCTATACTGGGAGCTACTGTGAGGA
GCAACTCGATGAGTGTGCGTCCAACCCCTGCCAGCACGGGGCAACATGCAGTGACTTC
ATTGGTGGATACAGATGCGAGTGTGTCCCAGGCTATCAGGGTGTCAACTGTGAGTATGA
AGTGGATGAGTGCCAGAATCAGCCCTGCCAGAATGGAGGCACCTGTATTGACCTTGTG
AACCATTTCAAGTGCTCTTGCCCACCAGGCACTCGGGGCCTACTCTGTGAAGAGAACA
TTGATGACTGTGCCCGGGGTCCCCATTGCCTTAATGGTGGTCAGTGCATGGATAGGATT
GGAGGCTACAGTTGTCGCTGCTTGCCTGGCTTTGCTGGGGAGCGTTGTGAGGGAGACA
TCAACGAGTGCCTCTCCAACCCCTGCAGCTCTGAGGGCAGCCTGGACTGTATACAGCT
CACCAATGACTACCTGTGTGTTTGCCGTAGTGCCTTTACTGGCCGGCACTGTGAAACCT
TCGTCGATGTGTGTCCCCAGATGCCCTGCCTGAATGGAGGGACTTGTGCTGTGGCCAGT
AACATGCCTGATGGTTTCATTTGCCGTTGTCCCCCGGGATTTTCCGGGGCAAGGTGCCA
GAGCAGCTGTGGACAAGTGAAATGTAGGAAGGGGGAGCAGTGTGTGCACACCGCCTC
TGGACCCCGCTGCTTCTGCCCCAGTCCCCGGGACTGCGAGTCAGGCTGTGCCAGTAGC
CCCTGCCAGCACGGGGGCAGCTGCCACCCTCAGCGCCAGCCTCCTTATTACTCCTGCCA
GTGTGCCCCACCATTCTCGGGTAGCCGCTGTGAACTCTACACGGCACCCCCCAGCACC
CCTCCTGCCACCTGTCTGAGCCAGTATTGTGCCGACAAAGCTCGGGATGGCGTCTGTGA
TGAGGCCTGCAACAGCCATGCCTGCCAGTGGGATGGGGGTGACTGTTCTCTCACCATG
GAGAACCCCTGGGCCAACTGCTCCTCCCCACTTCCCTGCTGGGATTATATCAACAACCA
GTGTGATGAGCTGTGCAACACGGTCGAGTGCCTGTTTGACAACTTTGAATGCCAGGGG
AACAGCAAGACATGCAAGTATGACAAATACTGTGCAGACCACTTCAAAGACAACCACT
GTGACCAGGGGTGCAACAGTGAGGAGTGTGGTTGGGATGGGCTGGACTGTGCTGCTG
ACCAACCTGAGAACCTGGCAGAAGGTACCCTGGTTATTGTGGTATTGATGCCACCTGAA
CAACTGCTCCAGGATGCTCGCAGCTTCTTGCGGGCACTGGGTACCCTGCTCCACACCA
ACCTGCGCATTAAGCGGGACTCCCAGGGGGAACTCATGGTGTACCCCTATTATGGTGAG
AAGTCAGCTGCTATGAAGAAACAGAGGATGACACGCAGATCCCTTCCTGGTGAACAAG
AACAGGAGGTGGCTGGCTCTAAAGTCTTTCTGGAAATTGACAACCGCCAGTGTGTTCA
AGACTCAGACCACTGCTTCAAGAACACGGATGCAGCAGCAGCTCTCCTGGCCTCTCAC
GCCATACAGGGGACCCTGTCATACCCTCTTGTGTCTGTCGTCAGTGAATCCCTGACTCC
AGAACGCACTCAGCTCCTCTATCTCCTTGCTGTTGCTGTTGTCATCATTCTGTTTATTATT
CTGCTGGGGGTAATCATGGCAAAACGAAAGCGTAAGCATGGCTCTCTCTGGCTGCCTG
AAGGTTTCACTCTTCGCCGAGATGCAAGCAATCACAAGCGTCGTGAGCCAGTGGGACA
GGATGCTGTGGGGCTGAAAAATCTCTCAGTGCAAGTCTCAGAAGCTAACCTAATTGGTA
CTGGAACAAGTGAACACTGGGTCGATGATGAAGGGCCCCAGCCAAAGAAAGTAAAGG
CTGAAGATGAGGCCTTACTCTCAGAAGAAGATGACCCCATTGATCGACGGCCATGGAC
ACAGCAGCACCTTGAAGCTGCAGACATCCGTAGGACACCATCGCTGGCTCTCACCCCT
CCTCAGGCAGAGCAGGAGGTGGATGTGTTAGATGTGAATGTCCGTGGCCCAGATGGCT
GCACCCCATTGATGTTGGCTTCTCTCCGAGGAGGCAGCTCAGATTTGAGTGATGAAGAT
GAAGATGCAGAGGACTCTTCTGCTAACATCATCACAGACTTGGTCTACCAGGGTGCCA
GCCTCCAGGCCCAGACAGACCGGACTGGTGAGATGGCCCTGCACCTTGCAGCCCGCTA
CTCACGGGCTGATGCTGCCAAGCGTCTCCTGGATGCAGGTGCAGATGCCAATGCCCAG
GACAACATGGGCCGCTGTCCACTCCATGCTGCAGTGGCAGCTGATGCCCAAGGTGTCT
TCCAGATTCTGATTCGCAACCGAGTAACTGATCTAGATGCCAGGATGAATGATGGTACT
ACACCCCTGATCCTGGCTGCCCGCCTGGCTGTGGAGGGAATGGTGGCAGAACTGATCA
ACTGCCAAGCGGATGTGAATGCAGTGGATGACCATGGAAAATCTGCTCTTCACTGGGC
AGCTGCTGTCAATAATGTGGAGGCAACTCTTTTGTTGTTGAAAAATGGGGCCAACCGA
GACATGCAGGACAACAAGGAAGAGACACCTCTGTTTCTTGCTGCCCGGGAGGGGAGC
TATGAAGCAGCCAAGATCCTGTTAGACCATTTTGCCAATCGAGACATCACAGACCATAT
GGATCGTCTTCCCCGGGATGTGGCTCGGGATCGCATGCACCATGACATTGTGCGCCTTC
TGGATGAATACAATGTGACCCCAAGCCCTCCAGGCACCGTGTTGACTTCTGCTCTCTCA
CCTGTCATCTGTGGGCCCAACAGATCTTTCCTCAGCCTGAAGCACACCCCAATGGGCAA
GAAGTCTAGACGGCCCAGTGCCAAGAGTACCATGCCTACTAGCCTCCCTAACCTTGCCA
AGGAGGCAAAGGATGCCAAGGGTAGTAGGAGGAAGAAGTCTCTGAGTGAGAAGGTCC
AACTGTCTGAGAGTTCAGTAACTTTATCCCCTGTTGATTCCCTAGAATCTCCTCACACGT
ATGTTTCCGACACCACATCCTCTCCAATGATTACATCCCCTGGGATCTTACAGGCCTCAC
CCAACCCTATGTTGGCCACTGCCGCCCCTCCTGCCCCAGTCCATGCCCAGCATGCACTA
TCTTTTTCTAACCTTCATGAAATGCAGCCTTTGGCACATGGGGCCAGCACTGTGCTTCC
CTCAGTGAGCCAGTTGCTATCCCACCACCACATTGTGTCTCCAGGCAGTGGCAGTGCTG
GAAGCTTGAGTAGGCTCCATCCAGTCCCAGTCCCAGCAGATTGGATGAACCGCATGGA
GGTGAATGAGACCCAGTACAATGAGATGTTTGGTATGGTCCTGGCTCCAGCTGAGGGC
ACCCATCCTGGCATAGCTCCCCAGAGCAGGCCACCTGAAGGGAAGCACATAACCACCC
CTCGGGAGCCCTTGCCCCCCATTGTGACTTTCCAGCTCATCCCTAAAGGCAGTATTGCC
CAACCAGCGGGGGCTCCCCAGCCTCAGTCCACCTGCCCTCCAGCTGTTGCGGGCCCCC
TGCCCACCATGTACCAGATTCCAGAAATGGCCCGTTTGCCCAGTGTGGCTTTCCCCACT
GCCATGATGCCCCAGCAGGACGGGCAGGTAGCTCAGACCATTCTCCCAGCCTATCATCC
TTTCCCAGCCTCTGTGGGCAAGTACCCCACACCCCCTTCACAGCACAGTTATGCTTCCT
CAAATGCTGCTGAGCGAACACCCAGTCACAGTGGTCACCTCCAGGGTGAGCATCCCTA
CCTGACACCATCCCCAGAGTCTCCTGACCAGTGGTCAAGTTCATCACCCCACTCTGCTT
CTGACTGGTCAGATGTGACCACCAGCCCTACCCCTGGGGGTGCTGGAGGAGGTCAGCG
GGGACCTGGGACACACATGTCTGAGCCACCACACAACAACATGCAGGTTTATGCGTGA
GAGAGTCCACCTCCAGTGTAGAGACATAACTGACTTTTGTAAATGCTGCTGAGGAACA
AATGAAGGTCATCCGGGAGAGAAATGAAGAAATCTCTGGAGCCAGCTTCTAGAGGTAG
GAAAGAGAAGATGTTCTTATTCAGATAATGCAAGAGAAGCAATTCGTCAGTTTCACTGG
GTATCTGCAAGGCTTATTGATTATTCTAATCTAATAAGACAAGTTTGTGGAAATGCAAGA
TGAATACAAGCCTTGGGTCCATGTTTACTCTCTTCTATTTGGAGAATAAGATGGATGCTT
ATTGAAGCCCAGACATTCTTGCAGCTTGGACTGCATTTTAAGCCCTGCAGGCTTCTGCC
ATATCCATGAGAAGATTCTACACTAGCGTCCTGTTGGGAATTATGCCCTGGAATTCTGCC
TGAATTGACCTACGCATCTCCTCCTCCTTGGACATTCTTTTGTCTTCATTTGGTGCTTTTG
GTTTTGCACCTCTCCGTGATTGTAGCCCTACCAGCATGTTATAGGGCAAGACCTTTGTGC
TTTTGATCATTCTGGCCCATGAAAGCAACTTTGGTCTCCTTTCCCCTCCTGTCTTCCCGG
TATCCCTTGGAGTCTCACAAGGTTTACTTTGGTATGGTTCTCAGCACAAACCTTTCAAGT
ATGTTGTTTCTTTGGAAAATGGACATACTGTATTGTGTTCTCCTGCATATATCATTCCTGG
AGAGAGAAGGGGAGAAGAATACTTTTCTTCAACAAATTTTGGGGGCAGGAGATCCCTT
CAAGAGGCTGCACCTTAATTTTTCTTGTCTGTGTGCAGGTCTTCATATAAACTTTACCAG
GAAGAAGGGTGTGAGTTTGTTGTTTTTCTGTGTATGGGCCTGGTCAGTGTAAAGTTTTA
TCCTTGATAGTCTAGTTACTATGACCCTCCCCACTTTTTTAAAACCAGAAAAAGGTTTGG
AATGTTGGAATGACCAAGAGACAAGTTAACTCGTGCAAGAGCCAGTTACCCACCCACA
GGTCCCCCTACTTCCTGCCAAGCATTCCATTGACTGCCTGTATGGAACACATTTGTCCCA
GATCTGAGCATTCTAGGCCTGTTTCACTCACTCACCCAGCATATGAAACTAGTCTTAACT
GTTGAGCCTTTCCTTTCATATCCACAGAAGACACTGTCTCAAATGTTGTACCCTTGCCAT
TTAGGACTGAACTTTCCTTAGCCCAAGGGACCCAGTGACAGTTGTCTTCCGTTTGTCAG
ATGATCAGTCTCTACTGATTATCTTGCTGCTTAAAGGCCTGCTCACCAATCTTTCTTTCAC
ACCGTGTGGTCCGTGTTACTGGTATACCCAGTATGTTCTCACTGAAGACATGGACTTTAT
ATGTTCAAGTGCAGGAATTGGAAAGTTGGACTTGTTTTCTATGATCCAAAACAGCCCTA
TAAGAAGGTTGGAAAAGGAGGAACTATATAGCAGCCTTTGCTATTTTCTGCTACCATTTC
TTTTCCTCTGAAGCGGCCATGACATTCCCTTTGGCAACTAACGTAGAAACTCAACAGAA
CATTTTCCTTTCCTAGAGTCACCTTTTAGATGATAATGGACAACTATAGACTTGCTCATTG
TTCAGACTGATTGCCCCTCACCTGAATCCACTCTCTGTATTCATGCTCTTGGCAATTTCT
TTGACTTTCTTTTAAGGGCAGAAGCATTTTAGTTAATTGTAGATAAAGAATAGTTTTCTT
CCTCTTCTCCTTGGGCCAGTTAATAATTGGTCCATGGCTACACTGCAACTTCCGTCCAGT
GCTGTGATGCCCATGACACCTGCAAAATAAGTTCTGCCTGGGCATTTTGTAGATATTAAC
AGGTGAATTCCCGACTCTTTTGGTTTGAATGACAGTTCTCATTCCTTCTATGGCTGCAAG
TATGCATCAGTGCTTCCCACTTACCTGATTTGTCTGTCGGTGGCCCCATATGGAAACCCT
GCGTGTCTGTTGGCATAATAGTTTACAAATGGTTTTTTCAGTCCTATCCAAATTTATTGAACCAACAAAAATAATTACTTCTGCCCTGAGATAAGCAGATTAAGTTTGTTCATTCTCTGCTTTATTCTCTCCATGTGGCAACATTCTGTCAGCCTCTTTCATAGTGTGCAAACATTTTATCATTCTAAATGGTGACTCTCTGCCCTTGGACCCATTTATTATTCACAGATGGGGAGAACCTATCTGCATGGACCTCTGTGGACCACAGCGTACCTGCCCCTTTCTGCCCTCCTGCTCCAGCCCCACTTCTGAAAGTATCAGCTACTGATCCAGCCACTGGATATTTTATATCCTCCCTTTTCCTTAAGCACAATGTCAGACCAAATTGCTTGTTTCTTTTTCTTGGACTACTTTAATTTGGATCCTTTGGGTTTGGAGAAAGGGAATGTGAAAGCTGTCATTACAGACAACAGGTTTCAGTGATGAGGAGGACAACACTGCCTTTCAAACTTTTTACTGATCTCTTAGATTTTAAGAACTCTTGAATTGTGTGGTATCTAATAAAAGGGAAGGTAAGATGGATAATCACTTTCTCATTTGGGTTCTGAATTGGAGACTCAGTTTTTATGAGACACATCTTTTATGCCATGTATAGATCCTCCCCTGCTATTTTTGGTTTATTTTTATTGTTATAAATGCTTTCTTTCTTTGACTCCTCTTCTGCCTGCCTTTGGGGATAGGTTTTTTTGTTTGTTTATTTGCTTCCTCTGTTTTGTTTTAAGCATCATTTTCTTATGTGAGGTGGGGAAGGGAAAGGTATGAGGGAAAGAGAGTCTGAGAATTAAAATATTTTAGTATAAGCAATTGGCTGTGATGCTCAAATCCATTGCATCCTCTTATTGAATTTGCCAATTTGTAATTTTTGCATAATAAAGAACCAAAGGTGTAATGTTTTGTTGAGAGGTGGTTTAGGGATTTTGGCCCTAACCAATACATTGAATGTATGATGACTATTTGGGAGGACACATTTATGTACCCAGAGGCCCCCACTAATAAGTGGTACTATGGTTACTTCCTTGTGTACATTTCTCTTAAAAGTGATATTATATCTGTTTGTATGAGAAACCCAGTAACCAATAAAATGACCGCATATTCCTGACTAAACGTAGTAAGGAAAATGCACACTTTGTTTTTACTTTTCCGTTTCATTCTAAAGGTAGTTAAGATGAAATTTATATGAAAGCATTTTTATCACAAAATAAAAAAGGTTTGCCAAGCTCAGTGGTGTTGTATTTTTTATTTTCCAATACTGCATCCATGGCCTGGCAGTGTTACCTCATGATGTCATAATTTGCTGAGAGAGCAAATTTTCTTTTCTTTCTGAATCCCACAAAGCCTAGCACCAAACTTCTTTTTTTCTTCCTTTAATTAGATCATAAATAAATGATCCTGGGGAAAAAGCATCTGTCAAATAGGAAACATCACAAAACTGAGCACTCTTCTGTGCACTAGCCATAGCTGGTGACAAACAGATGGTTGCTCAGGGACAAGGTGCCTTCCAATGGAAATGCGAAGTAGTTGCTATAGCAAGAATTGGGAACTGGGATATAAGTCATAATATTAATTATGCTGTTATGTAAATGATTGGTTTGTAACATTCCTTAAGTGAAATTTGTGTAGAACTTAATATACAGGATTATAAAATAATATTTTGTGTATAAATTTGTTATAAGTTCACATTCATACATTTATTTATAAAGTCAGTGAGATATTTGAACATGAA
SEQ ID NO:703NOTCH2的全mRNA多核苷酸序列
AGGCTGCTTCGTTGCACACCCGAGAAAGTTTCAGCCAAACTTCGGGCGGCGGCTGAGGCGGCGGCCGAGGAGCGGCGGACTCGGGGCGCGGGGAGTCGAGGCATTTGCGCCTGGGCTTCGGAGCGTAGCGCCAGGGCCTGAGCCTTTGAAGCAGGAGGAGGGGAGGAGAGAGTGGGGCTCCTCTATCGGGACCCCCTCCCCATGTGGATCTGCCCAGGCGGCGGCGGCGGCGGCGGAGGAGGAGGCGACCGAGAAGATGCCCGCCCTGCGCCCCGCTCTGCTGTGGGCGCTGCTGGCGCTCTGGCTGTGCTGCGCGGCCCCCGCGCATGCATTGCAGTGTCGAGATGGCTATGAACCCTGTGTAAATGAAGGAATGTGTGTTACCTACCACAATGGCACAGGATACTGCAAATGTCCAGAAGGCTTCTTGGGGGAATATTGTCAACATCGAGACCCCTGTGAGAAGAACCGCTGCCAGAATGGTGGGACTTGTGTGGCCCAGGCCATGCTGGGGAAAGCCACGTGCCGATGTGCCTCAGGGTTTACAGGAGAGGACTGCCAGTACTCAACATCTCATCCATGCTTTGTGTCTCGACCCTGCCTGAATGGCGGCACATGCCATATGCTCAGCCGGGATACCTATGAGTGCACCTGTCAAGTCGGGTTTACAGGTAAGGAGTGCCAATGGACGGATGCCTGCCTGTCTCATCCCTGTGCAAATGGAAGTACCTGTACCACTGTGGCCAACCAGTTCTCCTGCAAATGCCTCACAGGCTTCACAGGGCAGAAATGTGAGACTGATGTCAATGAGTGTGACATTCCAGGACACTGCCAGCATGGTGGCACCTGCCTCAACCTGCCTGGTTCCTACCAGTGCCAGTGCCCTCAGGGCTTCACAGGCCAGTACTGTGACAGCCTGTATGTGCCCTGTGCACCCTCACCTTGTGTCAATGGAGGCACCTGTCGGCAGACTGGTGACTTCACTTTTGAGTGCAACTGCCTTCCAGGTTTTGAAGGGAGCACCTGTGAGAGGAATATTGATGACTGCCCTAACCACAGGTGTCAGAATGGAGGGGTTTGTGTGGATGGGGTCAACACTTACAACTGCCGCTGTCCCCCACAATGGACAGGACAGTTCTGCACAGAGGATGTGGATGAATGCCTGCTGCAGCCCAATGCCTGTCAAAATGGGGGCACCTGTGCCAACCGCAATGGAGGCTATGGCTGTGTATGTGTCAACGGCTGGAGTGGAGATGACTGCAGTGAGAACATTGATGATT
GTGCCTTCGCCTCCTGTACTCCAGGCTCCACCTGCATCGACCGTGTGGCCTCCTTCTCTT
GCATGTGCCCAGAGGGGAAGGCAGGTCTCCTGTGTCATCTGGATGATGCATGCATCAGC
AATCCTTGCCACAAGGGGGCACTGTGTGACACCAACCCCCTAAATGGGCAATATATTTG
CACCTGCCCACAAGGCTACAAAGGGGCTGACTGCACAGAAGATGTGGATGAATGTGCC
ATGGCCAATAGCAATCCTTGTGAGCATGCAGGAAAATGTGTGAACACGGATGGCGCCTT
CCACTGTGAGTGTCTGAAGGGTTATGCAGGACCTCGTTGTGAGATGGACATCAATGAGT
GCCATTCAGACCCCTGCCAGAATGATGCTACCTGTCTGGATAAGATTGGAGGCTTCACA
TGTCTGTGCATGCCAGGTTTCAAAGGTGTGCATTGTGAATTAGAAATAAATGAATGTCA
GAGCAACCCTTGTGTGAACAATGGGCAGTGTGTGGATAAAGTCAATCGTTTCCAGTGC
CTGTGTCCTCCTGGTTTCACTGGGCCAGTTTGCCAGATTGATATTGATGACTGTTCCAGT
ACTCCGTGTCTGAATGGGGCAAAGTGTATCGATCACCCGAATGGCTATGAATGCCAGTG
TGCCACAGGTTTCACTGGTGTGTTGTGTGAGGAGAACATTGACAACTGTGACCCCGAT
CCTTGCCACCATGGTCAGTGTCAGGATGGTATTGATTCCTACACCTGCATCTGCAATCCC
GGGTACATGGGCGCCATCTGCAGTGACCAGATTGATGAATGTTACAGCAGCCCTTGCCT
GAACGATGGTCGCTGCATTGACCTGGTCAATGGCTACCAGTGCAACTGCCAGCCAGGC
ACGTCAGGGGTTAATTGTGAAATTAATTTTGATGACTGTGCAAGTAACCCTTGTATCCAT
GGAATCTGTATGGATGGCATTAATCGCTACAGTTGTGTCTGCTCACCAGGATTCACAGG
GCAGAGATGTAACATTGACATTGATGAGTGTGCCTCCAATCCCTGTCGCAAGGGTGCAA
CATGTATCAACGGTGTGAATGGTTTCCGCTGTATATGCCCCGAGGGACCCCATCACCCC
AGCTGCTACTCACAGGTGAACGAATGCCTGAGCAATCCCTGCATCCATGGAAACTGTAC
TGGAGGTCTCAGTGGATATAAGTGTCTCTGTGATGCAGGCTGGGTTGGCATCAACTGTG
AAGTGGACAAAAATGAATGCCTTTCGAATCCATGCCAGAATGGAGGAACTTGTGACAA
TCTGGTGAATGGATACAGGTGTACTTGCAAGAAGGGCTTTAAAGGCTATAACTGCCAGG
TGAATATTGATGAATGTGCCTCAAATCCATGCCTGAACCAAGGAACCTGCTTTGATGAC
ATAAGTGGCTACACTTGCCACTGTGTGCTGCCATACACAGGCAAGAATTGTCAGACAGT
ATTGGCTCCCTGTTCCCCAAACCCTTGTGAGAATGCTGCTGTTTGCAAAGAGTCACCAA
ATTTTGAGAGTTATACTTGCTTGTGTGCTCCTGGCTGGCAAGGTCAGCGGTGTACCATT
GACATTGACGAGTGTATCTCCAAGCCCTGCATGAACCATGGTCTCTGCCATAACACCCA
GGGCAGCTACATGTGTGAATGTCCACCAGGCTTCAGTGGTATGGACTGTGAGGAGGAC
ATTGATGACTGCCTTGCCAATCCTTGCCAGAATGGAGGTTCCTGTATGGATGGAGTGAA
TACTTTCTCCTGCCTCTGCCTTCCGGGTTTCACTGGGGATAAGTGCCAGACAGACATGA
ATGAGTGTCTGAGTGAACCCTGTAAGAATGGAGGGACCTGCTCTGACTACGTCAACAG
TTACACTTGCAAGTGCCAGGCAGGATTTGATGGAGTCCATTGTGAGAACAACATCAATG
AGTGCACTGAGAGCTCCTGTTTCAATGGTGGCACATGTGTTGATGGGATTAACTCCTTC
TCTTGCTTGTGCCCTGTGGGTTTCACTGGATCCTTCTGCCTCCATGAGATCAATGAATGC
AGCTCTCATCCATGCCTGAATGAGGGAACGTGTGTTGATGGCCTGGGTACCTACCGCTG
CAGCTGCCCCCTGGGCTACACTGGGAAAAACTGTCAGACCCTGGTGAATCTCTGCAGT
CGGTCTCCATGTAAAAACAAAGGTACTTGCGTTCAGAAAAAAGCAGAGTCCCAGTGCC
TATGTCCATCTGGATGGGCTGGTGCCTATTGTGACGTGCCCAATGTCTCTTGTGACATAG
CAGCCTCCAGGAGAGGTGTGCTTGTTGAACACTTGTGCCAGCACTCAGGTGTCTGCAT
CAATGCTGGCAACACGCATTACTGTCAGTGCCCCCTGGGCTATACTGGGAGCTACTGTG
AGGAGCAACTCGATGAGTGTGCGTCCAACCCCTGCCAGCACGGGGCAACATGCAGTG
ACTTCATTGGTGGATACAGATGCGAGTGTGTCCCAGGCTATCAGGGTGTCAACTGTGAG
TATGAAGTGGATGAGTGCCAGAATCAGCCCTGCCAGAATGGAGGCACCTGTATTGACCT
TGTGAACCATTTCAAGTGCTCTTGCCCACCAGGCACTCGGGGCCTACTCTGTGAAGAG
AACATTGATGACTGTGCCCGGGGTCCCCATTGCCTTAATGGTGGTCAGTGCATGGATAG
GATTGGAGGCTACAGTTGTCGCTGCTTGCCTGGCTTTGCTGGGGAGCGTTGTGAGGGA
GACATCAACGAGTGCCTCTCCAACCCCTGCAGCTCTGAGGGCAGCCTGGACTGTATAC
AGCTCACCAATGACTACCTGTGTGTTTGCCGTAGTGCCTTTACTGGCCGGCACTGTGAA
ACCTTCGTCGATGTGTGTCCCCAGATGCCCTGCCTGAATGGAGGGACTTGTGCTGTGGC
CAGTAACATGCCTGATGGTTTCATTTGCCGTTGTCCCCCGGGATTTTCCGGGGCAAGGT
GCCAGAGCAGCTGTGGACAAGTGAAATGTAGGAAGGGGGAGCAGTGTGTGCACACCG
CCTCTGGACCCCGCTGCTTCTGCCCCAGTCCCCGGGACTGCGAGTCAGGCTGTGCCAG
TAGCCCCTGCCAGCACGGGGGCAGCTGCCACCCTCAGCGCCAGCCTCCTTATTACTCCT
GCCAGTGTGCCCCACCATTCTCGGGTAGCCGCTGTGAACTCTACACGGCACCCCCCAG
CACCCCTCCTGCCACCTGTCTGAGCCAGTATTGTGCCGACAAAGCTCGGGATGGCGTCT
GTGATGAGGCCTGCAACAGCCATGCCTGCCAGTGGGATGGGGGTGACTGTTCTCTCAC
CATGGAGAACCCCTGGGCCAACTGCTCCTCCCCACTTCCCTGCTGGGATTATATCAACA
ACCAGTGTGATGAGCTGTGCAACACGGTCGAGTGCCTGTTTGACAACTTTGAATGCCA
GGGGAACAGCAAGACATGCAAGTATGACAAATACTGTGCAGACCACTTCAAAGACAA
CCACTGTGACCAGGGGTGCAACAGTGAGGAGTGTGGTTGGGATGGGCTGGACTGTGCT
GCTGACCAACCTGAGAACCTGGCAGAAGGTACCCTGGTTATTGTGGTATTGATGCCACC
TGAACAACTGCTCCAGGATGCTCGCAGCTTCTTGCGGGCACTGGGTACCCTGCTCCAC
ACCAACCTGCGCATTAAGCGGGACTCCCAGGGGGAACTCATGGTGTACCCCTATTATGG
TGAGAAGTCAGCTGCTATGAAGAAACAGAGGATGACACGCAGATCCCTTCCTGGTGAA
CAAGAACAGGAGGTGGCTGGCTCTAAAGTCTTTCTGGAAATTGACAACCGCCAGTGTG
TTCAAGACTCAGACCACTGCTTCAAGAACACGGATGCAGCAGCAGCTCTCCTGGCCTC
TCACGCCATACAGGGGACCCTGTCATACCCTCTTGTGTCTGTCGTCAGTGAATCCCTGA
CTCCAGAACGCACTCAGCTCCTCTATCTCCTTGCTGTTGCTGTTGTCATCATTCTGTTTAT
TATTCTGCTGGGGGTAATCATGGCAAAACGAAAGCGTAAGCATGGCTCTCTCTGGCTGC
CTGAAGGTTTCACTCTTCGCCGAGATGCAAGCAATCACAAGCGTCGTGAGCCAGTGGG
ACAGGATGCTGTGGGGCTGAAAAATCTCTCAGTGCAAGTCTCAGAAGCTAACCTAATT
GGTACTGGAACAAGTGAACACTGGGTCGATGATGAAGGGCCCCAGCCAAAGAAAGTA
AAGGCTGAAGATGAGGCCTTACTCTCAGAAGAAGATGACCCCATTGATCGACGGCCAT
GGACACAGCAGCACCTTGAAGCTGCAGACATCCGTAGGACACCATCGCTGGCTCTCAC
CCCTCCTCAGGCAGAGCAGGAGGTGGATGTGTTAGATGTGAATGTCCGTGGCCCAGAT
GGCTGCACCCCATTGATGTTGGCTTCTCTCCGAGGAGGCAGCTCAGATTTGAGTGATGA
AGATGAAGATGCAGAGGACTCTTCTGCTAACATCATCACAGACTTGGTCTACCAGGGTG
CCAGCCTCCAGGCCCAGACAGACCGGACTGGTGAGATGGCCCTGCACCTTGCAGCCCG
CTACTCACGGGCTGATGCTGCCAAGCGTCTCCTGGATGCAGGTGCAGATGCCAATGCCC
AGGACAACATGGGCCGCTGTCCACTCCATGCTGCAGTGGCAGCTGATGCCCAAGGTGT
CTTCCAGATTCTGATTCGCAACCGAGTAACTGATCTAGATGCCAGGATGAATGATGGTA
CTACACCCCTGATCCTGGCTGCCCGCCTGGCTGTGGAGGGAATGGTGGCAGAACTGAT
CAACTGCCAAGCGGATGTGAATGCAGTGGATGACCATGGAAAATCTGCTCTTCACTGG
GCAGCTGCTGTCAATAATGTGGAGGCAACTCTTTTGTTGTTGAAAAATGGGGCCAACC
GAGACATGCAGGACAACAAGGAAGAGACACCTCTGTTTCTTGCTGCCCGGGAGGGGA
GCTATGAAGCAGCCAAGATCCTGTTAGACCATTTTGCCAATCGAGACATCACAGACCAT
ATGGATCGTCTTCCCCGGGATGTGGCTCGGGATCGCATGCACCATGACATTGTGCGCCT
TCTGGATGAATACAATGTGACCCCAAGCCCTCCAGGCACCGTGTTGACTTCTGCTCTCT
CACCTGTCATCTGTGGGCCCAACAGATCTTTCCTCAGCCTGAAGCACACCCCAATGGGC
AAGAAGTCTAGACGGCCCAGTGCCAAGAGTACCATGCCTACTAGCCTCCCTAACCTTGC
CAAGGAGGCAAAGGATGCCAAGGGTAGTAGGAGGAAGAAGTCTCTGAGTGAGAAGGT
CCAACTGTCTGAGAGTTCAGTAACTTTATCCCCTGTTGATTCCCTAGAATCTCCTCACAC
GTATGTTTCCGACACCACATCCTCTCCAATGATTACATCCCCTGGGATCTTACAGGCCTC
ACCCAACCCTATGTTGGCCACTGCCGCCCCTCCTGCCCCAGTCCATGCCCAGCATGCAC
TATCTTTTTCTAACCTTCATGAAATGCAGCCTTTGGCACATGGGGCCAGCACTGTGCTTC
CCTCAGTGAGCCAGTTGCTATCCCACCACCACATTGTGTCTCCAGGCAGTGGCAGTGCT
GGAAGCTTGAGTAGGCTCCATCCAGTCCCAGTCCCAGCAGATTGGATGAACCGCATGG
AGGTGAATGAGACCCAGTACAATGAGATGTTTGGTATGGTCCTGGCTCCAGCTGAGGG
CACCCATCCTGGCATAGCTCCCCAGAGCAGGCCACCTGAAGGGAAGCACATAACCACC
CCTCGGGAGCCCTTGCCCCCCATTGTGACTTTCCAGCTCATCCCTAAAGGCAGTATTGC
CCAACCAGCGGGGGCTCCCCAGCCTCAGTCCACCTGCCCTCCAGCTGTTGCGGGCCCC
CTGCCCACCATGTACCAGATTCCAGAAATGGCCCGTTTGCCCAGTGTGGCTTTCCCCAC
TGCCATGATGCCCCAGCAGGACGGGCAGGTAGCTCAGACCATTCTCCCAGCCTATCATC
CTTTCCCAGCCTCTGTGGGCAAGTACCCCACACCCCCTTCACAGCACAGTTATGCTTCC
TCAAATGCTGCTGAGCGAACACCCAGTCACAGTGGTCACCTCCAGGGTGAGCATCCCT
ACCTGACACCATCCCCAGAGTCTCCTGACCAGTGGTCAAGTTCATCACCCCACTCTGCT
TCTGACTGGTCAGATGTGACCACCAGCCCTACCCCTGGGGGTGCTGGAGGAGGTCAGC
GGGGACCTGGGACACACATGTCTGAGCCACCACACAACAACATGCAGGTTTATGCGTG
AGAGAGTCCACCTCCAGTGTAGAGACATAACTGACTTTTGTAAATGCTGCTGAGGAAC
AAATGAAGGTCATCCGGGAGAGAAATGAAGAAATCTCTGGAGCCAGCTTCTAGAGGTA
GGAAAGAGAAGATGTTCTTATTCAGATAATGCAAGAGAAGCAATTCGTCAGTTTCACTG
GGTATCTGCAAGGCTTATTGATTATTCTAATCTAATAAGACAAGTTTGTGGAAATGCAAG
ATGAATACAAGCCTTGGGTCCATGTTTACTCTCTTCTATTTGGAGAATAAGATGGATGCT
TATTGAAGCCCAGACATTCTTGCAGCTTGGACTGCATTTTAAGCCCTGCAGGCTTCTGC
CATATCCATGAGAAGATTCTACACTAGCGTCCTGTTGGGAATTATGCCCTGGAATTCTGC
CTGAATTGACCTACGCATCTCCTCCTCCTTGGACATTCTTTTGTCTTCATTTGGTGCTTTT
GGTTTTGCACCTCTCCGTGATTGTAGCCCTACCAGCATGTTATAGGGCAAGACCTTTGTG
CTTTTGATCATTCTGGCCCATGAAAGCAACTTTGGTCTCCTTTCCCCTCCTGTCTTCCCG
GTATCCCTTGGAGTCTCACAAGGTTTACTTTGGTATGGTTCTCAGCACAAACCTTTCAA
GTATGTTGTTTCTTTGGAAAATGGACATACTGTATTGTGTTCTCCTGCATATATCATTCCT
GGAGAGAGAAGGGGAGAAGAATACTTTTCTTCAACAAATTTTGGGGGCAGGAGATCCC
TTCAAGAGGCTGCACCTTAATTTTTCTTGTCTGTGTGCAGGTCTTCATATAAACTTTACC
AGGAAGAAGGGTGTGAGTTTGTTGTTTTTCTGTGTATGGGCCTGGTCAGTGTAAAGTTT
TATCCTTGATAGTCTAGTTACTATGACCCTCCCCACTTTTTTAAAACCAGAAAAAGGTTT
GGAATGTTGGAATGACCAAGAGACAAGTTAACTCGTGCAAGAGCCAGTTACCCACCCA
CAGGTCCCCCTACTTCCTGCCAAGCATTCCATTGACTGCCTGTATGGAACACATTTGTCC
CAGATCTGAGCATTCTAGGCCTGTTTCACTCACTCACCCAGCATATGAAACTAGTCTTAA
CTGTTGAGCCTTTCCTTTCATATCCACAGAAGACACTGTCTCAAATGTTGTACCCTTGCC
ATTTAGGACTGAACTTTCCTTAGCCCAAGGGACCCAGTGACAGTTGTCTTCCGTTTGTC
AGATGATCAGTCTCTACTGATTATCTTGCTGCTTAAAGGCCTGCTCACCAATCTTTCTTT
CACACCGTGTGGTCCGTGTTACTGGTATACCCAGTATGTTCTCACTGAAGACATGGACT
TTATATGTTCAAGTGCAGGAATTGGAAAGTTGGACTTGTTTTCTATGATCCAAAACAGC
CCTATAAGAAGGTTGGAAAAGGAGGAACTATATAGCAGCCTTTGCTATTTTCTGCTACC
ATTTCTTTTCCTCTGAAGCGGCCATGACATTCCCTTTGGCAACTAACGTAGAAACTCAA
CAGAACATTTTCCTTTCCTAGAGTCACCTTTTAGATGATAATGGACAACTATAGACTTGC
TCATTGTTCAGACTGATTGCCCCTCACCTGAATCCACTCTCTGTATTCATGCTCTTGGCA
ATTTCTTTGACTTTCTTTTAAGGGCAGAAGCATTTTAGTTAATTGTAGATAAAGAATAGT
TTTCTTCCTCTTCTCCTTGGGCCAGTTAATAATTGGTCCATGGCTACACTGCAACTTCCG
TCCAGTGCTGTGATGCCCATGACACCTGCAAAATAAGTTCTGCCTGGGCATTTTGTAGA
TATTAACAGGTGAATTCCCGACTCTTTTGGTTTGAATGACAGTTCTCATTCCTTCTATGG
CTGCAAGTATGCATCAGTGCTTCCCACTTACCTGATTTGTCTGTCGGTGGCCCCATATGG
AAACCCTGCGTGTCTGTTGGCATAATAGTTTACAAATGGTTTTTTCAGTCCTATCCAAAT
TTATTGAACCAACAAAAATAATTACTTCTGCCCTGAGATAAGCAGATTAAGTTTGTTCAT
TCTCTGCTTTATTCTCTCCATGTGGCAACATTCTGTCAGCCTCTTTCATAGTGTGCAAAC
ATTTTATCATTCTAAATGGTGACTCTCTGCCCTTGGACCCATTTATTATTCACAGATGGGG
AGAACCTATCTGCATGGACCTCTGTGGACCACAGCGTACCTGCCCCTTTCTGCCCTCCT
GCTCCAGCCCCACTTCTGAAAGTATCAGCTACTGATCCAGCCACTGGATATTTTATATCC
TCCCTTTTCCTTAAGCACAATGTCAGACCAAATTGCTTGTTTCTTTTTCTTGGACTACTT
TAATTTGGATCCTTTGGGTTTGGAGAAAGGGAATGTGAAAGCTGTCATTACAGACAACA
GGTTTCAGTGATGAGGAGGACAACACTGCCTTTCAAACTTTTTACTGATCTCTTAGATTT
TAAGAACTCTTGAATTGTGTGGTATCTAATAAAAGGGAAGGTAAGATGGATAATCACTT
TCTCATTTGGGTTCTGAATTGGAGACTCAGTTTTTATGAGACACATCTTTTATGCCATGT
ATAGATCCTCCCCTGCTATTTTTGGTTTATTTTTATTGTTATAAATGCTTTCTTTCTTTGAC
TCCTCTTCTGCCTGCCTTTGGGGATAGGTTTTTTTGTTTGTTTATTTGCTTCCTCTGTTTT
GTTTTAAGCATCATTTTCTTATGTGAGGTGGGGAAGGGAAAGGTATGAGGGAAAGAGAGTCTGAGAATTAAAATATTTTAGTATAAGCAATTGGCTGTGATGCTCAAATCCATTGCATCCTCTTATTGAATTTGCCAATTTGTAATTTTTGCATAATAAAGAACCAAAGGTGTAATGTTTTGTTGAGAGGTGGTTTAGGGATTTTGGCCCTAACCAATACATTGAATGTATGATGACTATTTGGGAGGACACATTTATGTACCCAGAGGCCCCCACTAATAAGTGGTACTATGGTTACTTCCTTGTGTACATTTCTCTTAAAAGTGATATTATATCTGTTTGTATGAGAAACCCAGTAACCAATAAAATGACCGCATATTCCTGACTAAACGTAGTAAGGAAAATGCACACTTTGTTTTTACTTTTCCGTTTCATTCTAAAGGTAGTTAAGATGAAATTTATATGAAAGCATTTTTATCACAAAATAAAAAAGGTTTGCCAAGCTCAGTGGTGTTGTATTTTTTATTTTCCAATACTGCATCCATGGCCTGGCAGTGTTACCTCATGATGTCATAATTTGCTGAGAGAGCAAATTTTCTTTTCTTTCTGAATCCCACAAAGCCTAGCACCAAACTTCTTTTTTTCTTCCTTTAATTAGATCATAAATAAATGATCCTGGGGAAAAAGCATCTGTCAAATAGGAAACATCACAAAACTGAGCACTCTTCTGTGCACTAGCCATAGCTGGTGACAAACAGATGGTTGCTCAGGGACAAGGTGCCTTCCAATGGAAATGCGAAGTAGTTGCTATAGCAAGAATTGGGAACTGGGATATAAGTCATAATATTAATTATGCTGTTATGTAAATGATTGGTTTGTAACATTCCTTAAGTGAAATTTGTGTAGAACTTAATATACAGGATTATAAAATAATATTTTGTGTATAAATTTGTTATAAGTTCACATTCATACATTTATTTATAAAGTCAGTGAGATATTTGAACATGAA
SEQ ID NO:704NOTCH2的外显子1的翻译多肽序列
MPALRPALLWALLALWLCCAAPAH
SEQ ID NO:705NOTCH2的外显子2的翻译多肽序列
LQCRDGYEPCVNEGMCVTYHNGTGYC
SEQ ID NO:706NOTCH2的外显子3的翻译多肽序列
CPEGFLGEYCQHRDPCEKNRCQNGGTCVAQAMLGKATCRCASGFTGEDCQYSTSHPCFVSRPCLNGGTCHMLSRDTYECTCQVGFT
SEQ ID NO:707NOTCH2的外显子4的翻译多肽序列
KECQWTDACLSHPCANGSTCTTVANQFSCKCLTGFTGQKCETDVNECDIPGHCQHGGTCLNLPGSYQCQCPQGFTGQYCDSLYVPCAPSPCVNGGTCRQTGDFTFECNCLP
SEQ ID NO:708NOTCH2的外显子5的翻译多肽序列
FEGSTCERNIDDCPNHRCQNGGVCVDGVNTYNCRCPPQWT
SEQ ID NO:709NOTCH2的外显子6的翻译多肽序列
QFCTEDVDECLLQPNACQNGGTCANRNGGYGCVCVNGWSGDDCSENIDDCAFASCTPGSTCIDRVASFSCMCPEGKA
SEQ ID NO:710NOTCH2的外显子7的翻译多肽序列
LLCHLDDACISNPCHKGALCDTNPLNGQYICTCPQGYKGADCTEDVDECAM
SEQ ID NO:711NOTCH2的外显子8-34的翻译多肽序列
NSNPCEHAGKCVNTDGAFHCECLKGYAGPRCEMDINECHSDPCQNDATCLDKIGGFTCLCMPGFKGVHCELEINECQSNPCVNNGQCVDKVNRFQCLCPPGFTGPVCQIDIDDCSSTPCLNGAKCIDHPNGYECQCATGFTGVLCEENIDNCDPDPCHHGQCQDGIDSYTCICNPGYMGAICSDQIDECYSSPCLNDGRCIDLVNGYQCNCQPGTSGVNCEINFDDCASNPCIHGICMDGINRYSCVCSPGFTGQRCNIDIDECASNPCRKGATCINGVNGFRCICPEGPHHPSCYSQVNECLSNPCIHGNCTGGLSGYKCLCDAGWVGINCEVDKNECLSNPCQNGGTCDNLVNGYRCTCKKGFKGYNCQVNIDECASNPCLNQGTCFDDISGYTCHCVLPYTGKNCQTVLAPCSPNPCENAAVCKESPNFESYTCLCAPGWQGQRCTIDIDECISKPCMNHGLCHNTQGSYMCECPPGFSGMDCEEDIDDCLANPCQNGGSCMDGVNTFSCLCLPGFTGDKCQTDMNECLSEPCKNGGTCSDYVNSYTCKCQAGFDGVHCENNINECTESSCFNGGTCVDGINSFSCLCPVGFTGSFCLHEINECSSHPCLNEGTCVDGLGTYRCSCPLGYTGKNCQTLVNLCSRSPCKNKGTCVQKKAESQCLCPSGWAGAYCDVPNVSCDIAASRRGVLVEHLCQHSGVCINAGNTHYCQCPLGYTGSYCEEQLDECASNPCQHGATCSDFIGGYRCECVPGYQGVNCEYEVDECQNQPCQNGGTCIDLVNHFKCSCPPGTRGLLCEENIDDCARGPHCLNGGQCMDRIGGYSCRCLPGFAGERCEGDINECLSNPCSSEGSLDCIQLTNDYLCVCRSAFTGRHCETFVDVCPQMPCLNGGTCAVASNMPDGFICRCPPGFSGARCQSSCGQVKCRKGEQCVHTASGPRCFCPSPRDCESGCASSPCQHGGSCHPQRQPPYYSCQCAPPFSGSRCELYTAPPSTPPATCLSQYCADKARDGVCDEACNSHACQWDGGDCSLTMENPWANCSSPLPCWDYINNQCDELCNTVECLFDNFECQGNSKTCKYDKYCADHFKDNHCDQGCNSEECGWDGLDCAADQPENLAEGTLVIVVLMPPEQLLQDARSFLRALGTLLHTNLRIKRDSQGELMVYPYYGEKSAAMKKQRMTRRSLPGEQEQEVAGSKVFLEIDNRQCVQDSDHCFKNTDAAAALLASHAIQGTLSYPLVSVVSESLTPERTQLLYLLAVAVVIILFIILLGVIMAKRKRKHGSLWLPEGFTLRRDASNHKRREPVGQDAVGLKNLSVQVSEANLIGTGTSEHWVDDEGPQPKKVKAEDEALLSEEDDPIDRRPWTQQHLEAADIRRTPSLALTPPQAEQEVDVLDVNVRGPDGCTPLMLASLRGGSSDLSDEDEDAEDSSANIITDLVYQGASLQAQTDRTGEMALHLAARYSRADAAKRLLDAGADANAQDNMGRCPLHAAVAADAQGVFQILIRNRVTDLDARMNDGTTPLILAARLAVEGMVAELINCQADVNAVDDHGKSALHWAAAVNNVEATLLLLKNGANRDMQDNKEETPLFLAAREGSYEAAKILLDHFANRDITDHMDRLPRDVARDRMHHDIVRLLDEYNVTPSPPGTVLTSALSPVICGPNRSFLSLKHTPMGKKSRRPSAKSTMPTSLPNLAKEAKDAKGSRRKKSLSEKVQLSESSVTLSPVDSLESPHTYVSDTTSSPMITSPGILQASPNPMLATAAPPAPVHAQHALSFSNLHEMQPLAHGASTVLPSVSQLLSHHHIVSPGSGSAGSLSRLHPVPVPADWMNRMEVNETQYNEMFGMVLAPAEGTHPGIAPQSRPPEGKHITTPREPLPPIVTFQLIPKGSIAQPAGAPQPQSTCPPAVAGPLPTMYQIPEMARLPSVAFPTAMMPQQDGQVAQTILPAYHPFPASVGKYPTPPSQHSYASSNAAERTPSHSGHLQGEHPYLTPSPESPDQWSSSSPHSASDWSDVTTSPTPGGAGGGQRGPGTHMSEPPHNNMQVYA
SEQ ID NO:712NOTCH2的全蛋白质序列
MPALRPALLWALLALWLCCAAPAHALQCRDGYEPCVNEGMCVTYHNGTGYCKCPEGFLGEYCQHRDPCEKNRCQNGGTCVAQAMLGKATCRCASGFTGEDCQYSTSHPCFVSRPCLNGGTCHMLSRDTYECTCQVGFTGKECQWTDACLSHPCANGSTCTTVANQFSCKCLTGFTGQKCETDVNECDIPGHCQHGGTCLNLPGSYQCQCPQGFTGQYCDSLYVPCAPSPCVNGGTCRQTGDFTFECNCLPGFEGSTCERNIDDCPNHRCQNGGVCVDGVNTYNCRCPPQWTGQFCTEDVDECLLQPNACQNGGTCANRNGGYGCVCVNGWSGDDCSENIDDCAFASCTPGSTCIDRVASFSCMCPEGKAGLLCHLDDACISNPCHKGALCDTNPLNGQYICTCPQGYKGADCTEDVDECAMANSNPCEHAGKCVNTDGAFHCECLKGYAGPRCEMDINECHSDPCQNDATCLDKIGGFTCLCMPGFKGVHCELEINECQSNPCVNNGQCVDKVNRFQCLCPPGFTGPVCQIDIDDCSSTPCLNGAKCIDHPNGYECQCATGFTGVLCEENIDNCDPDPCHHGQCQDGIDSYTCICNPGYMGAICSDQIDECYSSPCLNDGRCIDLVNGYQCNCQPGTSGVNCEINFDDCASNPCIHGICMDGINRYSCVCSPGFTGQRCNIDIDECASNPCRKGATCINGVNGFRCICPEGPHHPSCYSQVNECLSNPCIHGNCTGGLSGYKCLCDAGWVGINCEVDKNECLSNPCQNGGTCDNLVNGYRCTCKKGFKGYNCQVNIDECASNPCLNQGTCFDDISGYTCHCVLPYTGKNCQTVLAPCSPNPCENAAVCKESPNFESYTCLCAPGWQGQRCTIDIDECISKPCMNHGLCHNTQGSYMCECPPGFSGMDCEEDIDDCLANPCQNGGSCMDGVNTFSCLCLPGFTGDKCQTDMNECLSEPCKNGGTCSDYVNSYTCKCQAGFDGVHCENNINECTESSCFNGGTCVDGINSFSCLCPVGFTGSFCLHEINECSSHPCLNEGTCVDGLGTYRCSCPLGYTGKNCQTLVNLCSRSPCKNKGTCVQKKAESQCLCPSGWAGAYCDVPNVSCDIAASRRGVLVEHLCQHSGVCINAGNTHYCQCPLGYTGSYCEEQLDECASNPCQHGATCSDFIGGYRCECVPGYQGVNCEYEVDECQNQPCQNGGTCIDLVNHFKCSCPPGTRGLLCEENIDDCARGPHCLNGGQCMDRIGGYSCRCLPGFAGERCEGDINECLSNPCSSEGSLDCIQLTNDYLCVCRSAFTGRHCETFVDVCPQMPCLNGGTCAVASNMPDGFICRCPPGFSGARCQSSCGQVKCRKGEQCVHTASGPRCFCPSPRDCESGCASSPCQHGGSCHPQRQPPYYSCQCAPPFSGSRCELYTAPPSTPPATCLSQYCADKARDGVCDEACNSHACQWDGGDCSLTMENPWANCSSPLPCWDYINNQCDELCNTVECLFDNFECQGNSKTCKYDKYCADHFKDNHCDQGCNSEECGWDGLDCAADQPENLAEGTLVIVVLMPPEQLLQDARSFLRALGTLLHTNLRIKRDSQGELMVYPYYGEKSAAMKKQRMTRRSLPGEQEQEVAGSKVFLEIDNRQCVQDSDHCFKNTDAAAALLASHAIQGTLSYPLVSVVSESLTPERTQLLYLLAVAVVIILFIILLGVIMAKRKRKHGSLWLPEGFTLRRDASNHKRREPVGQDAVGLKNLSVQVSEANLIGTGTSEHWVDDEGPQPKKVKAEDEALLSEEDDPIDRRPWTQQHLEAADIRRTPSLALTPPQAEQEVDVLDVNVRGPDGCTPLMLASLRGGSSDLSDEDEDAEDSSANIITDLVYQGASLQAQTDRTGEMALHLAARYSRADAAKRLLDAGADANAQDNMGRCPLHAAVAADAQGVFQILIRNRVTDLDARMNDGTTPLILAARLAVEGMVAELINCQADVNAVDDHGKSALHWAAAVNNVEATLLLLKNGANRDMQDNKEETPLFLAAREGSYEAAKILLDHFANRDITDHMDRLPRDVARDRMHHDIVRLLDEYNVTPSPPGTVLTSALSPVICGPNRSFLSLKHTPMGKKSRRPSAKSTMPTSLPNLAKEAKDAKGSRRKKSLSEKVQLSESSVTLSPVDSLESPHTYVSDTTSSPMITSPGILQASPNPMLATAAPPAPVHAQHALSFSNLHEMQPLAHGASTVLPSVSQLLSHHHIVSPGSGSAGSLSRLHPVPVPADWMNRMEVNETQYNEMFGMVLAPAEGTHPGIAPQSRPPEGKHITTPREPLPPIVTFQLIPKGSIAQPAGAPQPQSTCPPAVAGPLPTMYQIPEMARLPSVAFPTAMMPQQDGQVAQTILPAYHPFPASVGKYPTPPSQHSYASSNAAERTPSHSGHLQGEHPYLTPSPESPDQWSSSSPHSASDWSDVTTSPTPGGAGGGQRGPGTHMSEPPHNNMQVYA
SEQ ID NO:713NOTCH2的全部外显子1-6按顺序排列的多核苷酸序列
SEQ ID NO:714NOTCH2的全部外显子1-6按顺序排列的翻译多肽序列
CD74序列信息
SEQ ID NO:715来自CD74-NRG1融合物5’处的CD74外显子2的序列
AGGGCCGGCTGGACAAACTGACAGTCACCTCCCAGAACCTGCAGCTGGAGAACCTGCGCATGAAGCTTCCCAAGC
SEQ ID NO:716CD74-NRG1融合物3’处的NRG1外显子2序列
CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA
SEQ ID NO:717CD74-NRG1多核苷酸序列
AGGGCCGGCTGGACAAACTGACAGTCACCTCCCAGAACCTGCAGCTGGAGAACCTGCGCATGAAGCTTCCCAAGCCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA
SEQ ID NO:718CD74-NRG1多肽序列
GRLDKLTVTSQNLQLENLRMKLPKPLPPRLKEMKSQESAAGSKLVLRCE
SEQ ID NO:719CD74的外显子1
ATCCTGCCCCGCAAAAGGCAGCTTCACCAAAGTGGGGTATTTCCAGCCTTTGTAGCTTTCACTTCCACATCTACCAAGTGGGCGGAGTGGCCTTCTGTGGACGAATCAGATTCCTCTCCAGCACCGACTTTAAGAGGCGAGCCGGGGGGTCAGGGTCCCAGATGCACAGGAGGAGAAGCAGGAGCTGTCGGGAAGATCAGAAGCCAGTCATGGATGACCAGCGCGACCTTATCTCCAACAATGAGCAACTGCCCATGCTGGGCCGGCGCCCTGGGGCCCCGGAGAG
SEQ ID NO:720CD74的外显子2
CAAGTGCAGCCGCGGAGCCCTGTACACAGGCTTTTCCATCCTGGTGACTCTGCTCCTCGCTGGCCAGGCCACCACCGCCTACTTCCTGTACCAGCAGCAGGGCCGGCTGGACAAACTGACAGTCACCTCCCAGAACCTGCAGCTGGAGAACCTGCGCATGAAGCTTCCCAAGC
SEQ ID NO:721CD74的外显子3
CTCCCAAGCCTGTGAGCAAGATGCGCATGGCCACCCCGCTGCTGATGCAGGCGCTGCCCATGGGAGCCCTGCCCCAGGGG
SEQ ID NO:722CD74的外显子4
CCCATGCAGAATGCCACCAAGTATGGCAACATGACAGAGGACCATGTGATGCACCTGCTCCAG
SEQ ID NO:723CD74的外显子5
AATGCTGACCCCCTGAAGGTGTACCCGCCACTGAAGGGGAGCTTCCCGGAGAACCTGAGACACCTTAAGAACACCATGGAGACCATAGACTGGAAG
SEQ ID NO:724CD74的外显子6
GTCTTTGAGAGCTGGATGCACCATTGGCTCCTGTTTGAAATGAGCAGGCACTCCTTGGAGCAAAAGCCCACTGACGCTCCACCGAAAG
SEQ ID NO:725CD74的外显子7
TACTGACCAAGTGCCAGGAAGAGGTCAGCCACATCCCTGCTGTCCACCCGGGTTCATTCAGGCCCAAGTGCGACGAGAACGGCAACTATCTGCCACTCCAGTGCTATGGGAGCATCGGCTACTGCTGGTGTGTCTTCCCCAACGGCACGGAGGTCCCCAACACCAGAAGCCGCGGGCACCATAACTGCAGTG
SEQ ID NO:726CD74的外显子8
AGTCACTGGAACTGGAGGACCCGTCTTCTGGGCTGGGTGTGACCAAGCAGGATCTGGGCCCAG
SEQ ID NO:727CD74的外显子9
TCCCCATGTGAGAGCAGCAGAGGCGGTCTTCAACATCCTGCCAGCCCCACACAGCTACAGCTTTCTTGCTCCCTTCAGCCCCCAGCCCCTCCCCCATCTCCCACCCTGTACCTCATCCCATGAGACCCTGGTGCCTGGCTCTTTCGTCACCCTTGGACAAGACAAACCAAGTCGGAACAGCAGATAACAATGCAGCAAGGCCCTGCTGCCCAATCTCCATCTGTCAACAGGGGCGTGAGGTCCCAGGAAGTGGCCAAAAGCTAGACAGATCCCCGTTCCTGACATCACAGCAGCCTCCAACACAAGGCTCCAAGACCTAGGCTCATGGACGAGATGGGAAGGCACAGGGAGAAGGGATAACCCTACACCCAGACCCCAGGCTGGACATGCTGACTGTCCTCTCCCCTCCAGCCTTTGGCCTTGGCTTTTCTAGCCTATTTACCTGCAGGCTGAGCCACTCTCTTCCCTTTCCCCAGCATCACTCCCCAAGGAAGAGCCAATGTTTTCCACCCATAATCCTTTCTGCCGACCCCTAGTTCCCTCTGCTCAGCCAAGCTTGTTATCAGCTTTCAGGGCCATGGTTCACATTAGAATAAAAGGTAGTAATTAGAA
SEQ ID NO:728CD74的全mRNA多核苷酸序列
ATCCTGCCCCGCAAAAGGCAGCTTCACCAAAGTGGGGTATTTCCAGCCTTTGTAGCTTTCACTTCCACATCTACCAAGTGGGCGGAGTGGCCTTCTGTGGACGAATCAGATTCCTCTCCAGCACCGACTTTAAGAGGCGAGCCGGGGGGTCAGGGTCCCAGATGCACAGGAGGAGAAGCAGGAGCTGTCGGGAAGATCAGAAGCCAGTCATGGATGACCAGCGCGACCTTATCTCCAACAATGAGCAACTGCCCATGCTGGGCCGGCGCCCTGGGGCCCCGGAGAGCAAGTGCAGCCGCGGAGCCCTGTACACAGGCTTTTCCATCCTGGTGACTCTGCTCCTCGCTGGCCAGGCCACCACCGCCTACTTCCTGTACCAGCAGCAGGGCCGGCTGGACAAACTGACAGTCACCTCCCAGAACCTGCAGCTGGAGAACCTGCGCATGAAGCTTCCCAAGCCTCCCAAGCCTGTGAGCAAGATGCGCATGGCCACCCCGCTGCTGATGCAGGCGCTGCCCATGGGAGCCCTGCCCCAGGGGCCCATGCAGAATGCCACCAAGTATGGCAACATGACAGAGGACCATGTGATGCACCTGCTCCAGAATGCTGACCCCCTGAAGGTGTACCCGCCACTGAAGGGGAGCTTCCCGGAGAACCTGAGACACCTTAAGAACACCATGGAGACCATAGACTGGAAGGTCTTTGAGAGCTGGATGCACCATTGGCTCCTGTTTGAAATGAGCAGGCACTCCTTGGAGCAAAAGCCCACTGACGCTCCACCGAAAGTACTGACCAAGTGCCAGGAAGAGGTCAGCCACATCCCTGCTGTCCACCCGGGTTCATTCAGGCCCAAGTGCGACGAGAACGGCAACTATCTGCCACTCCAGTGCTATGGGAGCATCGGCTACTGCTGGTGTGTCTTCCCCAACGGCACGGAGGTCCCCAACACCAGAAGCCGCGGGCACCATAACTGCAGTGAGTCACTGGAACTGGAGGACCCGTCTTCTGGGCTGGGTGTGACCAAGCAGGATCTGGGCCCAGTCCCCATGTGAGAGCAGCAGAGGCGGTCTTCAACATCCTGCCAGCCCCACACAGCTACAGCTTTCTTGCTCCCTTCAGCCCCCAGCCCCTCCCCCATCTCCCACCCTGTACCTCATCCCATGAGACCCTGGTGCCTGGCTCTTTCGTCACCCTTGGACAAGACAAACCAAGTCGGAACAGCAGATAACAATGCAGCAAGGCCCTGCTGCCCAATCTCCATCTGTCAACAGGGGCGTGAGGTCCCAGGAAGTGGCCAAAAGCTAGACAGATCCCCGTTCCTGACATCACAGCAGCCTCCAACACAAGGCTCCAAGACCTAGGCTCATGGACGAGATGGGAAGGCACAGGGAGAAGGGATAACCCTACACCCAGACCCCAGGCTGGACATGCTGACTGTCCTCTCCCCTCCAGCCTTTGGCCTTGGCTTTTCTAGCCTATTTACCTGCAGGCTGAGCCACTCTCTTCCCTTTCCCCAGCATCACTCCCCAAGGAAGAGCCAATGTTTTCCACCCATAATCCTTTCTGCCGACCCCTAGTTCCCTCTGCTCAGCCAAGCTTGTTATCAGCTTTCAGGGCCATGGTTCACATTAGAATAAAAGGTAGTAATTAGAA
SEQ ID NO:729CD74的外显子1的翻译多肽序列
MHRRRSRSCREDQKPVMDDQRDLISNNEQLPMLGRRPGAPE
SEQ ID NO:730CD74的外显子2的翻译多肽序列
KCSRGALYTGFSILVTLLLAGQATTAYFLYQQQGRLDKLTVTSQNLQLENLRMKLPK
SEQ ID NO:731CD74的外显子3的翻译多肽序列
PKPVSKMRMATPLLMQALPMGALPQG
SEQ ID NO:732CD74的外显子4的翻译多肽序列
PMQNATKYGNMTEDHVMHLLQ
SEQ ID NO:733CD74的外显子5的翻译多肽序列
NADPLKVYPPLKGSFPENLRHLKNTMETIDWK
SEQ ID NO:734CD74的外显子6的翻译多肽序列
VFESWMHHWLLFEMSRHSLEQKPTDAPPK
SEQ ID NO:735CD74的外显子7的翻译多肽序列
LTKCQEEVSHIPAVHPGSFRPKCDENGNYLPLQCYGSIGYCWCVFPNGTEVPNTRSRGHHNCS
SEQ ID NO:736CD74的外显子8的翻译多肽序列
SLELEDPSSGLGVTKQDLGP
SEQ ID NO:737CD74的外显子9的翻译多肽序列
PM
SEQ ID NO:738CD74的全蛋白质序列
MHRRRSRSCREDQKPVMDDQRDLISNNEQLPMLGRRPGAPESKCSRGALYTGFSILVTLLLAGQATTAYFLYQQQGRLDKLTVTSQNLQLENLRMKLPKPPKPVSKMRMATPLLMQALPMGALPQGPMQNATKYGNMTEDHVMHLLQNADPLKVYPPLKGSFPENLRHLKNTMETIDWKVFESWMHHWLLFEMSRHSLEQKPTDAPPKVLTKCQEEVSHIPAVHPGSFRPKCDENGNYLPLQCYGSIGYCWCVFPNGTEVPNTRSRGHHNCSESLELEDPSSGLGVTKQDLGPVPM
SEQ ID NO:739CD74的全部外显子1-2按顺序排列的多核苷酸序列
SEQ ID NO:740CD74的全部外显子1-2按顺序排列的翻译多肽序列
SDC4序列信息
SEQ ID NO:741来自SDC4-NRG1融合物5’处的SDC4外显子2的序列
TACCAGACGATGAGGATGTAGTGGGGCCCGGGCAGGAATCTGATGACTTTGAGCTGTCTGGCTCTGGAGATCTGG
SEQ ID NO:742SDC4-NRG1融合物3’处的NRG1外显子2序列
CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA
SEQ ID NO:743SDC4-NRG1多核苷酸序列
TACCAGACGATGAGGATGTAGTGGGGCCCGGGCAGGAATCTGATGACTTTGAGCTGTCTGGCTCTGGAGATCTGGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA
SEQ ID NO:744SDC4-NRG1多肽序列
PDDEDVVGPGQESDDFELSGSGDLALPPRLKEMKSQESAAGSKLVLRCE
SEQ ID NO:745SDC4的外显子1
ACTCGCCGCAGCCTGCGCGCCTTCTCCAGTCCGCGGTGCCATGGCCCCCGCCCGTCTGTTCGCGCTGCTGCTGTTCTTCGTAGGCGGAGTCGCCGAGTCG
SEQ ID NO:746SDC4的外显子2
ATCCGAGAGACTGAGGTCATCGACCCCCAGGACCTCCTAGAAGGCCGATACTTCTCCGGAGCCCTACCAGACGATGAGGATGTAGTGGGGCCCGGGCAGGAATCTGATGACTTTGAGCTGTCTGGCTCTGGAGATCTGG
SEQ ID NO:747SDC4的外显子3
ATGACTTGGAAGACTCCATGATCGGCCCTGAAGTTGTCCATCCCTTG
SEQ ID NO:748SDC4的外显子4
GTGCCTCTAGATAACCATATCCCTGAGAGGGCAGGGTCTGGGAGCCAAGTCCCCACCGAACCCAAGAAACTAGAGGAGAATGAGGTTATCCCCAAGAGAATCTCACCCGTTGAAGAGAGTGAGGATGTGTCCAACAAGGTGTCAATGTCCAGCACTGTGCAGGGCAGCAACATCTTTGAGAGAACGGAGGTCCTGGCAG
SEQ ID NO:749SDC4的外显子5
CTCTGATTGTGGGTGGCATCGTGGGCATCCTCTTTGCCGTCTTCCTGATCCTACTGCTCATGTACCGTATGAAGAAGAAGGATGAAGGCAGCTATGACCTGGGCAAGAAACCCATCTACAAGAAAGCCCCCACCAATGAGTTCTACGCGTGAAGCTTGCTTGTGGGCACTGGCTTGGACTTTAGCGGGGAGGGAAGCCAGGGGATTTTGAAGGGTGGACATTAGGGTAGGGTGAGGTCAACCTAATACTGACTTGTCAGTATCTCCAGCTCTGATTACCTTTGAAGTGTTCAGAAGAGACATTGTCTTCTACTGTTCTGCCAGGTTCTTCTTGAGCTTTGGGCCTCAGTTGCCCTGGCAGAAAAATGGATTCAACTTGGCCTTTCTGAAGGCAAGACTGGGATTGGATCACTTCTTAAACTTCCAGTTAAGAATCTAGGTCCGCCCTCAAGCCCATACTGACCATGCCTCATCCAGAGCTCCTCTGAAGCCAGGGGGCTAACGGATGTTGTGTGGAGTCCTGGCTGGAGGTCCTCCCCCAGTGGCCTTCCTCCCTTCCTTTCACAGCCGGTCTCTCTGCCAGGAAATGGGGGAAGGAACTAGAACCACCTGCACCTTGAGATGTTTCTGTAAATGGGTACTTGTGATCACACTACGGGAATCTCTGTGGTATATACCTGGGGCCATTCTAGGCTCTTTCAAGTGACTTTTGGAAATCAACCTTTTTTATTTGGGGGGGAGGATGGGGAAAAGAGCTGAGAGTTTATGCTGAAATGGATTTATAGAATATTTGTAAATCTATTTTTAGTGTTTGTTCGTTTTTTTAACTGTTCATTCCTTTGTGCAGAGTGTATATCTCTGCCTGGGCAAGAGTGTGGAGGTGCCGAGGTGTCTTCATTCTCTCGCACATTTCCACAGCACCTGCTAAGTTTGTATTTAATGGTTTTTGTTTTTGTTTTTGTTTGTTTCTTGAAAATGAGAGAAGAGCCGGAGAGATGATTTTTATTAATTTTTTTTTTTTTTTTTTTTTTTTACTATTTATAGCTTTAGATAGGGCCTCCCTTCCCCTCTTCTTTCTTTGTTCTCTTTCATTAAACCCCTTCCCCAGTTTTTTTTTTATACTTTAAACCCCGCTCCTCATGGCCTTGGCCCTTTCTGAAGCTGCTTCCTCTTATAAAATAGCTTTTGCCGAAACATAGTTTTTTTTTAGCAGATCCCAAAATATAATGAAGGGGATGGTGGGATATTTGTGTCTGTGTTCTTATAATATATTATTATTCTTCCTTGGTTCTAGAAAAATAGATAAATATATTTTTTTCAGGAAATAGTGTGGTGTTTCCAGTTTGATGTTGCTGGGTGGTTGAGTGAGTGAATTTTCATGTGGCTGGGTGGGTTTTTGCCTTTTTCTCTTGCCCTGTTCCTGGTGCCTTCTGATGGGGCTGGAATAGTTGAGGTGGATGGTTCTACCCTTTCTGCCTTCTGTTTGGGACCCAGCTGGTGTTCTTTGGTTTGCTTTCTTCAGGCTCTAGGGCTGTGCTATCCAATACAGTAACCACATGCGGCTGTTTAAAGTTAAGCCAATTAAAATCACATAAGATTAAAAATTCCTTCCTCAGTTGCACTAACCACGTTTCTAGAGGCGTCACTGTATGTAGTTCATGGCTACTGTACTGACAGCGAGAGCATGTCCATCTGTTGGACAGCACTATTCTAGAGAACTAAACTGGCTTAACGAGTCACAGCCTCAGCTGTGCTGGGACGACCCTTGTCTCCCTGGGTAGGGGGGGGGGAATGGGGGAGGGCTGATGAGGCCCCAGCTGGGGCCTGTTGTCTGGGACCCTCCCTCTCCTGAGAGGGGAGGCCTGGTGGCTTAGCCTGGGCAGGTCGTGTCTCCTCCTGACCCCAGTGGCTGCGGTGAGGGGAACCACCCTCCCTTGCTGCACCAGTGGCCATTAGCTCCCGTCACCACTGCAACCCAGGGTCCCAGCTGGCTGGGTCCTCTTCTGCCCCCAGTGCCCTTCCCCTTGGGCTGTGTTGGAGTGAGCACCTCCTCTGTAGGCACCTCTCACACTGTTGTCTGTTACTGATTTTTTTTGATAAAAAGATAATAAAACCTGGTACTTTCTAAA
SEQ ID NO:750SDC4的全mRNA多核苷酸序列
ACTCGCCGCAGCCTGCGCGCCTTCTCCAGTCCGCGGTGCCATGGCCCCCGCCCGTCTGTTCGCGCTGCTGCTGTTCTTCGTAGGCGGAGTCGCCGAGTCGATCCGAGAGACTGAGGTCATCGACCCCCAGGACCTCCTAGAAGGCCGATACTTCTCCGGAGCCCTACCAGACGATGAGGATGTAGTGGGGCCCGGGCAGGAATCTGATGACTTTGAGCTGTCTGGCTCTGGAGATCTGGATGACTTGGAAGACTCCATGATCGGCCCTGAAGTTGTCCATCCCTTGGTGCCTCTAGATAACCATATCCCTGAGAGGGCAGGGTCTGGGAGCCAAGTCCCCACCGAACCCAAGAAACTAGAGGAGAATGAGGTTATCCCCAAGAGAATCTCACCCGTTGAAGAGAGTGAGGATGTGTCCAACAAGGTGTCAATGTCCAGCACTGTGCAGGGCAGCAACATCTTTGAGAGAACGGAGGTCCTGGCAGCTCTGATTGTGGGTGGCATCGTGGGCATCCTCTTTGCCGTCTTCCTGATCCTACTGCTCATGTACCGTATGAAGAAGAAGGATGAAGGCAGCTATGACCTGGGCAAGAAACCCATCTACAAGAAAGCCCCCACCAATGAGTTCTACGCGTGAAGCTTGCTTGTGGGCACTGGCTTGGACTTTAGCGGGGAGGGAAGCCAGGGGATTTTGAAGGGTGGACATTAGGGTAGGGTGAGGTCAACCTAATACTGACTTGTCAGTATCTCCAGCTCTGATTACCTTTGAAGTGTTCAGAAGAGACATTGTCTTCTACTGTTCTGCCAGGTTCTTCTTGAGCTTTGGGCCTCAGTTGCCCTGGCAGAAAAATGGATTCAACTTGGCCTTTCTGAAGGCAAGACTGGGATTGGATCACTTCTTAAACTTCCAGTTAAGAATCTAGGTCCGCCCTCAAGCCCATACTGACCATGCCTCATCCAGAGCTCCTCTGAAGCCAGGGGGCTAACGGATGTTGTGTGGAGTCCTGGCTGGAGGTCCTCCCCCAGTGGCCTTCCTCCCTTCCTTTCACAGCCGGTCTCTCTGCCAGGAAATGGGGGAAGGAACTAGAACCACCTGCACCTTGAGATGTTTCTGTAAATGGGTACTTGTGATCACACTACGGGAATCTCTGTGGTATATACCTGGGGCCATTCTAGGCTCTTTCAAGTGACTTTTGGAAATCAACCTTTTTTATTTGGGGGGGAGGATGGGGAAAAGAGCTGAGAGTTTATGCTGAAATGGATTTATAGAATATTTGTAAATCTATTTTTAGTGTTTGTTCGTTTTTTTAACTGTTCATTCCTTTGTGCAGAGTGTATATCTCTGCCTGGGCAAGAGTGTGGAGGTGCCGAGGTGTCTTCATTCTCTCGCACATTTCCACAGCACCTGCTAAGTTTGTATTTAATGGTTTTTGTTTTTGTTTTTGTTTGTTTCTTGAAAATGAGAGAAGAGCCGGAGAGATGATTTTTATTAATTTTTTTTTTTTTTTTTTTTTTTTACTATTTATAGCTTTAGATAGGGCCTCCCTTCCCCTCTTCTTTCTTTGTTCTCTTTCATTAAACCCCTTCCCCAGTTTTTTTTTTATACTTTAAACCCCGCTCCTCATGGCCTTGGCCCTTTCTGAAGCTGCTTCCTCTTATAAAATAGCTTTTGCCGAAACATAGTTTTTTTTTAGCAGATCCCAAAATATAATGAAGGGGATGGTGGGATATTTGTGTCTGTGTTCTTATAATATATTATTATTCTTCCTTGGTTCTAGAAAAATAGATAAATATATTTTTTTCAGGAAATAGTGTGGTGTTTCCAGTTTGATGTTGCTGGGTGGTTGAGTGAGTGAATTTTCATGTGGCTGGGTGGGTTTTTGCCTTTTTCTCTTGCCCTGTTCCTGGTGCCTTCTGATGGGGCTGGAATAGTTGAGGTGGATGGTTCTACCCTTTCTGCCTTCTGTTTGGGACCCAGCTGGTGTTCTTTGGTTTGCTTTCTTCAGGCTCTAGGGCTGTGCTATCCAATACAGTAACCACATGCGGCTGTTTAAAGTTAAGCCAATTAAAATCACATAAGATTAAAAATTCCTTCCTCAGTTGCACTAACCACGTTTCTAGAGGCGTCACTGTATGTAGTTCATGGCTACTGTACTGACAGCGAGAGCATGTCCATCTGTTGGACAGCACTATTCTAGAGAACTAAACTGGCTTAACGAGTCACAGCCTCAGCTGTGCTGGGACGACCCTTGTCTCCCTGGGTAGGGGGGGGGGAATGGGGGAGGGCTGATGAGGCCCCAGCTGGGGCCTGTTGTCTGGGACCCTCCCTCTCCTGAGAGGGGAGGCCTGGTGGCTTAGCCTGGGCAGGTCGTGTCTCCTCCTGACCCCAGTGGCTGCGGTGAGGGGAACCACCCTCCCTTGCTGCACCAGTGGCCATTAGCTCCCGTCACCACTGCAACCCAGGGTCCCAGCTGGCTGGGTCCTCTTCTGCCCCCAGTGCCCTTCCCCTTGGGCTGTGTTGGAGTGAGCACCTCCTCTGTAGGCACCTCTCACACTGTTGTCTGTTACTGATTTTTTTTGATAAAAAGATAATAAAACCTGGTACTTTCTAAA
SEQ ID NO:751SDC4的外显子1的翻译多肽序列
MAPARLFALLLFFVGGVAES
SEQ ID NO:752SDC4的外显子2的翻译多肽序列
IRETEVIDPQDLLEGRYFSGALPDDEDVVGPGQESDDFELSGSGDL
SEQ ID NO:753SDC4的外显子3的翻译多肽序列
DLEDSMIGPEVVHPL
SEQ ID NO:754SDC4的外显子4的翻译多肽序列
VPLDNHIPERAGSGSQVPTEPKKLEENEVIPKRISPVEESEDVSNKVSMSSTVQGSNIFERTEVLA
SEQ ID NO:755SDC4的外显子5的翻译多肽序列
LIVGGIVGILFAVFLILLLMYRMKKKDEGSYDLGKKPIYKKAPTNEFYA
SEQ ID NO:756SDC4的全蛋白质序列
MAPARLFALLLFFVGGVAESIRETEVIDPQDLLEGRYFSGALPDDEDVVGPGQESDDFELSGSGDLDDLEDSMIGPEVVHPLVPLDNHIPERAGSGSQVPTEPKKLEENEVIPKRISPVEESEDVSNKVSMSSTVQGSNIFERTEVLAALIVGGIVGILFAVFLILLLMYRMKKKDEGSYDLGKKPIYKKAPTNEFYA
SEQ ID NO:757SDC4的全部外显子1-2按顺序排列的多核苷酸序列
SEQ ID NO:758SDC4的全部外显子1-2按顺序排列的翻译多肽序列
CD44(2)序列信息
SEQ ID NO:759来自CD44-NRG1融合物5’处的CD44外显子5的序列
TTTCTACTGTACACCCCATCCCAGACGAAGACAGTCCCTGGATCACCGACAGCACAGACAGAATCCCTGCTACCA
SEQ ID NO:760CD44-NRG1融合物3’处的NRG1外显子6序列
CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG
SEQ ID NO:761CD44-NRG1多核苷酸序列
TTTCTACTGTACACCCCATCCCAGACGAAGACAGTCCCTGGATCACCGACAGCACAGACAGAATCCCTGCTACCACTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG
SEQ ID NO:762CD44-NRG1多肽序列
STVHPIPDEDSPWITDSTDRIPATTTSTSTTGTSHLVKCAEKEKTFCVN
SLC4A4序列信息
SEQ ID NO:763来自SLC4A4-NRG1融合物5’处的SLC4A4外显子14的序列
ACTACCCCATCAACTCCAACTTCAAAGTGGGCTACAACACTCTCTTTTCCTGTACCTGTGTGCCACCTGACCCAG
SEQ ID NO:764SLC4A4-NRG1融合物3’处的NRG1外显子6序列
CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG
SEQ ID NO:765SCL4A4-NRG1多核苷酸序列
ACTACCCCATCAACTCCAACTTCAAAGTGGGCTACAACACTCTCTTTTCCTGTACCTGTGTGCCACCTGACCCAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG
SEQ ID NO:766SCL4A4-NRG1多肽序列
YPINSNFKVGYNTLFSCTCVPPDPATSTSTTGTSHLVKCAEKEKTFCVN
SEQ ID NO:767SLC4A4的外显子1
GGCGGCGCGCCGGGCAGCGCTTCGGTGGCGGCGGCGGCCGCGGTGGCAGCGAAGGCGGCGGCGGCGGCGGCAGTGGCAGTGGCCGCTGCAGCCCCACACTCCGCCGCCAAACTGGAGGAGCGACGGAAGCCAGACCCCAGGAG
SEQ ID NO:768SLC4A4的外显子2
GATGGAGGATGAAGCTGTCCTGGACAGAGGGGCTTCCTTCCTCAAGCATGTGTGTGATGAAGAAGAAGTAGAAG
SEQ ID NO:769SLC4A4的外显子3
GCCACCATACCATTTACATCGGAGTCCATGTGCCGAAGAGTTACAGGAGAAGGAGACGTCACAAGAGAAAGACAGGGCACAAAGAAAAGAAGGAAAAGGAGAGAATCTCTGAGAACTACTCTGACAAATCAGATATTGAAAATGCTGATGAATCCAGCAGCAGCATCCTAAAACCTCTCA
SEQ ID NO:770SLC4A4的外显子4
TCTCTCCTGCTGCAGAACGCATCCGATTCATCTTGGGAGAGGAGGATGACAGCCCAGCTCCCCCTCAGCTCTTCACGGAACTGGATGAGCTGCTGGCCGTGGATGGGCAGGAGATGGAGTGGAAGGAAACAGCCAG
SEQ ID NO:771SLC4A4的外显子5
GTGGATCAAGTTTGAAGAAAAAGTGGAACAGGGTGGGGAAAGATGGAGCAAGCCCCATGTGGCCACATTGTCCCTTCATAGTTTATTTGAGCTGAGGACATGTATGGAGAAAGGATCCATCATGCTTGATCGGGAGGCTTCTTCTCTCCCACAGTTGGTGG
SEQ ID NO:772SLC4A4的外显子6
AGATGATTGTTGACCATCAGATTGAGACAGGCCTATTGAAACCTGAACTTAAGGATAAGGTGACCTATACTTTGCTCCGGAAGCACCGGCATCAAACCAAGAAATCCAACCTTCGGTCCCTGGCTGACATTGGGAAGACAGTCTCCAGTGCAAGTAGGATGTTTACCAACCCTGATAATG
SEQ ID NO:773SLC4A4的外显子7
GTAGCCCAGCCATGACCCATAGGAATCTGACTTCCTCCAGTCTGAATGACATTTCTGATAAACCGGAGAAGGACCAG
SEQ ID NO:774SLC4A4的外显子8
CTGAAGAATAAGTTCATGAAAAAATTGCCACGTGATGCAGAAGCTTCCAACGTGCTTGTTGGGGAGGTTGACTTTTTGGATACTCCTTTCATTGCCTTTGTTAGGCTACAGCAGGCTGTCATGCTGGGTGCCCTGACTGAAGTTCCTGTGCCCACAAG
SEQ ID NO:775SLC4A4的外显子9
GTTCTTGTTCATTCTCTTAGGTCCTAAGGGGAAAGCCAAGTCCTACCACGAGATTGGCAGAGCCATTGCCACCCTGATGTCTGATGAG
SEQ ID NO:776SLC4A4的外显子10
GTGTTCCATGACATTGCTTATAAAGCAAAAGACAGGCACGACCTGATTGCTGGTATTGATGAGTTCCTAGATGAAGTCATCGTCCTTCCACCTGGGGAATGGGATCCAGCAATTAGGATAGAGCCTCCTAAGAGTCTTCCATCCTCTGACAAAAG
SEQ ID NO:777SLC4A4的外显子11
AAAGAATATGTACTCAGGTGGAGAGAATGTTCAGATGAATGGGGATACGCCCCATGATGGAGGTCACGGAGGAGGAGGACATGGGGATTGTGAAGAATTGCAGCGAACTGGACG
SEQ ID NO:778SLC4A4的外显子12
GTTCTGTGGTGGACTAATTAAAGACATAAAGAGGAAAGCGCCATTTTTTGCCAGTGATTTTTATGATGCTTTAAATATTCAAGCTCTTTCGGCAATTCTCTTCATTTATCTGGCAACTGTAACTAATGCTATCACTTTTGGAGGACTGCTTGGGGATGCCACTGACAACATGCAG
SEQ ID NO:779SLC4A4的外显子13
GGCGTGTTGGAGAGTTTCCTGGGCACTGCTGTCTCTGGAGCCATCTTTTGCCTTTTTGCTGGTCAACCACTCACTATTCTGAGCAGCACCGGACCTGTCCTAGTTTTTGAGAGGCTTCTATTTAATTTCAGCAA
SEQ ID NO:780SLC4A4的外显子14
GGACAATAATTTTGACTATTTGGAGTTTCGCCTTTGGATTGGCCTGTGGTCCGCCTTCCTATGTCTCATTTTGGTAGCCACTGATGCCAGCTTCTTGGTTCAATACTTCACACGTTTCACGGAGGAGGGCTTTTCCTCTCTGATTAGCTTCATCTTTATCTATGATGCTTTCAAGAAGATGATCAAGCTTGCAGATTACTACCCCATCAACTCCAACTTCAAAGTGGGCTACAACACTCTCTTTTCCTGTACCTGTGTGCCACCTGACCCAG
SEQ ID NO:781SLC4A4的外显子15
CTAATATCTCAATATCTAATGACACCACACTGGCCCCAGAGTATTTGCCAACTATGTCTTCTACTGACATG
SEQ ID NO:782SLC4A4的外显子16
TACCATAATACTACCTTTGACTGGGCATTTTTGTCGAAGAAGGAGTGTTCAAAATACGGAGGAAACCTCGTCGGGAACAACTGTAATTTTGTTCCTGATATCACACTCATGTCTTTTATCCTCTTCTTGGGAACCTACACCTCTTCCATGGCTCTGAAAAAATTCAAAACTAGTCCTTATTTTCCAACCACA
SEQ ID NO:783SLC4A4的外显子17
GCAAGAAAACTGATCAGTGATTTTGCCATTATCTTGTCCATTCTCATCTTTTGTGTAATAGATGCCCTAGTAGGCGTGGACACCCCAAAACTAATTGTGCCAAGTGAGTTCAAG
SEQ ID NO:784SLC4A4的外显子18
CCAACAAGTCCAAACCGAGGTTGGTTCGTTCCACCGTTTGGAGAAAACCCCTGGTGGGTGTGCCTTGCTGCTGCTATCCCGGCTTTGTTGGTCACTATACTGATTTTCATGGACCAACAAATTACAGCTGTGATTGTAAACAGGAAAGAACATAAACTCAAG
SEQ ID NO:785SLC4A4的外显子19
AAAGGAGCAGGGTATCACTTGGATCTCTTTTGGGTGGCCATCCTCATGGTTATATGCTCCCTCATGGCTCTTCCGTGGTATGTAGCTGCTACGGTCATCTCCATTGCTCACATCGACAGTTTGAAGATGGAGACAGAGACTTCTGCACCTGGAGAACAACCAAAGTTTCTAGGAGTGAG
SEQ ID NO:786SLC4A4的外显子20
GGAACAAAGAGTCACTGGAACCCTTGTGTTTATTCTGACTGGTCTGTCAGTCTTTATGGCTCCCATCTTGAAG
SEQ ID NO:787SLC4A4的外显子21
GTTTATACCCATGCCTGTACTCTATGGTGTGTTCCTGTATATGGGAGTAGCATCCCTTAATGGTGTGCAG
SEQ ID NO:788SLC4A4的外显子22
TTCATGGATCGTCTGAAGCTGCTTCTGATGCCTCTGAAGCATCAGCCTGACTTCATCTACCTGCGTCATGTTCCTCTGCGCAGAGTCCACCTGTTCACTTTCCTGCAGGTGTTGTGTCTGGCCCTGCTTTGGATCCTCAAGTCAACGGTGGCTGCTATCATTTTTCCAGTAATG
SEQ ID NO:789SLC4A4的外显子23
ATCTTGGCACTTGTAGCTGTCAGAAAAGGCATGGACTACCTCTTCTCCCAGCACGACCTCAGCTTCCTGGATGATGTCATTCCAGAAAAGGACAAGAAAAAGAAGGAGGATGAGAAGAAAAAGAAAAAGAAGAAGGGAAGTCTGGACAGTGACAATGATGAT
SEQ ID NO:790SLC4A4的外显子24
TCTGACTGCCCATACTCAGAAAAAGTTCCAAGTATTAAAATTCCAATGGACATCATGGAACAGCAACCTTTCCTAAGCGATAGCAAACCTTCTGACA
SEQ ID NO:791SLC4A4的外显子25
GAGAAAGATCACCAACATTCCTTGAACGCCACACATCATGCTGATAAAATTCCTTTCCTTCAGTCACTCGGTATGCCAAG
SEQ ID NO:792SLC4A4的外显子26
TCCTCCTAGAACTCCAGTAAAAGTTGTGCCTCAAATTAGAATAGAACTTGAACCTGAAGACAATGATTATTTCTGGAGGAGCAAGGGAACAGAAACTACATTGTAACCTGTTTGTCTTTCTTAAAACTGACATTTGTTGTTAATGTCATTTGTTTTTGTTTGGCTGTTTGTTTATTTTTTAACTTTTATTTCGTCTCAGTTTTTGGTCACAGGCCAAATAATACAGCGCTCTCTCTGCTTCTCTCTTGCATAGACACAATCAAGACAATAGTGCACCGTTCCTTAAAAACAGCATCTGAGGAATCCCCCTTTTGTTCTTAAACTTTCAGATGTGTCCTTTGATAACCAAATTCTGTCACTCAAGACACAGACACGCACAGACCCTGTCCTTTGCCTCTATTAAGCAGAGGATGGAAGTATTAAGGATTTTGTAACACCTTTTATGAAAATGTTGAAGGAACTTAAAACTTTAGCTTTGGAGCTGTGCTTACTGGCTTGTCTTTGTCTGGTAGAACAAACCTTGACCTCCAGACAGAGTCCCTTCTCACTTATAGAGCTCTCCAGGACTGGAAAAAGTGCTGCTATTTTAACTTGCTCTTGCTTGTAAATCCTAATCTTAGAGTTATCAAAAGAAGAAAAAACTGAAGGTACTTTACTCCCTATAGAGAAACCATTGCCATCATTGTAGCAAGTGCTGGAATGTCCCTTTTTTCCTATGCAACTTTTTTTAACCCTTTAATGAACTTATCTGTTGAGTACATTGAAGAATATTTTTCTTCCTAGATTTTGTTGTTTAAATTATGGGGCCTAACCTGCCACTTATTTTTTGTCAATTTTTAAAACTTTTTTTTAATTACTGTAAAGAAAATGAATTTTTTCCTGCAGCAGGAAACATAGTTTTGAGTAGTTCTACCTCTTATTTGTAGCTGCCAGGCTTTCTGTAAAAATTGTATTGTATATAATGTGATTTTTACACATACATACACACACAAATACACAATCTCTAGGGTAAGCCAGAAGGCAAGATCAGATTAAAAACACCATGTTTCTAAGCATCCATTTTTCCCTTTCTTTAAAAGAAACTTAACTGTTCTATGAAGGAGATTGAGGGAGAAGAGACAAACTCCTATGTCATGAGAATAACCGATGTTCTGATAATAGTAGCATCTAGGTACAGATGCTGGTTGTATTACCACGTCAATGTCCTATGCAGTATTGTTAGACATTTTCTCATTTTGAAATATTTGTGTGTTTGTGTATGTGCTCTGTGCCATGGCTGGTGTATATATGTGCAATGTTAGAAGGCAAAAGAGTGATGGTAGGCAGAGGGCAAAGTCATTGAATCTCTTATGCCAGTTTTCATAAAACCCAAACCACATATGAAAAAATCCATTAAGGGTCCAAGAAGTCTGTCCATATGAAAATGAGGGTAAATATAGTTTATTTCCCAGGTATCAGTCATTATAATTGATATAATAGCTCTAACATGCAATATAAAATTCATAGGAGTATTAATAGCCCATTTACACATCTATAAAATGTAATGGGATTGCAGAGCTGCAGAGTACAGTGTAACAGTACTCTCATGCAATTTTTTTCAGGATGCAAAGGCAATTATTCTTTGTAAGCGGGACATTTAGAATATATTTGTGTACATATTATATGTATGTATATTTCAAAGTACCACACTGAAAATTAGACATTTATTAACCAAATTTAACGTGGTATTTAAAGGTAATATTTTTAATATGATACATTACATATTGTGAATGTATACTAAAAAAACATTTTAAATGTTAAAATTATAATTTCAGATTCATATAACCACAACTGTGATATATCCTAACTATAACCAGTTGTTGAGGGGTATACTAGAAGCAGAATGAAACCACATTTTTTGGTTTGATAATATGCACTTATTGACTCCCACTCATTGTTATGTTAATTAAGTTATTATTCTGTCTCCTTGTAATTTTGATTACAAAAATTTTATTATCCTGAGTTAGCTGTTACTTTTACAGTACCTGATACTCCTAAAACTTTTAACTTATACAAATTAGTCAATAATGACCCCAATTTTTTCATTAAAATAATAGTGGTGAATTATATGTTATTGTGTTAAAACCTCACTTGCCAAATTCTGGCTTCACATTTGTATTTAGGGCTATCCTTAAAATGATGAGTCTATATTATCTAGCTTTCTATTACCCTAATATAAACTGGTATAAGAAGACTTTCCTTTTTTCTTTATGCATGGAAGCATCAATAAATTGTTTAAAAACCATGTATAGTAAATTCAGCTTAACCCGTGATCTTCTTAAGTTAAAGGTACTTTTGTTTTATAAAAGCTCTAGATAAAACTTTCTTTTCTGATCATGAATCAAGTATCTGTGGTTTCATGCCCCTCTCTATACCTTTCAAAGAACTCCTGAAGCAACTTAACTCATCATTTCAGCCTCTGAGTAGAGGTAAAACCTATGTGTACTTCTGTTTATGATCCATATTGATATTTATGACATGAACACAGAATAGTACCTTACATTTGCTAAACAGACAGTTAATATCAAATCCTTTCAATATTCTGGGAACCCAGGGAAGTTTTTAAAAATGTCATTACTTTCAAAGGAACAGAAGTAGTTAACCAAACTAACAAGCAAAACCTGAGGTTTACCTAGTGACACCAAATTATCGGTATTTTAACTGAATTTACCCATTGACTAAGAATGAACCAGATTTGGTGGTGGTTTTGTTTCTATGCAAACTGGACACAAATTACAACAGTAAATTTTTTTATAAGTGCTTCTCCCTTCTCCATGATGTGACTTCCGGAGATAAAGGATTCAAAAGATAAAGACAAAGTACGCTCAGAGTTGTTAACCAGAAAGTCCTGGCTGTGGTTGCAGAAACACTGTTGGAAGAAAAGAGATGACTAAGTCAAGTGTCTGCCTTATCAAAAGAGCAAAAATGCCTCTGGTTTTGTGTTTGGGAGAAAAGTATCTTGGACGCACTGTTTTCCTTGATAAAAGTCATCTTCTCTACTGTGTGAAATGAATACTTGGAATTCTAATTGTTTTGTGTGCCAGGGGCAGTAATGTCCCTGCCTCTTCTCCCAATCAAGGTTGAGGAGTGGGGCTGGGGAGAGGACTTAACTGACTTAAGAAGTAGGAAAACAAAAACCTCTCTCCTCAGCCTTCCACCTCCAAGAGAGGAGGAAAAACAGTTGTCTGCTGTCTGTAATTCAGTTTGCGTGTATTTTATGCTCATGCACCAACCCATACAGAGTAAATCTTTTATCAACTGTATACTGGTGTTTAATAGAGAATGATTGTCTTCCGAGTTTTTTGGTTCCTTTTTTAACTGTGTTAAAGTACTTGAAATGTATTGACTGCTGACTATATTTTAAAAACAAAATGAAATAATTTGAGTTGTATTACAGAGGTTGACATTGTTCAGGGATGGGACAAAGCCTTCTTCAATCCTTTTCATACTACTTAATGATTTTGGTGCAGGAACCTGAGATTTTCTGATTTATATTTCATGATATTTCACATTTGCTCTTCACAGCATGAGCATGAAGCCCAGTGGCACCAAATGGCTGGGTACAATCAAGTGATATTTTGTAGCACCTCACTATCTGAAAGGCCATGAGTTTTCAGATGATTTCATTGAGCTTCATTGCAGCCTGAAATTTTAAAAAAGTTGTGTAATACGCCAACCAGTCAAGTTGTGTTTTGGCCAGAGATTTAGATATGTCCAATTTCCTGGCTCATTTCATTGTGCTCTATGGGTACGTATAAAAAGCAAGAATTCTGTTTCCTAGGCAAACATTGCAACTCAGGGCTAAAGTCATCCAGTGAAACTTTTAGAGCCAGAAGTAACTTTGTCCCAGTCCTACAATGTGAAAAGAGTGAATAGTTGCCTCTTTTTAGCCATTTTCATGGCTGGTACATATTCGTACGCATTACTTTTCAGAATCAATACGCACTTTCAGATATTCTTATTTTTATTCTCTTAAGTCTTTATTAACTTTGGAGAGAGAAATGATGCATCTTTTTATTTTAAATGAAGTAGATCAACATGGTGGAACAAAATGATAAAGAACAGAAAACATTTCAATATATTACTAATAACTTTTTCCAATATAAATCCTAAAATTCCTATAACATAGTATTTTACAGTTTTATGAAGCTTTCTATTGTGACTTTTATGGAATTAAGAGATGAAGAAGATGAGATATTTTAGCATTTATATTTTTCAAAATTATATGTATACTTAAAAATAAAGTAACTTTATGCA
SEQ ID NO:793SLC4A4的全mRNA多核苷酸序列
GGCGGCGCGCCGGGCAGCGCTTCGGTGGCGGCGGCGGCCGCGGTGGCAGCGAAGGCGGCGGCGGCGGCGGCAGTGGCAGTGGCCGCTGCAGCCCCACACTCCGCCGCCAAACTGGAGGAGCGACGGAAGCCAGACCCCAGGAGGATGGAGGATGAAGCTGTCCTGGACAGAGGGGCTTCCTTCCTCAAGCATGTGTGTGATGAAGAAGAAGTAGAAGGCCACCATACCATTTACATCGGAGTCCATGTGCCGAAGAGTTACAGGAGAAGGAGACGTCACAAGAGAAAGACAGGGCACAAAGAAAAGAAGGAAAAGGAGAGAATCTCTGAGAACTACTCTGACAAATCAGATATTGAAAATGCTGATGAATCCAGCAGCAGCATCCTAAAACCTCTCATCTCTCCTGCTGCAGAACGCATCCGATTCATCTTGGGAGAGGAGGATGACAGCCCAGCTCCCCCTCAGCTCTTCACGGAACTGGATGAGCTGCTGGCCGTGGATGGGCAGGAGATGGAGTGGAAGGAAACAGCCAGGTGGATCAAGTTTGAAGAAAAAGTGGAACAGGGTGGGGAAAGATGGAGCAAGCCCCATGTGGCCACATTGTCCCTTCATAGTTTATTTGAGCTGAGGACATGTATGGAGAAAGGATCCATCATGCTTGATCGGGAGGCTTCTTCTCTCCCACAGTTGG
TGGAGATGATTGTTGACCATCAGATTGAGACAGGCCTATTGAAACCTGAACTTAAGGAT
AAGGTGACCTATACTTTGCTCCGGAAGCACCGGCATCAAACCAAGAAATCCAACCTTC
GGTCCCTGGCTGACATTGGGAAGACAGTCTCCAGTGCAAGTAGGATGTTTACCAACCC
TGATAATGGTAGCCCAGCCATGACCCATAGGAATCTGACTTCCTCCAGTCTGAATGACAT
TTCTGATAAACCGGAGAAGGACCAGCTGAAGAATAAGTTCATGAAAAAATTGCCACGT
GATGCAGAAGCTTCCAACGTGCTTGTTGGGGAGGTTGACTTTTTGGATACTCCTTTCAT
TGCCTTTGTTAGGCTACAGCAGGCTGTCATGCTGGGTGCCCTGACTGAAGTTCCTGTGC
CCACAAGGTTCTTGTTCATTCTCTTAGGTCCTAAGGGGAAAGCCAAGTCCTACCACGAG
ATTGGCAGAGCCATTGCCACCCTGATGTCTGATGAGGTGTTCCATGACATTGCTTATAAA
GCAAAAGACAGGCACGACCTGATTGCTGGTATTGATGAGTTCCTAGATGAAGTCATCGT
CCTTCCACCTGGGGAATGGGATCCAGCAATTAGGATAGAGCCTCCTAAGAGTCTTCCAT
CCTCTGACAAAAGAAAGAATATGTACTCAGGTGGAGAGAATGTTCAGATGAATGGGGA
TACGCCCCATGATGGAGGTCACGGAGGAGGAGGACATGGGGATTGTGAAGAATTGCAG
CGAACTGGACGGTTCTGTGGTGGACTAATTAAAGACATAAAGAGGAAAGCGCCATTTT
TTGCCAGTGATTTTTATGATGCTTTAAATATTCAAGCTCTTTCGGCAATTCTCTTCATTTAT
CTGGCAACTGTAACTAATGCTATCACTTTTGGAGGACTGCTTGGGGATGCCACTGACAA
CATGCAGGGCGTGTTGGAGAGTTTCCTGGGCACTGCTGTCTCTGGAGCCATCTTTTGCC
TTTTTGCTGGTCAACCACTCACTATTCTGAGCAGCACCGGACCTGTCCTAGTTTTTGAG
AGGCTTCTATTTAATTTCAGCAAGGACAATAATTTTGACTATTTGGAGTTTCGCCTTTGG
ATTGGCCTGTGGTCCGCCTTCCTATGTCTCATTTTGGTAGCCACTGATGCCAGCTTCTTG
GTTCAATACTTCACACGTTTCACGGAGGAGGGCTTTTCCTCTCTGATTAGCTTCATCTTT
ATCTATGATGCTTTCAAGAAGATGATCAAGCTTGCAGATTACTACCCCATCAACTCCAAC
TTCAAAGTGGGCTACAACACTCTCTTTTCCTGTACCTGTGTGCCACCTGACCCAGCTAA
TATCTCAATATCTAATGACACCACACTGGCCCCAGAGTATTTGCCAACTATGTCTTCTAC
TGACATGTACCATAATACTACCTTTGACTGGGCATTTTTGTCGAAGAAGGAGTGTTCAA
AATACGGAGGAAACCTCGTCGGGAACAACTGTAATTTTGTTCCTGATATCACACTCATG
TCTTTTATCCTCTTCTTGGGAACCTACACCTCTTCCATGGCTCTGAAAAAATTCAAAACT
AGTCCTTATTTTCCAACCACAGCAAGAAAACTGATCAGTGATTTTGCCATTATCTTGTCC
ATTCTCATCTTTTGTGTAATAGATGCCCTAGTAGGCGTGGACACCCCAAAACTAATTGTG
CCAAGTGAGTTCAAGCCAACAAGTCCAAACCGAGGTTGGTTCGTTCCACCGTTTGGAG
AAAACCCCTGGTGGGTGTGCCTTGCTGCTGCTATCCCGGCTTTGTTGGTCACTATACTG
ATTTTCATGGACCAACAAATTACAGCTGTGATTGTAAACAGGAAAGAACATAAACTCAA
GAAAGGAGCAGGGTATCACTTGGATCTCTTTTGGGTGGCCATCCTCATGGTTATATGCTC
CCTCATGGCTCTTCCGTGGTATGTAGCTGCTACGGTCATCTCCATTGCTCACATCGACAG
TTTGAAGATGGAGACAGAGACTTCTGCACCTGGAGAACAACCAAAGTTTCTAGGAGTG
AGGGAACAAAGAGTCACTGGAACCCTTGTGTTTATTCTGACTGGTCTGTCAGTCTTTAT
GGCTCCCATCTTGAAGTTTATACCCATGCCTGTACTCTATGGTGTGTTCCTGTATATGGGA
GTAGCATCCCTTAATGGTGTGCAGTTCATGGATCGTCTGAAGCTGCTTCTGATGCCTCTG
AAGCATCAGCCTGACTTCATCTACCTGCGTCATGTTCCTCTGCGCAGAGTCCACCTGTT
CACTTTCCTGCAGGTGTTGTGTCTGGCCCTGCTTTGGATCCTCAAGTCAACGGTGGCTG
CTATCATTTTTCCAGTAATGATCTTGGCACTTGTAGCTGTCAGAAAAGGCATGGACTACC
TCTTCTCCCAGCACGACCTCAGCTTCCTGGATGATGTCATTCCAGAAAAGGACAAGAA
AAAGAAGGAGGATGAGAAGAAAAAGAAAAAGAAGAAGGGAAGTCTGGACAGTGACA
ATGATGATTCTGACTGCCCATACTCAGAAAAAGTTCCAAGTATTAAAATTCCAATGGAC
ATCATGGAACAGCAACCTTTCCTAAGCGATAGCAAACCTTCTGACAGAGAAAGATCAC
CAACATTCCTTGAACGCCACACATCATGCTGATAAAATTCCTTTCCTTCAGTCACTCGGT
ATGCCAAGTCCTCCTAGAACTCCAGTAAAAGTTGTGCCTCAAATTAGAATAGAACTTGA
ACCTGAAGACAATGATTATTTCTGGAGGAGCAAGGGAACAGAAACTACATTGTAACCT
GTTTGTCTTTCTTAAAACTGACATTTGTTGTTAATGTCATTTGTTTTTGTTTGGCTGTTTG
TTTATTTTTTAACTTTTATTTCGTCTCAGTTTTTGGTCACAGGCCAAATAATACAGCGCTC
TCTCTGCTTCTCTCTTGCATAGACACAATCAAGACAATAGTGCACCGTTCCTTAAAAAC
AGCATCTGAGGAATCCCCCTTTTGTTCTTAAACTTTCAGATGTGTCCTTTGATAACCAAA
TTCTGTCACTCAAGACACAGACACGCACAGACCCTGTCCTTTGCCTCTATTAAGCAGAG
GATGGAAGTATTAAGGATTTTGTAACACCTTTTATGAAAATGTTGAAGGAACTTAAAAC
TTTAGCTTTGGAGCTGTGCTTACTGGCTTGTCTTTGTCTGGTAGAACAAACCTTGACCT
CCAGACAGAGTCCCTTCTCACTTATAGAGCTCTCCAGGACTGGAAAAAGTGCTGCTATT
TTAACTTGCTCTTGCTTGTAAATCCTAATCTTAGAGTTATCAAAAGAAGAAAAAACTGA
AGGTACTTTACTCCCTATAGAGAAACCATTGCCATCATTGTAGCAAGTGCTGGAATGTCC
CTTTTTTCCTATGCAACTTTTTTTAACCCTTTAATGAACTTATCTGTTGAGTACATTGAAG
AATATTTTTCTTCCTAGATTTTGTTGTTTAAATTATGGGGCCTAACCTGCCACTTATTTTTT
GTCAATTTTTAAAACTTTTTTTTAATTACTGTAAAGAAAATGAATTTTTTCCTGCAGCAG
GAAACATAGTTTTGAGTAGTTCTACCTCTTATTTGTAGCTGCCAGGCTTTCTGTAAAAAT
TGTATTGTATATAATGTGATTTTTACACATACATACACACACAAATACACAATCTCTAGGG
TAAGCCAGAAGGCAAGATCAGATTAAAAACACCATGTTTCTAAGCATCCATTTTTCCCT
TTCTTTAAAAGAAACTTAACTGTTCTATGAAGGAGATTGAGGGAGAAGAGACAAACTC
CTATGTCATGAGAATAACCGATGTTCTGATAATAGTAGCATCTAGGTACAGATGCTGGTT
GTATTACCACGTCAATGTCCTATGCAGTATTGTTAGACATTTTCTCATTTTGAAATATTTG
TGTGTTTGTGTATGTGCTCTGTGCCATGGCTGGTGTATATATGTGCAATGTTAGAAGGCA
AAAGAGTGATGGTAGGCAGAGGGCAAAGTCATTGAATCTCTTATGCCAGTTTTCATAAA
ACCCAAACCACATATGAAAAAATCCATTAAGGGTCCAAGAAGTCTGTCCATATGAAAAT
GAGGGTAAATATAGTTTATTTCCCAGGTATCAGTCATTATAATTGATATAATAGCTCTAAC
ATGCAATATAAAATTCATAGGAGTATTAATAGCCCATTTACACATCTATAAAATGTAATGG
GATTGCAGAGCTGCAGAGTACAGTGTAACAGTACTCTCATGCAATTTTTTTCAGGATGC
AAAGGCAATTATTCTTTGTAAGCGGGACATTTAGAATATATTTGTGTACATATTATATGTAT
GTATATTTCAAAGTACCACACTGAAAATTAGACATTTATTAACCAAATTTAACGTGGTAT
TTAAAGGTAATATTTTTAATATGATACATTACATATTGTGAATGTATACTAAAAAAACATTT
TAAATGTTAAAATTATAATTTCAGATTCATATAACCACAACTGTGATATATCCTAACTATAA
CCAGTTGTTGAGGGGTATACTAGAAGCAGAATGAAACCACATTTTTTGGTTTGATAATAT
GCACTTATTGACTCCCACTCATTGTTATGTTAATTAAGTTATTATTCTGTCTCCTTGTAATT
TTGATTACAAAAATTTTATTATCCTGAGTTAGCTGTTACTTTTACAGTACCTGATACTCCT
AAAACTTTTAACTTATACAAATTAGTCAATAATGACCCCAATTTTTTCATTAAAATAATAG
TGGTGAATTATATGTTATTGTGTTAAAACCTCACTTGCCAAATTCTGGCTTCACATTTGTA
TTTAGGGCTATCCTTAAAATGATGAGTCTATATTATCTAGCTTTCTATTACCCTAATATAAA
CTGGTATAAGAAGACTTTCCTTTTTTCTTTATGCATGGAAGCATCAATAAATTGTTTAAA
AACCATGTATAGTAAATTCAGCTTAACCCGTGATCTTCTTAAGTTAAAGGTACTTTTGTT
TTATAAAAGCTCTAGATAAAACTTTCTTTTCTGATCATGAATCAAGTATCTGTGGTTTCAT
GCCCCTCTCTATACCTTTCAAAGAACTCCTGAAGCAACTTAACTCATCATTTCAGCCTCT
GAGTAGAGGTAAAACCTATGTGTACTTCTGTTTATGATCCATATTGATATTTATGACATGA
ACACAGAATAGTACCTTACATTTGCTAAACAGACAGTTAATATCAAATCCTTTCAATATT
CTGGGAACCCAGGGAAGTTTTTAAAAATGTCATTACTTTCAAAGGAACAGAAGTAGTT
AACCAAACTAACAAGCAAAACCTGAGGTTTACCTAGTGACACCAAATTATCGGTATTTT
AACTGAATTTACCCATTGACTAAGAATGAACCAGATTTGGTGGTGGTTTTGTTTCTATGC
AAACTGGACACAAATTACAACAGTAAATTTTTTTATAAGTGCTTCTCCCTTCTCCATGAT
GTGACTTCCGGAGATAAAGGATTCAAAAGATAAAGACAAAGTACGCTCAGAGTTGTTA
ACCAGAAAGTCCTGGCTGTGGTTGCAGAAACACTGTTGGAAGAAAAGAGATGACTAA
GTCAAGTGTCTGCCTTATCAAAAGAGCAAAAATGCCTCTGGTTTTGTGTTTGGGAGAA
AAGTATCTTGGACGCACTGTTTTCCTTGATAAAAGTCATCTTCTCTACTGTGTGAAATGA
ATACTTGGAATTCTAATTGTTTTGTGTGCCAGGGGCAGTAATGTCCCTGCCTCTTCTCCC
AATCAAGGTTGAGGAGTGGGGCTGGGGAGAGGACTTAACTGACTTAAGAAGTAGGAA
AACAAAAACCTCTCTCCTCAGCCTTCCACCTCCAAGAGAGGAGGAAAAACAGTTGTCT
GCTGTCTGTAATTCAGTTTGCGTGTATTTTATGCTCATGCACCAACCCATACAGAGTAAA
TCTTTTATCAACTGTATACTGGTGTTTAATAGAGAATGATTGTCTTCCGAGTTTTTTGGTT
CCTTTTTTAACTGTGTTAAAGTACTTGAAATGTATTGACTGCTGACTATATTTTAAAAAC
AAAATGAAATAATTTGAGTTGTATTACAGAGGTTGACATTGTTCAGGGATGGGACAAAGCCTTCTTCAATCCTTTTCATACTACTTAATGATTTTGGTGCAGGAACCTGAGATTTTCTGATTTATATTTCATGATATTTCACATTTGCTCTTCACAGCATGAGCATGAAGCCCAGTGGCACCAAATGGCTGGGTACAATCAAGTGATATTTTGTAGCACCTCACTATCTGAAAGGCCATGAGTTTTCAGATGATTTCATTGAGCTTCATTGCAGCCTGAAATTTTAAAAAAGTTGTGTAATACGCCAACCAGTCAAGTTGTGTTTTGGCCAGAGATTTAGATATGTCCAATTTCCTGGCTCATTTCATTGTGCTCTATGGGTACGTATAAAAAGCAAGAATTCTGTTTCCTAGGCAAACATTGCAACTCAGGGCTAAAGTCATCCAGTGAAACTTTTAGAGCCAGAAGTAACTTTGTCCCAGTCCTACAATGTGAAAAGAGTGAATAGTTGCCTCTTTTTAGCCATTTTCATGGCTGGTACATATTCGTACGCATTACTTTTCAGAATCAATACGCACTTTCAGATATTCTTATTTTTATTCTCTTAAGTCTTTATTAACTTTGGAGAGAGAAATGATGCATCTTTTTATTTTAAATGAAGTAGATCAACATGGTGGAACAAAATGATAAAGAACAGAAAACATTTCAATATATTACTAATAACTTTTTCCAATATAAATCCTAAAATTCCTATAACATAGTATTTTACAGTTTTATGAAGCTTTCTATTGTGACTTTTATGGAATTAAGAGATGAAGAAGATGAGATATTTTAGCATTTATATTTTTCAAAATTATATGTATACTTAAAAATAAAGTAACTTTATGCA
SEQ ID NO:794SLC4A4的外显子2的翻译多肽序列
MEDEAVLDRGASFLKHVCDEEEVE
SEQ ID NO:795SLC4A4的外显子3的翻译多肽序列
HHTIYIGVHVPKSYRRRRRHKRKTGHKEKKEKERISENYSDKSDIENADESSSSILKPL
SEQ ID NO:796SLC4A4的外显子4的翻译多肽序列
SPAAERIRFILGEEDDSPAPPQLFTELDELLAVDGQEMEWKETA
SEQ ID NO:797SLC4A4的外显子5的翻译多肽序列
WIKFEEKVEQGGERWSKPHVATLSLHSLFELRTCMEKGSIMLDREASSLPQLV
SEQ ID NO:798SLC4A4的外显子6的翻译多肽序列
MIVDHQIETGLLKPELKDKVTYTLLRKHRHQTKKSNLRSLADIGKTVSSASRMFTNPDN
SEQ ID NO:799SLC4A4的外显子7的翻译多肽序列
SPAMTHRNLTSSSLNDISDKPEKDQ
SEQ ID NO:800SLC4A4的外显子8的翻译多肽序列
LKNKFMKKLPRDAEASNVLVGEVDFLDTPFIAFVRLQQAVMLGALTEVPVPT
SEQ ID NO:801SLC4A4的外显子9的翻译多肽序列
FLFILLGPKGKAKSYHEIGRAIATLMSDE
SEQ ID NO:802SLC4A4的外显子10的翻译多肽序列
VFHDIAYKAKDRHDLIAGIDEFLDEVIVLPPGEWDPAIRIEPPKSLPSSDK
SEQ ID NO:803SLC4A4的外显子11的翻译多肽序列
KNMYSGGENVQMNGDTPHDGGHGGGGHGDCEELQRTG
SEQ ID NO:804SLC4A4的外显子12的翻译多肽序列
FCGGLIKDIKRKAPFFASDFYDALNIQALSAILFIYLATVTNAITFGGLLGDATDNMQ
SEQ ID NO:805SLC4A4的外显子13的翻译多肽序列
GVLESFLGTAVSGAIFCLFAGQPLTILSSTGPVLVFERLLFNFS
SEQ ID NO:806SLC4A4的外显子14的翻译多肽序列
DNNFDYLEFRLWIGLWSAFLCLILVATDASFLVQYFTRFTEEGFSSLISFIFIYDAFKKMIKLADYYPINSNFKVGYNTLFSCTCVPPDP
SEQ ID NO:807SLC4A4的外显子15的翻译多肽序列
NISISNDTTLAPEYLPTMSSTDM
SEQ ID NO:808SLC4A4的外显子16的翻译多肽序列
YHNTTFDWAFLSKKECSKYGGNLVGNNCNFVPDITLMSFILFLGTYTSSMALKKFKTSPYFPTT
SEQ ID NO:809SLC4A4的外显子17的翻译多肽序列
ARKLISDFAIILSILIFCVIDALVGVDTPKLIVPSEFK
SEQ ID NO:810SLC4A4的外显子18的翻译多肽序列
PTSPNRGWFVPPFGENPWWVCLAAAIPALLVTILIFMDQQITAVIVNRKEHKLK
SEQ ID NO:811SLC4A4的外显子19的翻译多肽序列
KGAGYHLDLFWVAILMVICSLMALPWYVAATVISIAHIDSLKMETETSAPGEQPKFLGV
SEQ ID NO:812SLC4A4的外显子20的翻译多肽序列
EQRVTGTLVFILTGLSVFMAPILK
SEQ ID NO:813SLC4A4的外显子21的翻译多肽序列
FIPMPVLYGVFLYMGVASLNGVQ
SEQ ID NO:814SLC4A4的外显子22的翻译多肽序列
FMDRLKLLLMPLKHQPDFIYLRHVPLRRVHLFTFLQVLCLALLWILKSTVAAIIFPVM
SEQ ID NO:815SLC4A4的外显子23的翻译多肽序列
ILALVAVRKGMDYLFSQHDLSFLDDVIPEKDKKKKEDEKKKKKKKGSLDSDNDD
SEQ ID NO:816SLC4A4的外显子24的翻译多肽序列
SDCPYSEKVPSIKIPMDIMEQQPFLSDSKPSD
SEQ ID NO:817SLC4A4的外显子25的翻译多肽序列
ERSPTFLERHTSC
SEQ ID NO:819SLC4A4的全蛋白质序列
MEDEAVLDRGASFLKHVCDEEEVEGHHTIYIGVHVPKSYRRRRRHKRKTGHKEKKEKERISENYSDKSDIENADESSSSILKPLISPAAERIRFILGEEDDSPAPPQLFTELDELLAVDGQEMEWKETARWIKFEEKVEQGGERWSKPHVATLSLHSLFELRTCMEKGSIMLDREASSLPQLVEMIVDHQIETGLLKPELKDKVTYTLLRKHRHQTKKSNLRSLADIGKTVSSASRMFTNPDNGSPAMTHRNLTSSSLNDISDKPEKDQLKNKFMKKLPRDAEASNVLVGEVDFLDTPFIAFVRLQQAVMLGALTEVPVPTRFLFILLGPKGKAKSYHEIGRAIATLMSDEVFHDIAYKAKDRHDLIAGIDEFLDEVIVLPPGEWDPAIRIEPPKSLPSSDKRKNMYSGGENVQMNGDTPHDGGHGGGGHGDCEELQRTGRFCGGLIKDIKRKAPFFASDFYDALNIQALSAILFIYLATVTNAITFGGLLGDATDNMQGVLESFLGTAVSGAIFCLFAGQPLTILSSTGPVLVFERLLFNFSKDNNFDYLEFRLWIGLWSAFLCLILVATDASFLVQYFTRFTEEGFSSLISFIFIYDAFKKMIKLADYYPINSNFKVGYNTLFSCTCVPPDPANISISNDTTLAPEYLPTMSSTDMYHNTTFDWAFLSKKECSKYGGNLVGNNCNFVPDITLMSFILFLGTYTSSMALKKFKTSPYFPTTARKLISDFAIILSILIFCVIDALVGVDTPKLIVPSEFKPTSPNRGWFVPPFGENPWWVCLAAAIPALLVTILIFMDQQITAVIVNRKEHKLKKGAGYHLDLFWVAILMVICSLMALPWYVAATVISIAHIDSLKMETETSAPGEQPKFLGVREQRVTGTLVFILTGLSVFMAPILKFIPMPVLYGVFLYMGVASLNGVQFMDRLKLLLMPLKHQPDFIYLRHVPLRRVHLFTFLQVLCLALLWILKSTVAAIIFPVMILALVAVRKGMDYLFSQHDLSFLDDVIPEKDKKKKEDEKKKKKKKGSLDSDNDDSDCPYSEKVPSIKIPMDIMEQQPFLSDSKPSDRERSPTFLERHTSC
SEQ ID NO:820SLC4A4的全部外显子1-14按顺序排列的多核苷酸序列
SEQ ID NO:821SLC4A4的全部外显子1-14按顺序排列的翻译多肽序列
SDC4(2)序列信息
SEQ ID NO:822来自SDC4-NRG1融合物5’处的SDC4外显子4的序列
ATGTGTCCAACAAGGTGTCAATGTCCAGCACTGTGCAGGGCAGCAACATCTTTGAGAGAACGGAGGTCCTGGCAG
SEQ ID NO:823SDC4-NRG1融合物3’处的NRG1外显子2序列
CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA
SEQ ID NO:824SDC4-NRG1多核苷酸序列
ATGTGTCCAACAAGGTGTCAATGTCCAGCACTGTGCAGGGCAGCAACATCTTTGAGAGAACGGAGGTCCTGGCAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA
SEQ ID NO:825SDC4-NRG1多肽序列
VSNKVSMSSTVQGSNIFERTEVLAALPPRLKEMKSQESAAGSKLVLRCE
SEQ ID NO:940SDC4的全部外显子1-4按顺序排列的多核苷酸序列
SEQ ID NO:941SDC4的全部外显子1-4按顺序排列的翻译多肽序列
ZFAT序列信息
SEQ ID NO:826来自ZFAT-NRG1融合物5’处的ZFAT外显子12的序列
ACAGGAAGCACCCTAATGAGGAGTATGCCAACGTGGGCACCGGGGAGCTGGCAGCGGAGGTGCTCATCCAGCAAG
SEQ ID NO:827ZFAT-NRG1融合物3’处的NRG1外显子6序列
CTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG
SEQ ID NO:828ZFAT-NRG1多核苷酸序列
ACAGGAAGCACCCTAATGAGGAGTATGCCAACGTGGGCACCGGGGAGCTGGCAGCGGAGGTGCTCATCCAGCAAGCTACATCTACATCCACCACTGGGACAAGCCATCTTGTAAAATGTGCGGAGAAGGAGAAAACTTTCTGTGTGAATG
SEQ ID NO:829ZFAT-NRG1多肽序列
RKHPNEEYANVGTGELAAEVLIQQATSTSTTGTSHLVKCAEKEKTFCVN
SEQ ID NO:830ZFAT的外显子1
ATCCGCCATGTTGGATGCCGCAGATTCGCCATAACCTCGCCGGCTCTTTTCTTAAAAAAATAAAAATAAAAAGCGAAGCGTCAGCAGGGCGCCCCGCCCCCTCGGTCGGCACGGGAGGGGGCCCGGAAGAGCCCGAGGCTTTTTTTTCCTCCGCGGTGGGGCGTTGCCATGGAGACGCGGGCGGCAG
SEQ ID NO:831ZFAT的外显子2
AAAACACGGCCATCTTTATGTGTAAATGTTGTAACCTCTTCTCACCAAATCAGTCGGAACTCCTCTCCCACGTTTCAGAGAAGCACATGGAAGAAGGGGTTAATGTTGATGAGATTATTATTCCCCTTAGGCCTCTGAGTACACCTGAACCCCCCAACTCAAGCAAAACCGGAGATGSEQ ID NO:832ZFAT的外显子3
AGTTTTTGGTCATGAAGAGGAAGAGAGGCAGGCCTAAGGGGTCCACGAAGAAGTCCAGCACAGAAGAGGAGCTGGCAGAAAACATCGTGAGTCCGACTGAGGACAGCCCGCTGGCTCCGGAGGAAGGGAACAGCCTGCCTCCAAGCAGCTTGGAGTGTAGCAAGTGCTGTCGGAAGTTCTCCAACACGCGCCAGCTGCGGAAGCACATCTGCATTATCGTGCTGAATTTGGGTGAGGAGGAAGGAGAAGCAG
SEQ ID NO:833ZFAT的外显子4
GTAACGAGTCTGACCTTGAACTAGAAAAGAAGTGTAAGGAAGATGATCGGGAAAAAGCCTCGAAAAGACCACGGTCACAGAAAACAGAGAAAGTCCAGAAGATCTCAGGAAAGGAGGCCAGACAGCTTTCTGGGGCGAAGAAACCCATCATAAGTGTGGTTTTAACTGCACACGAAGCAATTCCAG
SEQ ID NO:834ZFAT的外显子5
GTGCTACCAAGATTGTGCCAGTGGAGGCTGGGCCCCCTGAAACAGGAGCTACAAATTCTGAGACCACTTCAGCAGACCTGGTGCCTCGGAGAGGCTACCAGGAATACGCCATTCAGCAGACACCTTATGAGCAACCAATGAAGTCAAGCAG
SEQ ID NO:835ZFAT的外显子6
GCTAGGTCCCACTCAGCTCAAAATCTTCACTTGTGAATACTGCAACAAGGTCTTCAAGTTCAAGCACTCGCTGCAGGCCCACCTGAGGATCCACACCAATGAAAAGCCATACAAGTGCCCCCAGTGCAGCTATGCCAGTGCCATCAAGGCCAACCTCAATGTGCACCTGCGCAAGCACACTGGAGAGAAGTTCGCCTGCGACTATTGCTCGTTCACCTGCCTGAGCAAGGGCCACCTCAAGGTGCACATCGAGCGAGTGCACAAGAAGATCAAGCAGCACTGCCGCTTCTGCAAGAAGAAGTACTCTGACGTCAAGAACCTCATCAAGCACATCCGAGACGCGCATGACCCACAGGACAAGAAGGTCAAAGAGGCCTTGGACGAGCTCTGCCTGATGACGAGGGAGGGCAAGCGGCAGCTGCTCTATGACTGCCACATCTGTGAGCGCAAGTTCAAGAACGAGCTGGACCGTGACCGCCATATGCTGGTCCACGGAGACAAGTGGCCTTTTGCCTGTGAGCTCTGTGGCCATGGGGCCACCAAGTACCAGGCGCTGGAACTGCATGTCAGGAAGCACCCCTTCGTGTACGTCTGTGCCGTCTGCCGCAAGAAGTTCGTCAGCTCCATCAGGCTGCGCACCCACATCAAAGAGGTGCACGGGGCTGCCCAGGAGGCCTTGGTCTTCACCAGTTCCATCAACCAGAGCTTCTGCCTCCTGGAACCTGGTGGGGACATCCAGCAAGAAGCTCTGGGGGACCAGCTACAGCTGGTGGAAGAGGAGTTTGCCCTCCAGGGCGTGAATGCACTCAAGGAAGAGGCCTGTCCTGGGGACACTCAGCTGGAGGAGGGCCGGAAGGAGCCGGAGGCCCCTGGGGAAATGCCTGCCCCAGCTGTGCACCTGGCCTCCCCGCAGGCCGAAAGCACAGCCCTGCCACCCTGTGAGCTGGAAACCACCGTGGTCTCCTCCTCAGACCTGCATTCTCAAGAGGTGGTTTCAGATGATTTTTTGTTGAAAAATGATACCTCCTCCGCAGAGGCTCATGCTGCTCCTGAGAAGCCCCCAGACATGCAGCACAGAAGCTCAGTCCAGACGCAAGGTGAAGTGATCACACTACTGCTGTCCAAGGCCCAGAGTGCTGGGTCAGATCAGGAAAGCCATGGCGCCCAGAGCCCCCTAGGGGAAGGGCAGAACATGGCTGTGCTTTCAGCTGGTGACCCAGATCCCAGCAGGTGTCTCAGGTCAAACCCAGCTGAGGCCTCAGACCTCCTCCCTCCAGTAGCTGGTGGTGGGGACACCATCACACATCAGCCTGACTCTTGCAAAGCTGCCCCTGAGCACCGGTCAGGCATCACCGCTTTCATGAAGGTCCTGAACAGTTTACAGAAGAAGCAAATGAACACCAGCTTGTGTGAGCGGATCCGGAAGGTTTATGGAGACCTGGAGTGTGAATACTGTG
SEQ ID NO:836ZFAT的外显子7
GCAAACTTTTTTGGTACCAAGTGCATTTTGATATGCATGTCCGCACCCACACCCGGGAACATCTGTATTATTGCTCTCAGTGTCATTATTCTTCCATCACCAAAAACTGCCTTAAACGCCACGTAATTCAGAAACACAGTAACATCTTGCTGAAGTGTCCCACCGATGGCTGTGACTACTCAACTCCAGATAAATATAAGCTACAGGCACATCTTAAAGTTCACACAGCACTG
SEQ ID NO:837ZFAT的外显子8
GACAAAAGGAGTTATTCTTGTCCTGTTTGTGAAAAGTCTTTTTCAGAGGATCGATTGATAAAGTCACATATCAAGACCAACCATCCTG
SEQ ID NO:838ZFAT的外显子9
AGGTCTCCATGAGCACCATTTCTGAGGTTCTCGGGAGGAGGGTTCAGCTGAAAGGGCTAATTGGAAAGAGAGCCATGAAATGCCCATATTGTGACTTTTATTTCATGAAGAATGGCTCAGACCTTCAGCGTCATATTTGGGCTCATGAAG
SEQ ID NO:839ZFAT的外显子10
GTGTGAAGCCCTTCAAGTGTTCTTTGTGTGAGTATGCAACTCGTAGCAAGAGTAACCTCAAGGCTCATATGAATCGTCACAGCACTGAGAAAACCCACCTATGTGACATGTGTGGCAAGAAATTCAAATCAAAAGGGACACTGAAAAGTCACAAACTCCTTCACACTGCAGATG
SEQ ID NO:840ZFAT的外显子11
GGAAGCAGTTTAAGTGCACGGTGTGTGACTACACAGCGGCCCAGAAGCCACAGCTGCTGCGGCACATGGAACAGCATGTCTCCTTCAAG
SEQ ID NO:841ZFAT的外显子12
CCTTTCCGCTGTGCCCATTGCCATTACTCCTGCAACATATCTGGCTCTCTGAAGCGGCACTACAACAGGAAGCACCCTAATGAGGAGTATGCCAACGTGGGCACCGGGGAGCTGGCAGCGGAGGTGCTCATCCAGCAAG
SEQ ID NO:842ZFAT的外显子13
GTGGTTTGAAGTGTCCTGTTTGCAGCTTTGTATATGGCACCAAATGGGAGTTCAATAGGCACTTGAAGAACAAACATGGCTTGAAGGTGGTGGAAATTGATGGAGACCCCAAGTGGGAG
SEQ ID NO:843ZFAT的外显子14
ACAGCAACAGAAGCTCCTGAGGAGCCCTCCACCCAGTATCTCCACATCACAGAGGCCGAAGAAGACGTTCAAGGGACACAGGCAGCGGTGGCCGCGCTCCAGGACCTGAGATACACCTCTGAGAGTG
SEQ ID NO:844ZFAT的外显子15
GCGACCGACTGGACCCCACGGCCGTGAACATCCTGCAGCAGATCATTGAGCTGGGCGCCGAGACCCATGACGCCACTGCCCTTGCCTCGGTGGTTGCCATGGCACCAGGGACGGTGACTGTGGTTAAGCAG
SEQ ID NO:845ZFAT的外显子16
GTCACCGAGGAGGAGCCCAGCTCCAACCACACGGTCATGATCCAGGAGACGGTCCAG
CAAGCGTCCGTGGAGCTTGCCGAGCAGCACCACCTGGTGGTGTCCTCCGACGACGTGG
AGGGCATTGAGACGGTGACTGTCTACACGCAGGGCGGGGAGGCCTCGGAGTTCATCGT
CTACGTGCAGGAGGCCATGCAGCCTGTGGAGGAGCAGGCTGTGGAGCAGCCGGCCCA
GGAACTCTAGAGGACATGTGGCATCGGATGGCCACAGGGCGGGGCTGCCAGGCTCTGC
AGGCACCCAGGGTGGGGAGGCCACCCTTCCTGCCCTACCCGCAGAATGGTGCTCTCCT
TTGCCCTCCCTGCCCAGCAGCCTGATAGGACTCTCCTAGTCCAACTTGGGGTGGGCAA
GGCAGTCAGCATCACCAGCAATACCACAGGACCCTCACCCCAGCATAGACACACACCC
CCTGACCCTTACCATCTGCTTCCTGAAAGACTTCAGTGTCAGCTCCCCTACACACACCC
CACACCTTCACCCCTTGCTTCAAGATTCAAACAGAGACTCCCAGTCCCCCTCAGCATCT
TCCCTGAATCACAGCCCCAGCTCCTTGACCCCCATCTAGGTGCCAAATGTTCATCTGCA
ACCGCTATGCAGTCTGGTGAGAGGGAGACAGCCATCACATAGAAAGTGACCGTACGGG
TTTTTAATCACTGCTGGGTGGGGTGGGGGTAGGGGGATTGTCCTGGCTTTGTCGACAAA
GTCCCACTTCCCCGAGTATTAAGGGCCCTTGGTATCAAGTGAGGTAAATTCACCCATCA
CAGGGTCTCGCCCTACCATCCTGGAATTATTTCACTTTTAAGATAAATGCACTATTTCACT
GTTCGCCTCCCATTCTAAGGAGGTGAGGTGGTTGGAATAAAAACAGTTCCTGTCTGAASEQ ID NO:846ZFAT的全mRNA多核苷酸序列
ATCCGCCATGTTGGATGCCGCAGATTCGCCATAACCTCGCCGGCTCTTTTCTTAAAAAA
ATAAAAATAAAAAGCGAAGCGTCAGCAGGGCGCCCCGCCCCCTCGGTCGGCACGGGA
GGGGGCCCGGAAGAGCCCGAGGCTTTTTTTTCCTCCGCGGTGGGGCGTTGCCATGGAG
ACGCGGGCGGCAGAAAACACGGCCATCTTTATGTGTAAATGTTGTAACCTCTTCTCACC
AAATCAGTCGGAACTCCTCTCCCACGTTTCAGAGAAGCACATGGAAGAAGGGGTTAAT
GTTGATGAGATTATTATTCCCCTTAGGCCTCTGAGTACACCTGAACCCCCCAACTCAAGC
AAAACCGGAGATGAGTTTTTGGTCATGAAGAGGAAGAGAGGCAGGCCTAAGGGGTCC
ACGAAGAAGTCCAGCACAGAAGAGGAGCTGGCAGAAAACATCGTGAGTCCGACTGAG
GACAGCCCGCTGGCTCCGGAGGAAGGGAACAGCCTGCCTCCAAGCAGCTTGGAGTGT
AGCAAGTGCTGTCGGAAGTTCTCCAACACGCGCCAGCTGCGGAAGCACATCTGCATTA
TCGTGCTGAATTTGGGTGAGGAGGAAGGAGAAGCAGGTAACGAGTCTGACCTTGAAC
TAGAAAAGAAGTGTAAGGAAGATGATCGGGAAAAAGCCTCGAAAAGACCACGGTCAC
AGAAAACAGAGAAAGTCCAGAAGATCTCAGGAAAGGAGGCCAGACAGCTTTCTGGGG
CGAAGAAACCCATCATAAGTGTGGTTTTAACTGCACACGAAGCAATTCCAGGTGCTACC
AAGATTGTGCCAGTGGAGGCTGGGCCCCCTGAAACAGGAGCTACAAATTCTGAGACCA
CTTCAGCAGACCTGGTGCCTCGGAGAGGCTACCAGGAATACGCCATTCAGCAGACACC
TTATGAGCAACCAATGAAGTCAAGCAGGCTAGGTCCCACTCAGCTCAAAATCTTCACTT
GTGAATACTGCAACAAGGTCTTCAAGTTCAAGCACTCGCTGCAGGCCCACCTGAGGAT
CCACACCAATGAAAAGCCATACAAGTGCCCCCAGTGCAGCTATGCCAGTGCCATCAAG
GCCAACCTCAATGTGCACCTGCGCAAGCACACTGGAGAGAAGTTCGCCTGCGACTATT
GCTCGTTCACCTGCCTGAGCAAGGGCCACCTCAAGGTGCACATCGAGCGAGTGCACAA
GAAGATCAAGCAGCACTGCCGCTTCTGCAAGAAGAAGTACTCTGACGTCAAGAACCTC
ATCAAGCACATCCGAGACGCGCATGACCCACAGGACAAGAAGGTCAAAGAGGCCTTG
GACGAGCTCTGCCTGATGACGAGGGAGGGCAAGCGGCAGCTGCTCTATGACTGCCACA
TCTGTGAGCGCAAGTTCAAGAACGAGCTGGACCGTGACCGCCATATGCTGGTCCACGG
AGACAAGTGGCCTTTTGCCTGTGAGCTCTGTGGCCATGGGGCCACCAAGTACCAGGCG
CTGGAACTGCATGTCAGGAAGCACCCCTTCGTGTACGTCTGTGCCGTCTGCCGCAAGA
AGTTCGTCAGCTCCATCAGGCTGCGCACCCACATCAAAGAGGTGCACGGGGCTGCCCA
GGAGGCCTTGGTCTTCACCAGTTCCATCAACCAGAGCTTCTGCCTCCTGGAACCTGGTG
GGGACATCCAGCAAGAAGCTCTGGGGGACCAGCTACAGCTGGTGGAAGAGGAGTTTG
CCCTCCAGGGCGTGAATGCACTCAAGGAAGAGGCCTGTCCTGGGGACACTCAGCTGG
AGGAGGGCCGGAAGGAGCCGGAGGCCCCTGGGGAAATGCCTGCCCCAGCTGTGCACC
TGGCCTCCCCGCAGGCCGAAAGCACAGCCCTGCCACCCTGTGAGCTGGAAACCACCGT
GGTCTCCTCCTCAGACCTGCATTCTCAAGAGGTGGTTTCAGATGATTTTTTGTTGAAAA
ATGATACCTCCTCCGCAGAGGCTCATGCTGCTCCTGAGAAGCCCCCAGACATGCAGCAC
AGAAGCTCAGTCCAGACGCAAGGTGAAGTGATCACACTACTGCTGTCCAAGGCCCAGAGTGCTGGGTCAGATCAGGAAAGCCATGGCGCCCAGAGCCCCCTAGGGGAAGGGCAGAACATGGCTGTGCTTTCAGCTGGTGACCCAGATCCCAGCAGGTGTCTCAGGTCAAACCCAGCTGAGGCCTCAGACCTCCTCCCTCCAGTAGCTGGTGGTGGGGACACCATCACACATCAGCCTGACTCTTGCAAAGCTGCCCCTGAGCACCGGTCAGGCATCACCGCTTTCATGAAGGTCCTGAACAGTTTACAGAAGAAGCAAATGAACACCAGCTTGTGTGAGCGGATCCGGAAGGTTTATGGAGACCTGGAGTGTGAATACTGTGGCAAACTTTTTTGGTACCAAGTGCATTTTGATATGCATGTCCGCACCCACACCCGGGAACATCTGTATTATTGCTCTCAGTGTCATTATTCTTCCATCACCAAAAACTGCCTTAAACGCCACGTAATTCAGAAACACAGTAACATCTTGCTGAAGTGTCCCACCGATGGCTGTGACTACTCAACTCCAGATAAATATAAGCTACAGGCACATCTTAAAGTTCACACAGCACTGGACAAAAGGAGTTATTCTTGTCCTGTTTGTGAAAAGTCTTTTTCAGAGGATCGATTGATAAAGTCACATATCAAGACCAACCATCCTGAGGTCTCCATGAGCACCATTTCTGAGGTTCTCGGGAGGAGGGTTCAGCTGAAAGGGCTAATTGGAAAGAGAGCCATGAAATGCCCATATTGTGACTTTTATTTCATGAAGAATGGCTCAGACCTTCAGCGTCATATTTGGGCTCATGAAGGTGTGAAGCCCTTCAAGTGTTCTTTGTGTGAGTATGCAACTCGTAGCAAGAGTAACCTCAAGGCTCATATGAATCGTCACAGCACTGAGAAAACCCACCTATGTGACATGTGTGGCAAGAAATTCAAATCAAAAGGGACACTGAAAAGTCACAAACTCCTTCACACTGCAGATGGGAAGCAGTTTAAGTGCACGGTGTGTGACTACACAGCGGCCCAGAAGCCACAGCTGCTGCGGCACATGGAACAGCATGTCTCCTTCAAGCCTTTCCGCTGTGCCCATTGCCATTACTCCTGCAACATATCTGGCTCTCTGAAGCGGCACTACAACAGGAAGCACCCTAATGAGGAGTATGCCAACGTGGGCACCGGGGAGCTGGCAGCGGAGGTGCTCATCCAGCAAGGTGGTTTGAAGTGTCCTGTTTGCAGCTTTGTATATGGCACCAAATGGGAGTTCAATAGGCACTTGAAGAACAAACATGGCTTGAAGGTGGTGGAAATTGATGGAGACCCCAAGTGGGAGACAGCAACAGAAGCTCCTGAGGAGCCCTCCACCCAGTATCTCCACATCACAGAGGCCGAAGAAGACGTTCAAGGGACACAGGCAGCGGTGGCCGCGCTCCAGGACCTGAGATACACCTCTGAGAGTGGCGACCGACTGGACCCCACGGCCGTGAACATCCTGCAGCAGATCATTGAGCTGGGCGCCGAGACCCATGACGCCACTGCCCTTGCCTCGGTGGTTGCCATGGCACCAGGGACGGTGACTGTGGTTAAGCAGGTCACCGAGGAGGAGCCCAGCTCCAACCACACGGTCATGATCCAGGAGACGGTCCAGCAAGCGTCCGTGGAGCTTGCCGAGCAGCACCACCTGGTGGTGTCCTCCGACGACGTGGAGGGCATTGAGACGGTGACTGTCTACACGCAGGGCGGGGAGGCCTCGGAGTTCATCGTCTACGTGCAGGAGGCCATGCAGCCTGTGGAGGAGCAGGCTGTGGAGCAGCCGGCCCAGGAACTCTAGAGGACATGTGGCATCGGATGGCCACAGGGCGGGGCTGCCAGGCTCTGCAGGCACCCAGGGTGGGGAGGCCACCCTTCCTGCCCTACCCGCAGAATGGTGCTCTCCTTTGCCCTCCCTGCCCAGCAGCCTGATAGGACTCTCCTAGTCCAACTTGGGGTGGGCAAGGCAGTCAGCATCACCAGCAATACCACAGGACCCTCACCCCAGCATAGACACACACCCCCTGACCCTTACCATCTGCTTCCTGAAAGACTTCAGTGTCAGCTCCCCTACACACACCCCACACCTTCACCCCTTGCTTCAAGATTCAAACAGAGACTCCCAGTCCCCCTCAGCATCTTCCCTGAATCACAGCCCCAGCTCCTTGACCCCCATCTAGGTGCCAAATGTTCATCTGCAACCGCTATGCAGTCTGGTGAGAGGGAGACAGCCATCACATAGAAAGTGACCGTACGGGTTTTTAATCACTGCTGGGTGGGGTGGGGGTAGGGGGATTGTCCTGGCTTTGTCGACAAAGTCCCACTTCCCCGAGTATTAAGGGCCCTTGGTATCAAGTGAGGTAAATTCACCCATCACAGGGTCTCGCCCTACCATCCTGGAATTATTTCACTTTTAAGATAAATGCACTATTTCACTGTTCGCCTCCCATTCTAAGGAGGTGAGGTGGTTGGAATAAAAACAGTTCCTGTCTGAA
SEQ ID NO:847ZFAT的外显子1的翻译多肽序列
METRA
SEQ ID NO:848ZFAT的外显子2的翻译多肽序列
NTAIFMCKCCNLFSPNQSELLSHVSEKHMEEGVNVDEIIIPLRPLSTPEPPNSSKTGD
SEQ ID NO:849ZFAT的外显子3的翻译多肽序列
FLVMKRKRGRPKGSTKKSSTEEELAENIVSPTEDSPLAPEEGNSLPPSSLECSKCCRKFSNTRQLRKHICIIVLNLGEEEGEA
SEQ ID NO:850ZFAT的外显子4的翻译多肽序列
NESDLELEKKCKEDDREKASKRPRSQKTEKVQKISGKEARQLSGAKKPIISVVLTAHEAIP
SEQ ID NO:851ZFAT的外显子5的翻译多肽序列
ATKIVPVEAGPPETGATNSETTSADLVPRRGYQEYAIQQTPYEQPMKSS
SEQ ID NO:852ZFAT的外显子6的翻译多肽序列
LGPTQLKIFTCEYCNKVFKFKHSLQAHLRIHTNEKPYKCPQCSYASAIKANLNVHLRKHTGEKFACDYCSFTCLSKGHLKVHIERVHKKIKQHCRFCKKKYSDVKNLIKHIRDAHDPQDKKVKEALDELCLMTREGKRQLLYDCHICERKFKNELDRDRHMLVHGDKWPFACELCGHGATKYQALELHVRKHPFVYVCAVCRKKFVSSIRLRTHIKEVHGAAQEALVFTSSINQSFCLLEPGGDIQQEALGDQLQLVEEEFALQGVNALKEEACPGDTQLEEGRKEPEAPGEMPAPAVHLASPQAESTALPPCELETTVVSSSDLHSQEVVSDDFLLKNDTSSAEAHAAPEKPPDMQHRSSVQTQGEVITLLLSKAQSAGSDQESHGAQSPLGEGQNMAVLSAGDPDPSRCLRSNPAEASDLLPPVAGGGDTITHQPDSCKAAPEHRSGITAFMKVLNSLQKKQMNTSLCERIRKVYGDLECEYC
SEQ ID NO:853ZFAT的外显子7的翻译多肽序列
KLFWYQVHFDMHVRTHTREHLYYCSQCHYSSITKNCLKRHVIQKHSNILLKCPTDGCDYSTPDKYKLQAHLKVHTAL
SEQ ID NO:854ZFAT的外显子8的翻译多肽序列
DKRSYSCPVCEKSFSEDRLIKSHIKTNHP
SEQ ID NO:855ZFAT的外显子9的翻译多肽序列
VSMSTISEVLGRRVQLKGLIGKRAMKCPYCDFYFMKNGSDLQRHIWAHE
SEQ ID NO:856ZFAT的外显子10的翻译多肽序列
VKPFKCSLCEYATRSKSNLKAHMNRHSTEKTHLCDMCGKKFKSKGTLKSHKLLHTAD
SEQ ID NO:857ZFAT的外显子11的翻译多肽序列
KQFKCTVCDYTAAQKPQLLRHMEQHVSFK
SEQ ID NO:858ZFAT的外显子12的翻译多肽序列
PFRCAHCHYSCNISGSLKRHYNRKHPNEEYANVGTGELAAEVLIQQ
SEQ ID NO:859ZFAT的外显子13的翻译多肽序列
GLKCPVCSFVYGTKWEFNRHLKNKHGLKVVEIDGDPKWE
SEQ ID NO:860ZFAT的外显子14的翻译多肽序列
TATEAPEEPSTQYLHITEAEEDVQGTQAAVAALQDLRYTSES
SEQ ID NO:861ZFAT的外显子15的翻译多肽序列
DRLDPTAVNILQQIIELGAETHDATALASVVAMAPGTVTVVKQ
SEQ ID NO:862ZFAT的外显子16的翻译多肽序列
VTEEEPSSNHTVMIQETVQQASVELAEQHHLVVSSDDVEGIETVTVYTQGGEASEFIVYVQEAMQPVEEQAVEQPAQEL
SEQ ID NO:863ZFAT的全蛋白质序列
METRAAENTAIFMCKCCNLFSPNQSELLSHVSEKHMEEGVNVDEIIIPLRPLSTPEPPNSSKTGDEFLVMKRKRGRPKGSTKKSSTEEELAENIVSPTEDSPLAPEEGNSLPPSSLECSKCCRKFSNTRQLRKHICIIVLNLGEEEGEAGNESDLELEKKCKEDDREKASKRPRSQKTEKVQKISGKEARQLSGAKKPIISVVLTAHEAIPGATKIVPVEAGPPETGATNSETTSADLVPRRGYQEYAIQQTPYEQPMKSSRLGPTQLKIFTCEYCNKVFKFKHSLQAHLRIHTNEKPYKCPQCSYASAIKANLNVHLRKHTGEKFACDYCSFTCLSKGHLKVHIERVHKKIKQHCRFCKKKYSDVKNLIKHIRDAHDPQDKKVKEALDELCLMTREGKRQLLYDCHICERKFKNELDRDRHMLVHGDKWPFACELCGHGATKYQALELHVRKHPFVYVCAVCRKKFVSSIRLRTHIKEVHGAAQEALVFTSSINQSFCLLEPGGDIQQEALGDQLQLVEEEFALQGVNALKEEACPGDTQLEEGRKEPEAPGEMPAPAVHLASPQAESTALPPCELETTVVSSSDLHSQEVVSDDFLLKNDTSSAEAHAAPEKPPDMQHRSSVQTQGEVITLLLSKAQSAGSDQESHGAQSPLGEGQNMAVLSAGDPDPSRCLRSNPAEASDLLPPVAGGGDTITHQPDSCKAAPEHRSGITAFMKVLNSLQKKQMNTSLCERIRKVYGDLECEYCGKLFWYQVHFDMHVRTHTREHLYYCSQCHYSSITKNCLKRHVIQKHSNILLKCPTDGCDYSTPDKYKLQAHLKVHTALDKRSYSCPVCEKSFSEDRLIKSHIKTNHPEVSMSTISEVLGRRVQLKGLIGKRAMKCPYCDFYFMKNGSDLQRHIWAHEGVKPFKCSLCEYATRSKSNLKAHMNRHSTEKTHLCDMCGKKFKSKGTLKSHKLLHTADGKQFKCTVCDYTAAQKPQLLRHMEQHVSFKPFRCAHCHYSCNISGSLKRHYNRKHPNEEYANVGTGELAAEVLIQQGGLKCPVCSFVYGTKWEFNRHLKNKHGLKVVEIDGDPKWETATEAPEEPSTQYLHITEAEEDVQGTQAAVAALQDLRYTSESGDRLDPTAVNILQQIIELGAETHDATALASVVAMAPGTVTVVKQVTEEEPSSNHTVMIQETVQQASVELAEQHHLVVSSDDVEGIETVTVYTQGGEASEFIVYVQEAMQPVEEQAVEQPAQEL
SEQ ID NO:864ZFAT的全部外显子1-12按顺序排列的多核苷酸序列
SEQ ID NO:865ZFAT的全部外显子1-12按顺序排列的翻译多肽序列
DSCAML1序列信息
SEQ ID NO:866来自DSCAML1-NRG1融合物5’处的DSCAML1外显子3的序列
GCCTCATCCCCTCTTCAGTGCAGGAATATGTTAGCGTTGTATCTTGGGAGAAAGACACAGTCTCCATCATCCCAG
SEQ ID NO:867DSCAML1-NRG1融合物3’处的NRG1外显子2序列
CCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA
SEQ ID NO:868DSCAML1-NRG1多核苷酸序列
GCCTCATCCCCTCTTCAGTGCAGGAATATGTTAGCGTTGTATCTTGGGAGAAAGACACAGTCTCCATCATCCCAGCCTTGCCTCCCCGATTGAAAGAGATGAAAAGCCAGGAATCGGCTGCAGGTTCCAAACTAGTCCTTCGGTGTGAAA
SEQ ID NO:869DSCAML1-NRG1多肽序列
LIPSSVQEYVSVVSWEKDTVSIIPALPPRLKEMKSQESAAGSKLVLRCE
SEQ ID NO:870DSCAML1的外显子1
AGCCGAGCGCTGGGCTGAGGAGCAGAGAGAGCGGGGCGCCGAGTGCGGGCGGCTGGGAGCGCGCTGAGCGGGGGAGAGGCGCTGCCGCACGGCCGGCCACAGGACCACCTCCCCGGAGAATAGGGCCTCTTTATGGCATGTGGCTGGTAACTTTCCTCCTGCTCCTGGACTCTTTACACAAAG
SEQ ID NO:871DSCAML1的外显子2
CCCGCCCTGAAGATGTTGGCACCAGCCTCTACTTTGTAAATGACTCCTTGCAGCAGGTGACCTTTTCCAGCTCCGTGGGGGTGGTGGTGCCCTGCCCGGCCGCGGGCTCCCCCAGCGCGGCCCTTCGATGGTACCTGGCCACAGGGGACGACATCTACGACGTGCCGCACATCCGGCACGTCCACGCCAACGGGACGCTGCAGCTCTACCCCTTCTCCCCCTCCGCCTTCAATAGCTTTATCCACGACAATGACTACTTCTGCACCGCGGAGAACGCTGCCGGCAAGATCCGGAGCCCCAACATCCGCGTCAAAGCAG
SEQ ID NO:872DSCAML1的外显子3
TTTTCAGGGAACCCTACACCGTCCGGGTGGAGGATCAAAGGTCAATGCGTGGCAACGTGGCCGTCTTCAAGTGCCTCATCCCCTCTTCAGTGCAGGAATATGTTAGCGTTGTATCTTGGGAGAAAGACACAGTCTCCATCATCCCAG
SEQ ID NO:873DSCAML1的外显子4
AACACAGGTTTTTTATTACCTACCACGGCGGGCTGTACATCTCTGACGTACAGAAGGAGGACGCCCTCTCCACCTATCGCTGCATCACCAAGCACAAGTATAGCGGGGAGACCCGGCAGAGCAATGGGGCACGCCTCTCTGTGACAG
SEQ ID NO:874DSCAML1的外显子5
ACCCTGCTGAGTCGATCCCCACCATCCTGGATGGCTTCCACTCCCAGGAAGTGTGGGCCGGCCACACCGTGGAGCTGCCCTGCACCGCCTCGGGCTACCCTATCCCCGCCATCCGCTGGCTCAAGGATGGCCGGCCCCTCCCGGCTGACAGCCGCTGGACCAAGCGCATCACAGGGCTGACCATCAGCGACTTGCGGACCGAGGACAGCGGCACCTACATTTGTGAGGTCACCAACACCTTCGGTTCGGCAGAGGCCACAGGCATCCTCATGGTCATTG
SEQ ID NO:875DSCAML1的外显子6
ATCCCCTTCATGTGACCCTGACACCAAAGAAGCTGAAGACCGGCATTGGCAGCACGGTCATCCTCTCCTGTGCCCTGACGGGCTCCCCAGAGTTCACCATCCGCTGGTATCGCAACACGGAGCTGGTGCTGCCTGACGAGGCCATCTCCATCCGCGGGCTCAGCAACGAGACGCTGCTCATCACCTCGGCCCAGAAGAGCCATTCCGGGGCCTACCAGTGCTTCGCTACCCGCAAGGCCCAGACCGCCCAGGACTTTGCCATCATTGCACTTGAGG
SEQ ID NO:876DSCAML1的外显子7
ATGGCACGCCCCGCATCGTCTCGTCCTTCAGCGAGAAGGTGGTCAACCCCGGGGAGCAGTTCTCACTGATGTGTGCGGCCAAGGGCGCCCCGCCCCCCACGGTCACCTGGGCCCTCGACGATGAGCCCATCGTGCGGGATGGCAGCCACCGCACCAACCAGTACACCATGTCGGACGGCACCACCATCAGCCACATGAACGTCACAGGCCCCCAGATCCGCGACGGGGGCGTGTACCGGTGCACAGCGCGGAACTTGGTGGGCAGTGCTGAATATCAGGCGCGAATAAACGTAAGAG
SEQ ID NO:877DSCAML1的外显子8
GCCCACCCAGCATCCGGGCTATGCGGAACATCACAGCAGTCGCCGGGCGGGACACCCTTATCAACTGCAGGGTCATCGGCTATCCCTACTACTCCATCAAGTGGTACAAGGATGCCCTGCTGCTGCCAGACAACCACCGCCAGGTGGTGTTTGAGAATGGGACCCTCAAGCTGACTGACGTGCAGAAGGGCATGGATGAGGGGGAGTACCTGTGCAGTGTCCTCATCCAGCCCCAGCTCTCCATCAGCCAGAGCGTTCACGTAGCCGTCAAAG
SEQ ID NO:878DSCAML1的外显子9
TGCCCCCTCTGATCCAGCCCTTCGAATTCCCACCCGCCTCCATCGGCCAGCTGCTCTACATTCCCTGTGTGGTGTCCTCGGGGGACATGCCCATCCGTATCACCTGGAGGAAGGACGGACAGGTGATCATCTCAGGCTCGGGCGTGACCATCGAGAGCAAGGAATTCATGAGCTCCCTGCAGATCTCTAGCGTCTCCCTCAAGCACAACGGCAACTATACATGCATCGCCAGCAACGCAGCCGCCACCGTGAGCCGGGAGCGCCAGCTCATCGTGCGTG
SEQ ID NO:879DSCAML1的外显子10
TGCCCCCTCGATTTGTGGTGCAACCCAACAACCAGGATGGCATCTACGGCAAAGCTGGTGTGCTCAACTGCTCGGTGGACGGCTACCCCCCACCCAAGGTCATGTGGAAGCATGCCAAGG
SEQ ID NO:880DSCAML1的外显子11
GGAGCGGGAACCCCCAGCAGTACCACCCTGTGCCCCTCACTGGCCGCATCCAGATCCTGCCCAACAGCTCGCTGCTGATCCGCCACGTCCTAGAAGAGGACATCGGCTACTACCTCTGCCAGGCCAGCAACGGCGTAGGCACCGACATCAGCAAGTCCATGTTCCTCACAGTCAAGA
SEQ ID NO:881DSCAML1的外显子12
TCCCGGCCATGATCACTTCCCACCCCAACACCACCATCGCCATCAAGGGCCATGCGAAGGAGCTAAACTGCACGGCACGGGGTGAGCGGCCCATCATCATCCGCTGGGAGAAGGGGGACACAGTCATCGACCCTGACCGCGTCATGCGGTATGCCATCGCCACCAAGGACAACGGCGACGAGGTCGTCTCCACACTGAAG
SEQ ID NO:882DSCAML1的外显子13
CTCAAGCCCGCTGACCGTGGGGACTCTGTGTTCTTCAGCTGCCATGCCATCAACTCGTATGGGGAGGACCGGGGCTTGATCCAACTCACTGTGCAAG
SEQ ID NO:883DSCAML1的外显子14
AGCCCCCCGACCCCCCAGAGCTGGAGATCCGGGAGGTGAAGGCCCGGAGCATGAACCTGCGCTGGACCCAGCGATTCGACGGGAACAGCATCATCACGGGCTTCGACATTGAATACAAGAACAAATCAG
SEQ ID NO:884DSCAML1的外显子15
ATTCCTGGGACTTCAAGCAGTCCACACGCAACATCTCCCCCACCATCAACCAGGCCAACATTGTGGACTTGCACCCGGCATCTGTGTACAGCATCCGCATGTACTCTTTCAACAAGATTGGCCGCAGTGAACCAAGCAAGGAGCTCACCATCAGCACTGAGGAGGCCG
SEQ ID NO:885DSCAML1的外显子16
CTCCCGATGGGCCCCCCATGGATGTTACCTTGCAGCCAGTGACCTCACAGAGCATCCAGGTGACCTGGAAG
SEQ ID NO:886DSCAML1的外显子17
GCACCCAAGAAGGAGCTGCAGAACGGTGTCATCCGGGGCTACCAGATTGGCTACAGAGAGAACAGCCCCGGCAGCAACGGGCAGTACAGCATCGTGGAGATGAAGGCCACGGGGGACAGCGAGGTCTACACCCTGGACAACCTCAAGAAGTTCGCCCAGTATGGGGTGGTGGTCCAAGCCTTCAATCGGGCTGGCACGGGGCCCTCTTCCAGCGAGATCAATGCCACCACTCTGGAGGATG
SEQ ID NO:887DSCAML1的外显子18
TGCCCAGCCAGCCCCCTGAGAACGTCCGGGCCCTGTCCATCACTTCTGACGTGGCCGTCATCTCCTGGTCAGAGCCCCCGCGCAGCACCCTCAATGGCGTCCTCAAAGGCTATCGGGTCATCTTCTGGTCCCTCTATGTTGATGGGG
SEQ ID NO:888DSCAML1的外显子19
AGTGGGGCGAGATGCAGAACATCACCACCACGCGGGAGCGGGTGGAGCTGCGGGGCATGGAGAAGTTCACCAACTACAGCGTCCAGGTGCTGGCCTACACCCAGGCTGGGGACGGCGTACGCAGCAGTGTGCTCTACATCCAGACCAAGGAGGACG
SEQ ID NO:889DSCAML1的外显子20
TTCCAGGTCCCCCTGCTGGCATCAAAGCTGTCCCTTCATCAGCTAGCAGTGTGGTTGTGTCTTGGCTCCCCCCTACCAAGCCCAACGGGGTGATCCGCAAGTACACCATCTTCTGTTCCAGCCCCGGGTCTGGCCAGCCG
SEQ ID NO:890DSCAML1的外显子21
GCTCCCAGCGAGTACGAGACGAGTCCAGAGCAGCTCTTCTACCGGATCGCCCACCTAAACCGCGGTCAGCAGTATCTGCTGTGGGTGGCCGCCGTCACCTCTGCCGGCCGGGGCAACAGCAGCGAGAAGGTGACCATCGAGCCTGCTGGCAAGG
SEQ ID NO:891DSCAML1的外显子22
CCCCAGCAAAGATCATCTCCTTTGGGGGCACCGTGACAACACCTTGGATGAAAGATGTTCGGCTGCCTTGCAATTCAGTGGGAGATCCAGCCCCTGCTGTGAAGTGGACCAAGGACAG
SEQ ID NO:892DSCAML1的外显子23
TGAAGACTCGGCCATTCCAGTGTCCATGGATGGGCACCGGCTCATCCACACCAATGGCACACTGCTGCTGCGTGCAGTGAAGGCTGAGGACTCTGGCTACTACACGTGCACGGCCACCAACACTGGTGGCTTTGACACCATCATCGTCAACCTTCTGGTGCAAG
SEQ ID NO:893DSCAML1的外显子24
TTCCCCCGGACCAGCCCCGCCTCACTGTCTCCAAAACCTCAGCTTCGTCCATCACCCTGACCTGGATTCCAGGTGACAATGGGGGCAGCTCCATCCGAG
SEQ ID NO:894DSCAML1的外显子25
GCTTCGTGCTACAGTACTCGGTGGACAACAGCGAGGAGTGGAAGGATGTGTTCATCAGCTCCAGCGAGCGCTCCTTCAAGCTGGACAGCCTCAAGTGTGGCACGTGGTACAAGGTGAAGCTGGCAGCCAAGAACAGCGTGGGCTCTGGGCGCATCAGCGAGATCATCGAGGCCAAGACCCACGGGCGGG
SEQ ID NO:895DSCAML1的外显子26
AGCCCTCCTTCAGCAAAGACCAACACCTCTTCACCCACATCAACTCCACGCATGCTCGGCTTAACCTGCAGGGCTGGAACAATGGGGGCTGCCCTATCACAGCCATCGTTCTGGAGTACCGGCCCAAGGGGACCTGGGCCTGGCAGGGCCTCCGGGCCAACAGCTCCGGGGAGGTGTTTCTGACGGAACTGCGAGAGGCCACGTGGTACGAGCTGCGCATGAGGGCTTGCAACAGTGCGGGCTGCGGCAATGAAACAGCCCAGTTCGCCACCCTGGACTACGATGGCA
SEQ ID NO:896DSCAML1的外显子27
GCACCATTCCACCCATCAAGTCTGCTCAAGGTGAAGGGGATGATGTGAAGAAGCTGTTCACCATCGGCTGCCCTGTCATCCTGGCCACACTGGGGGTGGCACTGCTCTTCATCGTACGCAAGAAGAGGAAGGAGAAACGGCTGAAGCGACTCCGAG
SEQ ID NO:897DSCAML1的外显子28
ATGCAAAGAGTTTGGCAGAAATGTTGATAAG
SEQ ID NO:898DSCAML1的外显子29
CAAGAACAATAGAAGCTTTGACACCCCTGTGAAAGGGCCACCCCAGGGCCCACGGCTACACATTGACATCCCCAGGGTCCAGCTGCTCATCGAGGACAAAGAAGGCATCAAGCAACTGG
SEQ ID NO:899DSCAML1的外显子30
GAGATGACAAGGCCACCATCCCTGTGACAGATGCTGAGTTCAGCCAAGCTGTCAACCCACAGAGCTTCTGTACTGGCGTCTCCTTGCACCACCCAACCCTCATCCAGAGCACAGGACCCCTCATCGACATGTCTGACATCCGGCCAGGAACCA
SEQ ID NO:900DSCAML1的外显子31
ATCCAGTGTCCAGGAAGAATGTGAAGTCAGCCCACAGCACCCGGAACCGGTACTCAAGCCAGTGGACCCTGACCAAGTGCCAGGCCTCCACACCTGCCCGCACCCTCACCTCCGACTGGCGCACCGTGGGCTCCCAGCATGGTGTCACGGTCACTGAGAGTGACAGCTACAGTGCCAGCCTGTCCCAGGACACAG
SEQ ID NO:901DSCAML1的外显子32
ACAAAGGAAGGAACAGCATGGTGTCCACTGAGAGTGCCTCTTCCACCTACGAGGAGCTGGCCCGGGCCTATGAGCATGCCAAGCTGGAGGAGCAGCTGCAGCACGCCAAGTTTGAGATCACCGAGTGCTTCATCTCTGACAGTTCCTCTGACCAGATGACCACAGGCACCAACGAGAACGCCGACAGCATGACATCCATGAGCACACCCTCAGAGCCTGGCATCTGCCGCTTTACCGCCTCACCACCCAAGCCCCAGGATGCGGACCGGGGCAAAAACGTGGCTGTGCCCATCCCTCACCGGGCCAACAAGA
SEQ ID NO:902DSCAML1的外显子33
GTGACTACTGCAACCTGCCCCTGTATGCCAAGTCAGAGGCCTTCTTTCGAAAGGCAGATGGACGTGAGCCCTGCCCCGTGGTCCCACCCCGTGAGGCCTCCATCCGGAACCTGGCTCGAACCTACCACACCCAGGCTCGCCACCTGACCCTGGACCCTGCCAGCAAGTCCTTGGGCCTTCCCCACCCAGGGGCCCCCGCTGCCGCCTCCACAGCCACCTTACCTCAGAGGACTCTGGCCATGCCAGCCCCCCCAGCCGGCACAGCCCCCCCAGCCCCCGGCCCCACCCCTGCTGAGCCACCCACCGCCCCCAGCGCTGCCCCTCCGGCCCCCAGCACCGAGCCTCCACGAGCCGGGGGCCCACACACCAAAATGGGGGGCTCCAGGGACTCGCTTCTCGAGATGAGCACATCGGGGGTAGGGAGGTCTCAGAAGCAGGGGGCCGGGGCCTACTCCAAATCCTACACCCTGGTGTAGGGCCCGCAGGAAGAGCAGCCACGCCTGGACCGCGCCGCGCCGCAGCCCCACACGCCAGCTCGGCTGTTTTTCTGCATTATTTATATTCAACTGACAGACAAAAACCAACCAACGACAAAACAAAAACCCCCAATCATGAACGCCTGTACATAGAACTCTTTTGTACAAATGAAACTATTTTCTTCTTCTCCATGAAGCCAGGGCACAAAGAATTTGACAGTACAAGTCAAATCCCCCACCCCACAAAATATGTGTGGAGATATATATACATATATAGACAGACAGGAACGCGTCCACGAGCTATATATCTATATATTTCTCTCACCCTATTTTGAGACAGAGGCACAAAGACTCAGCAATTTTTTTCCCTCCTCCTCACCTTCCCCCCAGTCTAGGTGGTTTTGACAAAGACCAAAATCCCAACTCAGAGACACTGCATGCGATTTTACTGTTCCAAGAAAACCAGGAGTTGCTTCAATTTGCAGATGCTTATGTGTTAATACCTTTTTCTATGAAAAAAGACCCAGCGCCGTGTGCAATAAAGGTTATGTTTCTA
SEQ ID NO:903DSCAML1的全mRNA多核苷酸序列
AGCCGAGCGCTGGGCTGAGGAGCAGAGAGAGCGGGGCGCCGAGTGCGGGCGGCTGGGAGCGCGCTGAGCGGGGGAGAGGCGCTGCCGCACGGCCGGCCACAGGACCACCTCCCCGGAGAATAGGGCCTCTTTATGGCATGTGGCTGGTAACTTTCCTCCTGCTCCTGGACTCTTTACACAAAGCCCGCCCTGAAGATGTTGGCACCAGCCTCTACTTTGTAAATGACTCCTTGCAGCAGGTGACCTTTTCCAGCTCCGTGGGGGTGGTGGTGCCCTGCCCGGCCGCGGGCTCCCCCAGCGCGGCCCTTCGATGGTACCTGGCCACAGGGGACGACATCTACGACGTGCCGCACATCCGGCACGTCCACGCCAACGGGACGCTGCAGCTCTACCCCTTCTCCCCCTCCGCCTTCAATAGCTTTATCCACGACAATGACTACTTCTGCACCGCGGAGAACGCTGCCGGCAAGATCCGGAGCCCCAACATCCGCGTCAAAGCAGTTTTCAGGGAACCCTACACCGTCCGGGTGGAGGATCAAAGGTCAATGCGTGGCAACGTGGCCGTCTTCAAGTGCCTCATCCCCTCTTCAGTGCAGGAATATGTTAGCGTTGTATCTTGGGAGAAAGACACAGTCTCCATCATCCCAGAACACAGGTTTTTTATTACCTACCACGGCGGGCTGTACATCTCTGACGTACAGAAGGAGGACGCCCTCTCCACCTATCGCTGCATCACCAAGCACAAGTATAGCGGGGAGACCCGGCAGAGCAATGGGGCACGCCTCTCTGTGACAGACCCTGCTGAGTCGATCCCCACCATCCTGGATGGCTTCCACTCCCAGGAAGTGTGGGCCGGCCACACCGTGGAGCTGCCCTGCACCGCCTCGGGCTACCCTATCCCCGCCATCCGCTGGCTCAAGGATGGCCGGCCCC
TCCCGGCTGACAGCCGCTGGACCAAGCGCATCACAGGGCTGACCATCAGCGACTTGCG
GACCGAGGACAGCGGCACCTACATTTGTGAGGTCACCAACACCTTCGGTTCGGCAGAG
GCCACAGGCATCCTCATGGTCATTGATCCCCTTCATGTGACCCTGACACCAAAGAAGCT
GAAGACCGGCATTGGCAGCACGGTCATCCTCTCCTGTGCCCTGACGGGCTCCCCAGAG
TTCACCATCCGCTGGTATCGCAACACGGAGCTGGTGCTGCCTGACGAGGCCATCTCCAT
CCGCGGGCTCAGCAACGAGACGCTGCTCATCACCTCGGCCCAGAAGAGCCATTCCGGG
GCCTACCAGTGCTTCGCTACCCGCAAGGCCCAGACCGCCCAGGACTTTGCCATCATTGC
ACTTGAGGATGGCACGCCCCGCATCGTCTCGTCCTTCAGCGAGAAGGTGGTCAACCCC
GGGGAGCAGTTCTCACTGATGTGTGCGGCCAAGGGCGCCCCGCCCCCCACGGTCACCT
GGGCCCTCGACGATGAGCCCATCGTGCGGGATGGCAGCCACCGCACCAACCAGTACAC
CATGTCGGACGGCACCACCATCAGCCACATGAACGTCACAGGCCCCCAGATCCGCGAC
GGGGGCGTGTACCGGTGCACAGCGCGGAACTTGGTGGGCAGTGCTGAATATCAGGCGC
GAATAAACGTAAGAGGCCCACCCAGCATCCGGGCTATGCGGAACATCACAGCAGTCGC
CGGGCGGGACACCCTTATCAACTGCAGGGTCATCGGCTATCCCTACTACTCCATCAAGT
GGTACAAGGATGCCCTGCTGCTGCCAGACAACCACCGCCAGGTGGTGTTTGAGAATGG
GACCCTCAAGCTGACTGACGTGCAGAAGGGCATGGATGAGGGGGAGTACCTGTGCAG
TGTCCTCATCCAGCCCCAGCTCTCCATCAGCCAGAGCGTTCACGTAGCCGTCAAAGTGC
CCCCTCTGATCCAGCCCTTCGAATTCCCACCCGCCTCCATCGGCCAGCTGCTCTACATTC
CCTGTGTGGTGTCCTCGGGGGACATGCCCATCCGTATCACCTGGAGGAAGGACGGACA
GGTGATCATCTCAGGCTCGGGCGTGACCATCGAGAGCAAGGAATTCATGAGCTCCCTG
CAGATCTCTAGCGTCTCCCTCAAGCACAACGGCAACTATACATGCATCGCCAGCAACGC
AGCCGCCACCGTGAGCCGGGAGCGCCAGCTCATCGTGCGTGTGCCCCCTCGATTTGTG
GTGCAACCCAACAACCAGGATGGCATCTACGGCAAAGCTGGTGTGCTCAACTGCTCGG
TGGACGGCTACCCCCCACCCAAGGTCATGTGGAAGCATGCCAAGGGGAGCGGGAACC
CCCAGCAGTACCACCCTGTGCCCCTCACTGGCCGCATCCAGATCCTGCCCAACAGCTCG
CTGCTGATCCGCCACGTCCTAGAAGAGGACATCGGCTACTACCTCTGCCAGGCCAGCA
ACGGCGTAGGCACCGACATCAGCAAGTCCATGTTCCTCACAGTCAAGATCCCGGCCAT
GATCACTTCCCACCCCAACACCACCATCGCCATCAAGGGCCATGCGAAGGAGCTAAAC
TGCACGGCACGGGGTGAGCGGCCCATCATCATCCGCTGGGAGAAGGGGGACACAGTC
ATCGACCCTGACCGCGTCATGCGGTATGCCATCGCCACCAAGGACAACGGCGACGAGG
TCGTCTCCACACTGAAGCTCAAGCCCGCTGACCGTGGGGACTCTGTGTTCTTCAGCTG
CCATGCCATCAACTCGTATGGGGAGGACCGGGGCTTGATCCAACTCACTGTGCAAGAG
CCCCCCGACCCCCCAGAGCTGGAGATCCGGGAGGTGAAGGCCCGGAGCATGAACCTG
CGCTGGACCCAGCGATTCGACGGGAACAGCATCATCACGGGCTTCGACATTGAATACA
AGAACAAATCAGATTCCTGGGACTTCAAGCAGTCCACACGCAACATCTCCCCCACCAT
CAACCAGGCCAACATTGTGGACTTGCACCCGGCATCTGTGTACAGCATCCGCATGTACT
CTTTCAACAAGATTGGCCGCAGTGAACCAAGCAAGGAGCTCACCATCAGCACTGAGGA
GGCCGCTCCCGATGGGCCCCCCATGGATGTTACCTTGCAGCCAGTGACCTCACAGAGC
ATCCAGGTGACCTGGAAGGCACCCAAGAAGGAGCTGCAGAACGGTGTCATCCGGGGC
TACCAGATTGGCTACAGAGAGAACAGCCCCGGCAGCAACGGGCAGTACAGCATCGTGG
AGATGAAGGCCACGGGGGACAGCGAGGTCTACACCCTGGACAACCTCAAGAAGTTCG
CCCAGTATGGGGTGGTGGTCCAAGCCTTCAATCGGGCTGGCACGGGGCCCTCTTCCAG
CGAGATCAATGCCACCACTCTGGAGGATGTGCCCAGCCAGCCCCCTGAGAACGTCCGG
GCCCTGTCCATCACTTCTGACGTGGCCGTCATCTCCTGGTCAGAGCCCCCGCGCAGCAC
CCTCAATGGCGTCCTCAAAGGCTATCGGGTCATCTTCTGGTCCCTCTATGTTGATGGGGA
GTGGGGCGAGATGCAGAACATCACCACCACGCGGGAGCGGGTGGAGCTGCGGGGCAT
GGAGAAGTTCACCAACTACAGCGTCCAGGTGCTGGCCTACACCCAGGCTGGGGACGG
CGTACGCAGCAGTGTGCTCTACATCCAGACCAAGGAGGACGTTCCAGGTCCCCCTGCT
GGCATCAAAGCTGTCCCTTCATCAGCTAGCAGTGTGGTTGTGTCTTGGCTCCCCCCTAC
CAAGCCCAACGGGGTGATCCGCAAGTACACCATCTTCTGTTCCAGCCCCGGGTCTGGC
CAGCCGGCTCCCAGCGAGTACGAGACGAGTCCAGAGCAGCTCTTCTACCGGATCGCCC
ACCTAAACCGCGGTCAGCAGTATCTGCTGTGGGTGGCCGCCGTCACCTCTGCCGGCCGGGGCAACAGCAGCGAGAAGGTGACCATCGAGCCTGCTGGCAAGGCCCCAGCAAAGATCATCTCCTTTGGGGGCACCGTGACAACACCTTGGATGAAAGATGTTCGGCTGCCTTGCAATTCAGTGGGAGATCCAGCCCCTGCTGTGAAGTGGACCAAGGACAGTGAAGACTCGGCCATTCCAGTGTCCATGGATGGGCACCGGCTCATCCACACCAATGGCACACTGCTGCTGCGTGCAGTGAAGGCTGAGGACTCTGGCTACTACACGTGCACGGCCACCAACACTGGTGGCTTTGACACCATCATCGTCAACCTTCTGGTGCAAGTTCCCCCGGACCAGCCCCGCCTCACTGTCTCCAAAACCTCAGCTTCGTCCATCACCCTGACCTGGATTCCAGGTGACAATGGGGGCAGCTCCATCCGAGGCTTCGTGCTACAGTACTCGGTGGACAACAGCGAGGAGTGGAAGGATGTGTTCATCAGCTCCAGCGAGCGCTCCTTCAAGCTGGACAGCCTCAAGTGTGGCACGTGGTACAAGGTGAAGCTGGCAGCCAAGAACAGCGTGGGCTCTGGGCGCATCAGCGAGATCATCGAGGCCAAGACCCACGGGCGGGAGCCCTCCTTCAGCAAAGACCAACACCTCTTCACCCACATCAACTCCACGCATGCTCGGCTTAACCTGCAGGGCTGGAACAATGGGGGCTGCCCTATCACAGCCATCGTTCTGGAGTACCGGCCCAAGGGGACCTGGGCCTGGCAGGGCCTCCGGGCCAACAGCTCCGGGGAGGTGTTTCTGACGGAACTGCGAGAGGCCACGTGGTACGAGCTGCGCATGAGGGCTTGCAACAGTGCGGGCTGCGGCAATGAAACAGCCCAGTTCGCCACCCTGGACTACGATGGCAGCACCATTCCACCCATCAAGTCTGCTCAAGGTGAAGGGGATGATGTGAAGAAGCTGTTCACCATCGGCTGCCCTGTCATCCTGGCCACACTGGGGGTGGCACTGCTCTTCATCGTACGCAAGAAGAGGAAGGAGAAACGGCTGAAGCGACTCCGAGATGCAAAGAGTTTGGCAGAAATGTTGATAAGCAAGAACAATAGAAGCTTTGACACCCCTGTGAAAGGGCCACCCCAGGGCCCACGGCTACACATTGACATCCCCAGGGTCCAGCTGCTCATCGAGGACAAAGAAGGCATCAAGCAACTGGGAGATGACAAGGCCACCATCCCTGTGACAGATGCTGAGTTCAGCCAAGCTGTCAACCCACAGAGCTTCTGTACTGGCGTCTCCTTGCACCACCCAACCCTCATCCAGAGCACAGGACCCCTCATCGACATGTCTGACATCCGGCCAGGAACCAATCCAGTGTCCAGGAAGAATGTGAAGTCAGCCCACAGCACCCGGAACCGGTACTCAAGCCAGTGGACCCTGACCAAGTGCCAGGCCTCCACACCTGCCCGCACCCTCACCTCCGACTGGCGCACCGTGGGCTCCCAGCATGGTGTCACGGTCACTGAGAGTGACAGCTACAGTGCCAGCCTGTCCCAGGACACAGACAAAGGAAGGAACAGCATGGTGTCCACTGAGAGTGCCTCTTCCACCTACGAGGAGCTGGCCCGGGCCTATGAGCATGCCAAGCTGGAGGAGCAGCTGCAGCACGCCAAGTTTGAGATCACCGAGTGCTTCATCTCTGACAGTTCCTCTGACCAGATGACCACAGGCACCAACGAGAACGCCGACAGCATGACATCCATGAGCACACCCTCAGAGCCTGGCATCTGCCGCTTTACCGCCTCACCACCCAAGCCCCAGGATGCGGACCGGGGCAAAAACGTGGCTGTGCCCATCCCTCACCGGGCCAACAAGAGTGACTACTGCAACCTGCCCCTGTATGCCAAGTCAGAGGCCTTCTTTCGAAAGGCAGATGGACGTGAGCCCTGCCCCGTGGTCCCACCCCGTGAGGCCTCCATCCGGAACCTGGCTCGAACCTACCACACCCAGGCTCGCCACCTGACCCTGGACCCTGCCAGCAAGTCCTTGGGCCTTCCCCACCCAGGGGCCCCCGCTGCCGCCTCCACAGCCACCTTACCTCAGAGGACTCTGGCCATGCCAGCCCCCCCAGCCGGCACAGCCCCCCCAGCCCCCGGCCCCACCCCTGCTGAGCCACCCACCGCCCCCAGCGCTGCCCCTCCGGCCCCCAGCACCGAGCCTCCACGAGCCGGGGGCCCACACACCAAAATGGGGGGCTCCAGGGACTCGCTTCTCGAGATGAGCACATCGGGGGTAGGGAGGTCTCAGAAGCAGGGGGCCGGGGCCTACTCCAAATCCTACACCCTGGTGTAGGGCCCGCAGGAAGAGCAGCCACGCCTGGACCGCGCCGCGCCGCAGCCCCACACGCCAGCTCGGCTGTTTTTCTGCATTATTTATATTCAACTGACAGACAAAAACCAACCAACGACAAAACAAAAACCCCCAATCATGAACGCCTGTACATAGAACTCTTTTGTACAAATGAAACTATTTTCTTCTTCTCCATGAAGCCAGGGCACAAAGAATTTGACAGTACAAGTCAAATCCCCCACCCCACAAAATATGTGTGGAGATATATATACATATATAGACAGACAGGAACGCGTCCACGAGCTATATATCTATATATTTCTCTCACCCTATTTTGAGACAGAGGCACAAAGACTCAGCAATTTTTTTCCCTCCTCCTCACCTTCCCCCCAGTCTAGGTGGTTTTGACAAAGACCAAAATCCCAACTCAGAGACACTGCATGCGATTTTACTGTTCCAAGAAAACCAGGAGTTGCTTCAATTTGCAGATGCTTATGTGTTAATACCTTTTTCTATGAAAAAAGACCCAGCGCCGTGTGCAATAAAGGTTATGTTTCTA
SEQ ID NO:904DSCAML1的外显子1的翻译多肽序列
MWLVTFLLLLDSLHK
SEQ ID NO:905DSCAML1的外显子2的翻译多肽序列
RPEDVGTSLYFVNDSLQQVTFSSSVGVVVPCPAAGSPSAALRWYLATGDDIYDVPHIRHVHANGTLQLYPFSPSAFNSFIHDNDYFCTAENAAGKIRSPNIRVKA
SEQ ID NO:906DSCAML1的外显子3的翻译多肽序列
FREPYTVRVEDQRSMRGNVAVFKCLIPSSVQEYVSVVSWEKDTVSIIP
SEQ ID NO:907DSCAML1的外显子4的翻译多肽序列
HRFFITYHGGLYISDVQKEDALSTYRCITKHKYSGETRQSNGARLSVT
SEQ ID NO:908DSCAML1的外显子5的翻译多肽序列
PAESIPTILDGFHSQEVWAGHTVELPCTASGYPIPAIRWLKDGRPLPADSRWTKRITGLTISDLRTEDSGTYICEVTNTFGSAEATGILMVI
SEQ ID NO:909DSCAML1的外显子6的翻译多肽序列
PLHVTLTPKKLKTGIGSTVILSCALTGSPEFTIRWYRNTELVLPDEAISIRGLSNETLLITSAQKSHSGAYQCFATRKAQTAQDFAIIALE
SEQ ID NO:910DSCAML1的外显子7的翻译多肽序列
GTPRIVSSFSEKVVNPGEQFSLMCAAKGAPPPTVTWALDDEPIVRDGSHRTNQYTMSDGTTISHMNVTGPQIRDGGVYRCTARNLVGSAEYQARINVR
SEQ ID NO:911DSCAML1的外显子8的翻译多肽序列
PPSIRAMRNITAVAGRDTLINCRVIGYPYYSIKWYKDALLLPDNHRQVVFENGTLKLTDVQKGMDEGEYLCSVLIQPQLSISQSVHVAVK
SEQ ID NO:912DSCAML1的外显子9的翻译多肽序列
PPLIQPFEFPPASIGQLLYIPCVVSSGDMPIRITWRKDGQVIISGSGVTIESKEFMSSLQISSVSLKHNGNYTCIASNAAATVSRERQLIVR
SEQ ID NO:913DSCAML1的外显子10的翻译多肽序列
PPRFVVQPNNQDGIYGKAGVLNCSVDGYPPPKVMWKHAK
SEQ ID NO:914DSCAML1的外显子11的翻译多肽序列
SGNPQQYHPVPLTGRIQILPNSSLLIRHVLEEDIGYYLCQASNGVGTDISKSMFLTVK
SEQ ID NO:915DSCAML1的外显子12的翻译多肽序列
PAMITSHPNTTIAIKGHAKELNCTARGERPIIIRWEKGDTVIDPDRVMRYAIATKDNGDEVVSTLK
SEQ ID NO:916DSCAML1的外显子13的翻译多肽序列
LKPADRGDSVFFSCHAINSYGEDRGLIQLTVQ
SEQ ID NO:917DSCAML1的外显子14的翻译多肽序列
PPDPPELEIREVKARSMNLRWTQRFDGNSIITGFDIEYKNKS
SEQ ID NO:918DSCAML1的外显子15的翻译多肽序列
SWDFKQSTRNISPTINQANIVDLHPASVYSIRMYSFNKIGRSEPSKELTISTEEA
SEQ ID NO:919DSCAML1的外显子16的翻译多肽序列
PDGPPMDVTLQPVTSQSIQVTWK
SEQ ID NO:920DSCAML1的外显子17的翻译多肽序列
APKKELQNGVIRGYQIGYRENSPGSNGQYSIVEMKATGDSEVYTLDNLKKFAQYGVVVQAFNRAGTGPSSSEINATTLED
SEQ ID NO:921DSCAML1的外显子18的翻译多肽序列
PSQPPENVRALSITSDVAVISWSEPPRSTLNGVLKGYRVIFWSLYVDG
SEQ ID NO:922DSCAML1的外显子19的翻译多肽序列
WGEMQNITTTRERVELRGMEKFTNYSVQVLAYTQAGDGVRSSVLYIQTKED
SEQ ID NO:923DSCAML1的外显子20的翻译多肽序列
PGPPAGIKAVPSSASSVVVSWLPPTKPNGVIRKYTIFCSSPGSGQP
SEQ ID NO:924DSCAML1的外显子21的翻译多肽序列
APSEYETSPEQLFYRIAHLNRGQQYLLWVAAVTSAGRGNSSEKVTIEPAGK
SEQ ID NO:925DSCAML1的外显子22的翻译多肽序列
PAKIISFGGTVTTPWMKDVRLPCNSVGDPAPAVKWTKD
SEQ ID NO:926DSCAML1的外显子23的翻译多肽序列
EDSAIPVSMDGHRLIHTNGTLLLRAVKAEDSGYYTCTATNTGGFDTIIVNLLVQ
SEQ ID NO:927DSCAML1的外显子24的翻译多肽序列
PPDQPRLTVSKTSASSITLTWIPGDNGGSSIR
SEQ ID NO:928DSCAML1的外显子25的翻译多肽序列
FVLQYSVDNSEEWKDVFISSSERSFKLDSLKCGTWYKVKLAAKNSVGSGRISEIIEAKTHGR
SEQ ID NO:929DSCAML1的外显子26的翻译多肽序列
PSFSKDQHLFTHINSTHARLNLQGWNNGGCPITAIVLEYRPKGTWAWQGLRANSSGEVFLTELREATWYELRMRACNSAGCGNETAQFATLDYDG
SEQ ID NO:930DSCAML1的外显子27的翻译多肽序列
TIPPIKSAQGEGDDVKKLFTIGCPVILATLGVALLFIVRKKRKEKRLKRLR
SEQ ID NO:931DSCAML1的外显子28的翻译多肽序列
AKSLAEMLI
SEQ ID NO:932DSCAML1的外显子29的翻译多肽序列
KNNRSFDTPVKGPPQGPRLHIDIPRVQLLIEDKEGIKQL
SEQ ID NO:933DSCAML1的外显子30的翻译多肽序列
DDKATIPVTDAEFSQAVNPQSFCTGVSLHHPTLIQSTGPLIDMSDIRPGT
SEQ ID NO:934DSCAML1的外显子31的翻译多肽序列
PVSRKNVKSAHSTRNRYSSQWTLTKCQASTPARTLTSDWRTVGSQHGVTVTESDSYSASLSQDT
SEQ ID NO:935DSCAML1的外显子32的翻译多肽序列
KGRNSMVSTESASSTYEELARAYEHAKLEEQLQHAKFEITECFISDSSSDQMTTGTNENADSMTSMSTPSEPGICRFTASPPKPQDADRGKNVAVPIPHRANK
SEQ ID NO:936DSCAML1的外显子33的翻译多肽序列
DYCNLPLYAKSEAFFRKADGREPCPVVPPREASIRNLARTYHTQARHLTLDPASKSLGLPHPGAPAAASTATLPQRTLAMPAPPAGTAPPAPGPTPAEPPTAPSAAPPAPSTEPPRAGGPHTKMGGSRDSLLEMSTSGVGRSQKQGAGAYSKSYTLV
SEQ ID NO:937DSCAML1的全蛋白质序列
MWLVTFLLLLDSLHKARPEDVGTSLYFVNDSLQQVTFSSSVGVVVPCPAAGSPSAALRWYLATGDDIYDVPHIRHVHANGTLQLYPFSPSAFNSFIHDNDYFCTAENAAGKIRSPNIRVKAVFREPYTVRVEDQRSMRGNVAVFKCLIPSSVQEYVSVVSWEKDTVSIIPEHRFFITYHGGLYISDVQKEDALSTYRCITKHKYSGETRQSNGARLSVTDPAESIPTILDGFHSQEVWAGHTVELPCTASGYPIPAIRWLKDGRPLPADSRWTKRITGLTISDLRTEDSGTYICEVTNTFGSAEATGILMVIDPLHVTLTPKKLKTGIGSTVILSCALTGSPEFTIRWYRNTELVLPDEAISIRGLSNETLLITSAQKSHSGAYQCFATRKAQTAQDFAIIALEDGTPRIVSSFSEKVVNPGEQFSLMCAAKGAPPPTVTWALDDEPIVRDGSHRTNQYTMSDGTTISHMNVTGPQIRDGGVYRCTARNLVGSAEYQARINVRGPPSIRAMRNITAVAGRDTLINCRVIGYPYYSIKWYKDALLLPDNHRQVVFENGTLKLTDVQKGMDEGEYLCSVLIQPQLSISQSVHVAVKVPPLIQPFEFPPASIGQLLYIPCVVSSGDMPIRITWRKDGQVIISGSGVTIESKEFMSSLQISSVSLKHNGNYTCIASNAAATVSRERQLIVRVPPRFVVQPNNQDGIYGKAGVLNCSVDGYPPPKVMWKHAKGSGNPQQYHPVPLTGRIQILPNSSLLIRHVLEEDIGYYLCQASNGVGTDISKSMFLTVKIPAMITSHPNTTIAIKGHAKELNCTARGERPIIIRWEKGDTVIDPDRVMRYAIATKDNGDEVVSTLKLKPADRGDSVFFSCHAINSYGEDRGLIQLTVQEPPDPPELEIREVKARSMNLRWTQRFDGNSIITGFDIEYKNKSDSWDFKQSTRNISPTINQANIVDLHPASVYSIRMYSFNKIGRSEPSKELTISTEEAAPDGPPMDVTLQPVTSQSIQVTWKAPKKELQNGVIRGYQIGYRENSPGSNGQYSIVEMKATGDSEVYTLDNLKKFAQYGVVVQAFNRAGTGPSSSEINATTLEDVPSQPPENVRALSITSDVAVISWSEPPRSTLNGVLKGYRVIFWSLYVDGEWGEMQNITTTRERVELRGMEKFTNYSVQVLAYTQAGDGVRSSVLYIQTKEDVPGPPAGIKAVPSSASSVVVSWLPPTKPNGVIRKYTIFCSSPGSGQPAPSEYETSPEQLFYRIAHLNRGQQYLLWVAAVTSAGRGNSSEKVTIEPAGKAPAKIISFGGTVTTPWMKDVRLPCNSVGDPAPAVKWTKDSEDSAIPVSMDGHRLIHTNGTLLLRAVKAEDS
GYYTCTATNTGGFDTIIVNLLVQVPPDQPRLTVSKTSASSITLTWIPGDNGGSSIRGFVLQYS
VDNSEEWKDVFISSSERSFKLDSLKCGTWYKVKLAAKNSVGSGRISEIIEAKTHGREPSFSK
DQHLFTHINSTHARLNLQGWNNGGCPITAIVLEYRPKGTWAWQGLRANSSGEVFLTELRE
ATWYELRMRACNSAGCGNETAQFATLDYDGSTIPPIKSAQGEGDDVKKLFTIGCPVILATL
GVALLFIVRKKRKEKRLKRLRDAKSLAEMLISKNNRSFDTPVKGPPQGPRLHIDIPRVQLLI
EDKEGIKQLGDDKATIPVTDAEFSQAVNPQSFCTGVSLHHPTLIQSTGPLIDMSDIRPGTNPV
SRKNVKSAHSTRNRYSSQWTLTKCQASTPARTLTSDWRTVGSQHGVTVTESDSYSASLSQ
DTDKGRNSMVSTESASSTYEELARAYEHAKLEEQLQHAKFEITECFISDSSSDQMTTGTNE
NADSMTSMSTPSEPGICRFTASPPKPQDADRGKNVAVPIPHRANKSDYCNLPLYAKSEAFFR
KADGREPCPVVPPREASIRNLARTYHTQARHLTLDPASKSLGLPHPGAPAAASTATLPQRTL
AMPAPPAGTAPPAPGPTPAEPPTAPSAAPPAPSTEPPRAGGPHTKMGGSRDSLLEMSTSGVG
RSQKQGAGAYSKSYTLV
SEQ ID NO:938DSCAML1的全部外显子1-3按顺序排列的多核苷酸序列
SEQ ID NO:939DSCAML1的全部外显子1-3按顺序排列的翻译多肽序列。
Claims (61)
1.一种多核苷酸,包含:
-PVALB核酸序列或所述PVALB序列的等位基因变体,其与NRG1核酸序列或所述NRG1序列的等位基因变体融合,或
-ASPH核酸序列或所述ASPH序列的等位基因变体,其与NRG1核酸序列或所述NRG1序列的等位基因变体融合,或
-DAAM1核酸序列或所述DAAM1序列的等位基因变体,其与NRG1核酸序列或该NRG1序列的等位基因变体融合,或
-ZFAT核酸序列或所述ZFAT序列的等位基因变体,其与NRG1核酸序列或该NRG1序列的等位基因变体融合,或
-DACAML1核酸序列或所述DSCAML1序列的等位基因变体,其与NRG1核酸序列或该NRG1序列的等位基因变体融合。
2.根据权利要求1所述的多核苷酸,其中
-所述PVALB核酸序列包含SEQ ID NO:439-444中的任一者或由其组成,或包含SEQ IDNO:439-444中的任一者的等位基因变体或由其组成,并且所述NRG1核酸序列包含SEQ IDNO:125-138中的任一者或由其组成;
-所述DAAM1核酸序列包含SEQ ID NO:606-631中的任一者或由其组成,或包含SEQ IDNO:606-631中的任一者的等位基因变体或由其组成,并且所述NRG1核酸序列包含SEQ IDNO:125-138中的任一者或由其组成;
-所述ZFAT核酸序列包含SEQ ID NO:830-846中的任一者或由其组成,或包含SEQ IDNO:830-846中的任一者的等位基因变体或由其组成,并且所述NRG1核酸序列包含SEQ IDNO:125-138中的任一者或由其组成;或
-所述DSCAML1核酸序列包含SEQ ID NO:870-903中的任一者或由其组成,或包含SEQID NO:870-903中的任一者的等位基因变体或由其组成,并且所述NRG1核酸序列包含SEQID NO:125-138中的任一者或由其组成。
3.根据权利要求1或2所述的多核苷酸,其中所述PVALB、DAAM1、ZFAT或DSCAML1核酸序列(或其等位基因变体)位于NRG1核酸序列(或其等位基因变体)的5’端。
4.根据权利要求1至3中任一项所述的多核苷酸,其中
-所述PVALB核酸序列的等位基因变体与SEQ ID NO:439-444中的任一者有至少85%的一致性,优选地至少90%的一致性,更优选地至少95%的序列一致性;并且所述NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85%的一致性,优选地至少90%的一致性,更优选地至少95%的序列一致性;
-所述DAAM1核酸序列的等位基因变体与SEQ ID NO:606-631中的任一者有至少85%的一致性,优选地至少90%的一致性,更优选地至少95%的序列一致性;并且所述NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85%的一致性,优选地至少90%的一致性,更优选地至少95%的序列一致性;
-所述ZFAT核酸序列的等位基因变体与SEQ ID NO:830-846中的任一者有至少85%的一致性,优选地至少90%的一致性,更优选地至少95%的序列一致性;并且所述NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85%的一致性,优选地至少90%的一致性,更优选地至少95%的序列一致性;或
-所述DSCAML1核酸序列的等位基因变体与SEQ ID NO:870-903中的任一者有至少85%的一致性,优选地至少90%的一致性,更优选地至少95%的序列一致性;并且所述NRG1核酸序列的等位基因变体与SEQ ID NO:125-138中的任一者有至少85%的一致性,优选地至少90%的一致性,更优选地至少95%的序列一致性。
5.根据权利要求1至4中任一项所述的多核苷酸,其中
-所述PVALB核酸与所述NRG1核酸的融合物包含来自SEQ ID NO:437的2至约40个连续核酸,优选地包括位置102和103处的核酸;
-所述DAAM1核酸与所述NRG1核酸的融合物包含来自SEQ ID NO:605的2至约40个连续核酸,优选地包括位置75和76处的核酸;
-所述ZFAT核酸与所述NRG1核酸的融合物包含来自SEQ ID NO:828的2至约40个连续核酸,优选地包括位置75和76处的核酸;或
-所述DSCAML1核酸与所述NRG1核酸的融合物包含来自SEQ ID NO:868的2至约40个连续核酸,优选地包括位置75和76处的核酸。
6.根据权利要求1至5中任一项所述的多核苷酸,其中所述编码NRG1蛋白序列(或其等位基因变体)的核酸包含或编码NRG1的EGF样结构域,优选为根据SEQ ID NO:163的EGF样结构域。
7.一种多核苷酸,包含:
-VAPB的外显子1或外显子1的等位基因变体的一部分,其与NRG1的外显子2或外显子2的等位基因变体的一部分融合;
-CADM1的外显子7或外显子7的等位基因变体的一部分,其与NRG1的外显子6或外显子6的等位基因变体的一部分;
-CD44的外显子5或外显子5的等位基因变体的一部分,其与NRG1的外显子2或外显子2的等位基因变体的一部分;
-SLC3A2的转录本6的外显子1或外显子1的等位基因变体的一部分,其与NRG1的外显子5或外显子5的等位基因变体的一部分;
-VTCN1的外显子2或外显子2的等位基因变体的一部分,其与NRG1的外显子2或外显子2的等位基因变体的一部分;
-CDH1的外显子11或外显子11的等位基因变体的一部分,其与NRG1的外显子2或外显子2的等位基因变体的一部分;
-CXADR的外显子1或外显子1的等位基因变体的一部分,其与NRG1的外显子2或外显子2的等位基因变体的一部分;
-GTF2E2的外显子2或外显子1的等位基因变体的一部分,其与NRG1的外显子2或外显子2的等位基因变体的一部分;
-CSMD1的外显子23或外显子23的等位基因变体的一部分,其与NRG1的外显子6或外显子6的等位基因变体的一部分;
-PTN的外显子4或外显子4的等位基因变体的一部分,其与NRG1的外显子2或外显子2的等位基因变体的一部分;
-ST14的外显子11或外显子11的等位基因变体的一部分,其与NRG1的外显子6或外显子6的等位基因变体的一部分;
-THBS1的外显子9或外显子9的等位基因变体的一部分,其与NRG1的外显子6或外显子6的等位基因变体的一部分;
-AGRN的外显子12或外显子12的等位基因变体的一部分,其与NRG1的外显子6或外显子6的等位基因变体的一部分;
-PVALB的外显子4或外显子4的等位基因变体的一部分,其与NRG1的外显子6或外显子6的等位基因变体的一部分;
-SLC3A2的转录本3的外显子2或外显子2的等位基因变体的一部分,其与NRG1的外显子6或外显子6的等位基因变体的一部分;
-APP的外显子14或外显子14的等位基因变体的一部分,其与NRG1的外显子6或外显子6的等位基因变体的一部分;
-WRN的外显子33或外显子33的等位基因变体的一部分,其与NRG1的外显子6或外显子6的等位基因变体的一部分;
-DAAM1的外显子1或外显子1的等位基因变体的一部分,其与NRG1的外显子1或外显子1的等位基因变体的一部分;
-ASPH的外显子22或外显子22的等位基因变体的一部分,其与NRG1的外显子2或外显子2的等位基因变体的一部分;
-NOTCH2的外显子6或外显子6的等位基因变体的一部分,其与NRG1的外显子6或外显子6的等位基因变体的一部分;
-CD74的外显子2或外显子2的等位基因变体的一部分,其与NRG1的外显子2或外显子2的等位基因变体的一部分;
-SDC4的外显子2或外显子2的等位基因变体的一部分,其与NRG1的外显子2或外显子2的等位基因变体的一部分;
-CD44的外显子5或外显子5的等位基因变体的一部分,其与NRG1的外显子6或外显子6的等位基因变体的一部分;
-SLC4A4的外显子14或外显子14的等位基因变体的一部分,其与NRG1的外显子6或外显子6的等位基因变体的一部分;
-SDC4的外显子4或外显子4的等位基因变体的一部分,其与NRG1的外显子2或外显子2的等位基因变体的一部分;
-ZFAT的外显子12或外显子12的等位基因变体的一部分,其与NRG1的外显子6或外显子6的等位基因变体的一部分;或
-DSCAML1的外显子3或外显子3的等位基因变体的一部分,其与NRG1的外显子2或外显子2的等位基因变体的一部分。
8.根据权利要求7所述的多核苷酸,其中VAPB的外显子1为SEQ ID NO:17的外显子;CADM1的外显子7为SEQ ID NO:39的外显子;CD44的外显子5为SEQ ID NO:65的外显子;SLC3A2的外显子1为SEQ ID NO:103的外显子;VTCN1的外显子2为SEQ ID NO:169的外显子;CDH1的外显子11为SEQ ID NO:198的外显子;CXADR的外显子1为SEQ ID NO:219的外显子;GTF2E2的外显子2为SEQ ID NO:236的外显子;CSMD1的外显子23为SEQ ID NO:279的外显子;PTN的外显子4为SEQ ID NO:318的外显子;ST14的外显子11为SEQ ID NO:342的外显子;THBS1的外显子9为SEQ ID NO:386的外显子;AGRN的外显子12为SEQ ID NO:416的外显子;PVALB的外显子4为SEQ ID NO:442的外显子;SLC3A2的外显子2为SEQ ID NO:457的外显子;APP的外显子14为SEQ ID NO:501的外显子;WRN的外显子33为SEQ ID NO:562的外显子;DAAM1的外显子1为SEQ ID NO:606的外显子;ASPH的外显子22为SEQ ID NO:658的外显子;NOTCH2的外显子6为SEQ ID NO:700的外显子;CD74的外显子2为SEQ ID NO:720的外显子;SDC4的外显子2为SEQ ID NO:746的外显子;CD44的外显子5为SEQ ID NO:65的外显子;SLC4A4的外显子14为SEQ ID NO:780的外显子;SDC4的外显子4为SEQ ID NO:748的外显子;ZFAT的外显子12为SEQ ID NO:841的外显子;DSCAML1的外显子3为SEQ ID NO:872的外显子,并且NRG1的外显子1、2、5和6分别为SEQ ID NO:125、126、129和130的外显子。
9.根据权利要求7或8中任一项所述的多核苷酸,其中:
-所述VAPB的外显子1或其等位基因变体的一部分位于所述NRG1的外显子2或其等位基因变体的一部分的5’端;
-所述CADM1的外显子7或其等位基因变体的一部分位于所述NRG1的外显子6或其等位基因变体的一部分的5’端;
-所述CD44的外显子5或其等位基因变体的一部分位于所述NRG1的外显子2或其等位基因变体的一部分的5’端;
-所述SLC3A2的外显子1或其等位基因变体的一部分位于所述NRG1的外显子5或其等位基因变体的一部分的5’端;
-所述VTCN1的外显子2或其等位基因变体的一部分位于所述NRG1的外显子2或其等位基因变体的一部分的5’端;
-所述CDH1的外显子11或其等位基因变体的一部分位于所述NRG1的外显子2或其等位基因变体的一部分的5’端;
-所述CXADR的外显子1或其等位基因变体的一部分位于所述NRG1的外显子2或其等位基因变体的一部分的5’端;
-所述GTF2E2的外显子2或其等位基因变体的一部分位于所述NRG1的外显子2或其等位基因变体的一部分的5’端;
-所述CSMD1的外显子23或其等位基因变体的一部分位于所述NRG1的外显子6或其等位基因变体的一部分的5’端;
-所述PTN的外显子4或其等位基因变体的一部分位于所述NRG1的外显子2或其等位基因变体的一部分的5’端;
-所述ST14的外显子11或其等位基因变体的一部分位于所述NRG1的外显子6或其等位基因变体的一部分的5’端;
-所述THBS1的外显子9或其等位基因变体的一部分位于所述NRG1的外显子6或其等位基因变体的一部分的5’端;
-所述AGRN的外显子12或其等位基因变体的一部分位于所述NRG1的外显子6或其等位基因变体的一部分的5’端;
-所述PVALB的外显子4或其等位基因变体的一部分位于所述NRG1的外显子6或其等位基因变体的一部分的5’端;
-所述SCL3A2的外显子2或其等位基因变体的一部分位于所述NRG1的外显子6或其等位基因变体的一部分的5’端;
-所述APP的外显子14或其等位基因变体的一部分位于所述NRG1的外显子6或外显子6的等位基因变体部分的5’端;
-所述WRN的外显子33或其等位基因变体的一部分位于所述NRG1的外显子6或外显子6的等位基因变体部分的5’端;
-所述DAAM1的外显子1或其等位基因变体的一部分位于所述NRG1的外显子1或外显子1的等位基因变体部分的5’端;
-所述ASPH的外显子22或其等位基因变体的一部分位于所述NRG1的外显子2或外显子2的等位基因变体部分的5’端;
-所述NOTCH2的外显子6或其等位基因变体的一部分位于所述NRG1的外显子6或外显子6的等位基因变体部分的5’端;
-所述CD74的外显子2或其等位基因变体的一部分位于所述NRG1的外显子2或外显子2的等位基因变体部分的5’端;
-所述SDC4的外显子2或其等位基因变体的一部分位于所述NRG1的外显子2或外显子2的等位基因变体部分的5’端;
-所述CD44的外显子5或其等位基因变体的一部分位于所述NRG1的外显子6或外显子6的等位基因变体部分的5’端;
-所述SLC4A4的外显子14或其等位基因变体的一部分位于所述NRG1的外显子6或外显子6的等位基因变体部分的5’端;
-所述SDC4的外显子4或其等位基因变体的一部分位于所述NRG1的外显子2或外显子2的等位基因变体部分的5’端;
-所述ZFAT的外显子12或其等位基因变体的一部分位于该NRG1的外显子6或外显子6的等位基因变体部分的5’端;以及
-所述DSCAML1的外显子3或其等位基因变体的一部分位于该NRG1的外显子2或外显子2的等位基因变体部分的5’端。
10.根据权利要求7至9中任一项所述的多核苷酸,其中:
-所述VAPB的外显子1的等位基因变体与SEQ ID NO:17有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述CADM1的外显子7的等位基因变体与SEQ ID NO:39有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述CD44的外显子5的等位基因变体与SEQ ID NO:65有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述SLC3A2的外显子1的等位基因变体与SEQ ID NO:103有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述VTCN1的外显子2的等位基因变体与SEQ ID NO:169有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述CDH1的外显子11的等位基因变体与SEQ ID NO:198有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述NRG1的外显子2的等位基因变体与SEQ ID NO:126有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述NRG1的外显子5的等位基因变体与SEQ ID NO:129有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述NRG1的外显子6的等位基因变体与SEQ ID NO:130有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述CXADR的外显子1的等位基因变体与SEQ ID NO:219有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述GTF2E2的外显子2的等位基因变体与SEQ ID NO:236有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述CSMD1的外显子23的等位基因变体与SEQ ID NO:279有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述PTN的外显子4的等位基因变体与SEQ ID NO:318有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述ST14的外显子11的等位基因变体与SEQ ID NO:342有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述THBS1的外显子9的等位基因变体与SEQ ID NO:386有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述AGRN的外显子12的等位基因变体与SEQ ID NO:416有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述PVALB的外显子4的等位基因变体与SEQ ID NO:442有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述SCL3A2的外显子2的等位基因变体与SEQ ID NO:457有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述APP的外显子14的等位基因变体与SEQ ID NO:501有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述WRN的外显子33的等位基因变体与SEQ ID NO:562有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述DAAM1的外显子1的等位基因变体与SEQ ID NO:606有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述NRG1的外显子1的等位基因变体与SEQ ID NO:125有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述ASPH的外显子22的等位基因变体与SEQ ID NO:658有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述NOTCH2的外显子6的等位基因变体与SEQ ID NO:700有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述CD74的外显子2的等位基因变体与SEQ ID NO:720有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述SDC4的外显子2的等位基因变体与SEQ ID NO:746有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述CD44的外显子5的等位基因变体与SEQ ID NO:65有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述SLC4A4的外显子14的等位基因变体与SEQ ID NO:780有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述SDC4的外显子4的等位基因变体与SEQ ID NO:748有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;
-所述ZFAT的外显子12的等位基因变体与SEQ ID NO:841有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性;以及
-所述DSCAML1的外显子3的等位基因变体与SEQ ID NO:872有至少85%的一致性,优选地与其有至少90%、92%、94%、96%或甚至98%的一致性。
11.根据权利要求7至10中任一项所述的多核苷酸,其中:
-所述VAPB与NRG1的融合物包含来自SEQ ID NO:3的2至约40个连续核酸,包括位置43和44处的核酸;
-所述CADM1与NRG1的融合物包含来自SEQ ID NO:7的2至约40个连续核酸,包括位置53和54处的核酸;
-所述CD44与NRG1的融合物包含来自SEQ ID NO:11的2至约40个连续核酸,包括位置52和53处的核酸;
-所述SLC3A2与NRG1的融合物包含来自SEQ ID NO:15的2至约40个连续核酸,包括位置53和54处的核酸;
-所述VTCN1与NRG1的融合物包含来自SEQ ID NO:166的2至约40个连续核酸,包括位置65和66处的核酸;
-所述CDH1与NRG1的融合物包含来自SEQ ID NO:186的2至约40个连续核酸,包括位置119和120处的核酸;
-所述CXADR与NRG1的融合物包含来自SEQ ID NO:217的2至约40个连续核酸,包括位置43和44处的核酸;
-所述GTF2E2与NRG1的融合物包含来自SEQ ID NO:233的2至约40个连续核酸,包括位置141和142处的核酸;
-所述CSMD1与NRG1的融合物包含来自SEQ ID NO:255的2至约40个连续核酸,包括位置88和89处的核酸;
-所述PTN与NRG1的融合物包含来自SEQ ID NO:313的2至约40个连续核酸,包括位置102和103处的核酸;
-所述ST14与NRG1的融合物包含来自SEQ ID NO:330的2至约40个连续核酸,包括位置95和96处的核酸;
-所述THBS1与NRG1的融合物包含来自SEQ ID NO:376的2至约40个连续核酸,包括位置56和57处的核酸;
-所述AGRN与NRG1的融合物包含来自SEQ ID NO:403的2至约40个连续核酸,包括位置106和107处的核酸;
-所述PVALB与NRG1的融合物包含来自SEQ ID NO:437的2至约40个连续核酸,包括位置102和103处的核酸;
-所述SLC3A2与NRG1的融合物包含来自SEQ ID NO:454的2至约40个连续核酸,包括位置93和94处的核酸;
-所述APP与NRG1的融合物包含来自SEQ ID NO:486的2至约40个连续核酸,包括位置54和55处的核酸;
-所述WRN与NRG1的融合物包含来自SEQ ID NO:528的2至约40个连续核酸,包括位置96和97处的核酸;
-所述DAAM1与NRG1的融合物包含来自SEQ ID NO:605的2至约40个连续核酸,包括位置75和76处的核酸;
-所述ASPH与NRG1的融合物包含来自SEQ ID NO:635的2至约40个连续核酸,包括位置75和76处的核酸;
-所述NOTCH2与NRG1的融合物包含来自SEQ ID NO:693的2至约40个连续核酸,包括位置75和76处的核酸;
-所述CD74与NRG1的融合物包含来自SEQ ID NO:717的2至约40个连续核酸,包括位置75和76处的核酸;
-所述SDC4与NRG1的融合物包含来自SEQ ID NO:743的2至约40个连续核酸,包括位置75和76处的核酸;
-所述CD44与NRG1的融合物包含来自SEQ ID NO:761的2至约40个连续核酸,包括位置75和76处的核酸;
-所述SLC4A4与NRG1的融合物包含来自SEQ ID NO:765的2至约40个连续核酸,包括位置75和76处的核酸;
-所述SDC4与NRG1的融合物包含来自SEQ ID NO:824的2至约40个连续核酸,包括位置75和76处的核酸;
-所述ZFAT与NRG1的融合物包含来自SEQ ID NO:828的2至约40个连续核酸,包括位置75和76处的核酸;以及
-所述DSCAML1与NRG1的融合物包含来自SEQ ID NO:868的2至约40个连续核酸,包括位置75和76处的核酸。
12.根据权利要求7至11中任一项所述的多核苷酸,其中:
-所述VAPB与NRG1的融合物包含SEQ ID NO:3或其等位基因变体;
-所述CAD1与NRG1的融合物包含SEQ ID NO:7或其等位基因变体;
-所述CD44与NRG1的融合物包含SEQ ID NO:11或其等位基因变体;
-所述SLC3A2与NRG1的融合物包含SEQ ID NO:15或其等位基因变体;
-所述VTCN1与NRG1的融合物包含SEQ ID NO:166或其等位基因变体;
-所述CDH1与NRG1的融合物包含SEQ ID NO:186或其等位基因变体;
-所述CXADR与NRG1的融合物包含SEQ ID NO:217或其等位基因变体;
-所述GTF2E2与NRG1的融合物包含SEQ ID NO:233或其等位基因变体;
-所述CSMD1与NRG1的融合物包含SEQ ID NO:255或其等位基因变体;
-所述PTN与NRG1的融合物包含SEQ ID NO:313或其等位基因变体;
-所述ST14与NRG1的融合物包含SEQ ID NO:330或其等位基因变体;
-所述THBS1与NRG1的融合物包含SEQ ID NO:376或其等位基因变体;
-所述AGRN与NRG1的融合物包含SEQ ID NO:403或其等位基因变体;
-所述PVALB与NRG1的融合物包含SEQ ID NO:437或其等位基因变体;
-所述SLC3A2与NRG1的融合物包含SEQ ID NO:454或其等位基因变体;
-所述APP与NRG1的融合物包含SEQ ID NO:486或其等位基因变体;
-所述WRN与NRG1的融合物包含SEQ ID NO:528或其等位基因变体;
-所述DAAM1与NRG1的融合物包含SEQ ID NO:605或其等位基因变体;
-所述ASPH与NRG1的融合物包含SEQ ID NO:635或其等位基因变体;
-所述NOTCH2与NRG1的融合物包含SEQ ID NO:693或其等位基因变体;
-所述CD74与NRG1的融合物包含SEQ ID NO:717或其等位基因变体;
-所述SDC4与NRG1的融合物包含SEQ ID NO:743或其等位基因变体;
-所述CD44与NRG1的融合物包含SEQ ID NO:761或其等位基因变体;
-所述SLC4A4与NRG1的融合物包含SEQ ID NO:765或其等位基因变体;
-所述SDC4与NRG1的融合物包含SEQ ID NO:824或其等位基因变体;
-所述ZFAT与NRG1的融合物包含SEQ ID NO:828或其等位基因变体;以及
-所述DSCAML1与NRG1的融合物包含SEQ ID NO:868或其等位基因变体。
13.根据权利要求7至12中任一项所述的多核苷酸,其中:
-所述VAPB的外显子1的一部分是或包含SEQ ID NO:1或SEQ ID NO:1的等位基因变体;
-所述CADM1的外显子7的一部分是或包含SEQ ID NO:5或SEQ ID NO:5的等位基因变体;
-所述CD44的外显子5的一部分是或包含SEQ ID NO:9或SEQ ID NO:9的等位基因变体;
-所述SLC3A2的外显子1的一部分是或包含SEQ ID NO:13或SEQ ID NO:13的等位基因变体;
-所述VTCN1的外显子2的一部分是或包含SEQ ID NO:164或SEQ ID NO:164的等位基因变体;
-所述CDH1的外显子11的一部分是或包含SEQ ID NO:184或SEQ ID NO:184的等位基因变体;
-所述CXADR的外显子1的一部分是或包含SEQ ID NO:215或SEQ ID NO:215的等位基因变体;
-所述GTF2E2的外显子2的一部分是或包含SEQ ID NO:231或SEQ ID NO:231的等位基因变体;
-所述CSMD1的外显子23的一部分是或包含SEQ ID NO:253或SEQ ID NO:253的等位基因变体;
-所述PTN的外显子4的一部分是或包含SEQ ID NO:311或SEQ ID NO:311的等位基因变体;
-所述ST14的外显子11的一部分是或包含SEQ ID NO:328或SEQ ID NO:328的等位基因变体;
-所述THBS1的外显子9的一部分是或包含SEQ ID NO:374或SEQ ID NO:374的等位基因变体;
-所述AGRN的外显子12的一部分是或包含SEQ ID NO:401或SEQ ID NO:401的等位基因变体;
-所述PVALB的外显子4的一部分是或包含SEQ ID NO:435或SEQ ID NO:435的等位基因变体;
-所述SLC3A2的外显子2的一部分是或包含SEQ ID NO:452或SEQ ID NO:452的等位基因变体;
-所述NRG1的外显子2的一部分是或包含SEQ ID NO:165或SEQ ID NO:165的等位基因变体;
-所述NRG1的外显子5的一部分是或包含SEQ ID NO:14或SEQ ID NO:14的等位基因变体;
-所述NRG1的外显子6的一部分是或包含SEQ ID NO:6或其等位基因变体;
-所述APP的外显子14的一部分是或包含SEQ ID NO:484或其等位基因变体;
-所述WRN的外显子33的一部分是或包含SEQ ID NO:526或其等位基因变体;
-所述DAAM1的外显子1的一部分是或包含SEQ ID NO:603或其等位基因变体;
-所述ASPH的外显子22的一部分是或包含SEQ ID NO:633或其等位基因变体;
-所述NOTCH2的外显子6的一部分是或包含SEQ ID NO:691或其等位基因变体;
-所述CD74的外显子2的一部分是或包含SEQ ID NO:715或其等位基因变体;
-所述SDC4的外显子2的一部分是或包含SEQ ID NO:741或其等位基因变体;
-所述CD44的外显子5的一部分是或包含SEQ ID NO:759或其等位基因变体;
-所述SLC4A4的外显子14的一部分是或包含SEQ ID NO:763或其等位基因变体;
-所述SDC4的外显子4的一部分是或包含SEQ ID NO:822或其等位基因变体;
-所述ZFAT的外显子12的一部分是或包含SEQ ID NO:826或其等位基因变体;
-所述DSCAML1的外显子3的一部分是或包含SEQ ID NO:866或其等位基因变体;以及
-所述NRG1的外显子1的一部分是或包含SEQ ID NO:604或其等位基因变体。
14.根据权利要求7至12中任一项所述的多核苷酸,其中:
-所述VAPB与NRG1的融合物在VAPB的外显子1与NRG1的外显子2之间包含融合接点,优选为SEQ ID NO:3的VAPB位置43的核酸与NRG1位置44的核酸之间的接点;
-所述CADM1与NRG1的融合物在CADM1的外显子7与NRG1的外显子6之间包含融合接点,优选为SEQ ID NO:7的CADM1位置53的核酸与NRG1位置54的核酸之间的接点;
-所述CD44与NRG1的融合物在CD44的外显子5与NRG1的外显子2之间包含融合接点,优选为SEQ ID NO:11的CD44位置52的核酸与NRG1位置53的核酸之间的接点;
-所述SLC3A2与NRG1的融合物在SLC3A2的外显子1与NRG1的外显子5之间包含融合接点,优选为SEQ ID NO:15的SLC3A2位置53的核酸与NRG1位置54的核酸之间的接点;
-所述VTCN1与NRG1的融合物在VTCN1的外显子2与NRG1的外显子2之间包含融合接点,优选为SEQ ID NO:166的VTCN1位置65的核酸与NRG1位置66的核酸之间的接点;
-所述CDH1与NRG1的融合物在CDH1的外显子11与NRG1的外显子2之间包含融合接点,优选为SEQ ID NO:186的CDH1位置119的核酸与NRG1位置120的核酸之间的接点;
-所述CXADR与NRG1的融合物在CXADR的外显子1与NRG1的外显子2之间包含融合接点,优选为SEQ ID NO:217的CXADR位置43的核酸与NRG1位置44的核酸之间的接点;
-所述GTF2E2与NRG1的融合物在GTF2E2的外显子2与NRG1的外显子2之间包含融合接点,优选为SEQ ID NO:233的GTF2E2位置141的核酸与NRG1位置142的核酸之间的接点;
-所述CSMD1与NRG1的融合物在CSMD1的外显子23与NRG1的外显子6之间包含融合接点,优选为SEQ ID NO:255的CSMD1位置88的核酸与NRG1位置89的核酸之间的接点;
-所述PTN与NRG1的融合物在PTN的外显子4与NRG1的外显子2之间包含融合接点,优选为SEQ ID NO:313的PTN位置102的核酸与NRG1位置103的核酸之间的接点;
-所述ST14与NRG1的融合物在ST14的外显子11与NRG1的外显子6之间包含融合接点,优选为SEQ ID NO:330的ST14位置95的核酸与NRG1位置96的核酸之间的接点;
-所述THBS1与NRG1的融合物在THBS1的外显子9与NRG1的外显子6之间包含融合接点,优选为SEQ ID NO:376的THBS1位置56的核酸与NRG1位置57的核酸之间的接点;
-所述AGRN与NRG1的融合物在AGRN的外显子12与NRG1的外显子6之间包含融合接点,优选为SEQ ID NO:403的AGRN位置106的核酸与NRG1位置107的核酸之间的接点;
-所述PVALB与NRG1的融合物在PVALB的外显子4与NRG1的外显子6之间包含融合接点,优选为SEQ ID NO:437的PVALB位置102的核酸与NRG1位置103的核酸之间的接点;
-所述SLC3A2与NRG1的融合物在SLC3A2的外显子2与NRG1的外显子6之间包含融合接点,优选为SEQ ID NO:454的SLC3A2位置93的核酸与NRG1位置94的核酸之间的接点;
-所述APP与NRG1的融合物在APP的外显子14与NRG1的外显子6之间包含融合接点,优选为SEQ ID NO:486的APP位置54的核酸与NRG1位置55的核酸之间的接点;
-所述WRN与NRG1的融合物在WRN的外显子33与NRG1的外显子6之间包含融合接点,优选为SEQ ID NO:528的WRN位置96的核酸与NRG1位置97的核酸之间的接点;
-所述DAAM1与NRG1的融合物在DAAM1的外显子1与NRG1的外显子1之间包含融合接点,优选为SEQ ID NO:605的DAAM1位置75的核酸与NRG1位置的核酸76之间的接点;
-所述ASPH与NRG1的融合物在ASPH的外显子22与NRG1的外显子2之间包含融合接点,优选为SEQ ID NO:635的ASPH位置75的核酸与NRG1位置76的核酸之间的接点;
-所述NOTCH2与NRG1的融合物在NOTCH2的外显子6与NRG1的外显子6之间包含融合接点,优选为SEQ ID NO:693的NOTCH2位置75的核酸与NRG1位置76的核酸之间的接点;
-所述CD74与NRG1的融合物在CD74的外显子2与NRG1的外显子2之间包含融合接点,优选为SEQ ID NO:717的CD74位置75的核酸与NRG1位置76的核酸之间的接点;
-所述SDC4与NRG1的融合物在SDC4的外显子2与NRG1的外显子2之间包含融合接点,优选为SEQ ID NO:743的SDC4位置75的核酸与NRG1位置76的核酸之间的接点;
-所述CD44与NRG1的融合物在CD44的外显子5与NRG1的外显子6之间包含融合接点,优选为SEQ ID NO:761的VAPB位置75的核酸与NRG1位置76的核酸之间的接点;
-所述SLC4A4与NRG1的融合物在SLC4A4的外显子14与NRG1的外显子6之间包含融合接点,优选为SEQ ID NO:765的SLC4A4位置75的核酸与NRG1位置76的核酸之间的接点;
-所述SDC4与NRG1的融合物在SDC4的外显子4与NRG1的外显子2之间包含融合接点,优选为SEQ ID NO:824的SDC4位置75的核酸与NRG1位置76的核酸之间的接点;
-所述ZFAT与NRG1的融合物在ZFAT的外显子12与NRG1的外显子6之间包含融合接点,优选为SEQ ID NO:828的ZFAT位置75的核酸与NRG1位置76的核酸之间的接点;及
-所述DSCAML1与NRG1的融合物在DSCAML1的外显子3与NRG1的外显子2之间包含融合接点,优选为SEQ ID NO:868的DSCAML1位置75的核酸与NRG1位置76的核酸之间的接点。
15.根据前述权利要求中任一项所述的多核苷酸,其中所述多核苷酸被分离或纯化。
16.根据前述权利要求中任一项所述的多核苷酸,其中所述融合物中的任一者为框内融合物。
17.根据前述权利要求中任一项所述的多核苷酸,其中所述多核苷酸为哺乳动物多核苷酸,优选为人类多核苷酸。
18.一种多肽融合物,其通过根据前述权利要求中任一项所述的多核苷酸编码。
19.一种载体,其包含根据权利要求1至17中任一项所述的多核苷酸。
20.一种重组宿主细胞,其包含根据权利要求1至17中任一项所述的多核苷酸或根据权利要求19所述的载体。
21.一种制造根据权利要求18所述的多肽融合物的方法,其包括将根据权利要求20所述的宿主细胞维持在适合所述宿主细胞所包含的多核苷酸表达的条件下,从而表达所述多核苷酸且产生多肽融合物,随后分离或纯化所述多肽融合物。
22.一种制造重组宿主细胞的方法,其包括将根据权利要求19所述的载体导入宿主细胞内。
23.一种检测测定法,其包含用于检测根据权利要求1至17中任一项所述的多核苷酸融合物的存在的核酸探针、引物或引物对。
24.一种用于检测根据权利要求1至17中任一项所述的多核苷酸融合物的核酸探针、引物或引物对。
25.根据权利要求24所述的核酸探针、引物或引物对,其长度为10至40个核苷酸。
26.根据权利要求24或25所述的核酸探针、引物或引物对,其中所检测到的融合物包含:
-所述VAPB与NRG1的融合物,其包含SEQ ID NO:3或由其组成,且优选地包括位置43或44的核酸;
-所述CADM1与NRG1的融合物,其包含SEQ ID NO:7或由其组成,且优选地包括位置53或54的核酸;
-所述CD44与NRG1的融合物,其包含SEQ ID NO:11或由其组成,且优选地包括位置52或53的核酸;
-所述SLC3A2与NRG1的融合物,其包含SEQ ID NO:15或由其组成,且优选地包括位置53或54的核酸;
-所述VTCN1与NRG1的融合物,其包含SEQ ID NO:166或由其组成,且优选地包括位置65或66的核酸;
-所述CDH1与NRG1的融合物,其包含SEQ ID NO:186或由其组成,且优选地包括位置119或120的核酸;
-所述CXADR与NRG1的融合物,其包含SEQ ID NO:217或由其组成,且优选地包括位置43或44的核酸;
-所述GTF2E2与NRG1的融合物,其包含SEQ ID NO:233或由其组成,且优选地包括位置141或142的核酸;
-所述CSMD1与NRG1的融合物,其包含SEQ ID NO:255或由其组成,且优选地包括位置88或89的核酸;
-所述PTN与NRG1的融合物,其包含SEQ ID NO:313或由其组成,且优选地包括位置102或103的核酸;
-所述ST14与NRG1的融合物,其包含SEQ ID NO:330或由其组成,且优选地包括位置95或96的核酸;
-所述THBS1与NRG1的融合物,其包含SEQ ID NO:376或由其组成,且优选地包括位置56或57的核酸;
-所述AGRN与NRG1的融合物,其包含SEQ ID NO:403或由其组成,且优选地包括位置106或107的核酸;
-所述PVALB与NRG1的融合物,其包含SEQ ID NO:437或由其组成,且优选地包括位置102或103的核酸;
-所述SLC3A2与NRG1的融合物,其包含SEQ ID NO:454或由其组成,且优选地包括位置93或94的核酸;
-所述APP与NRG1的融合物,其包含SEQ ID NO:486或由其组成,且优选地包括位置54或55的核酸;
-所述WRN与NRG1的融合物,其包含SEQ ID NO:528或由其组成,且优选地包括位置96或97的核酸;
-所述DAAM1与NRG1的融合物,其包含SEQ ID NO:605或由其组成,且优选地包括位置75或76的核酸;
-所述ASPH与NRG1的融合物,其包含SEQ ID NO:635或由其组成,且优选地包括位置75或76的核酸;
-所述NOTCH2与NRG1的融合物,其包含SEQ ID NO:693或由其组成,且优选地包括位置75或76的核酸;
-所述CD74与NRG1的融合物,其包含SEQ ID NO:717或由其组成,且优选地包括位置75或76的核酸;
-所述SDC4与NRG1的融合物,其包含SEQ ID NO:743或由其组成,且优选地包括位置75或76的核酸;
-所述CD44与NRG1的融合物,其包含SEQ ID NO:761或由其组成,且优选地包括位置75或76的核酸;
-所述SLC4A4与NRG1的融合物,其包含SEQ ID NO:765或由其组成,且优选地包括位置75或76的核酸;
-所述SDC4与NRG1的融合物,其包含SEQ ID NO:824或由其组成,且优选地包括位置75或76的核酸;
-所述ZFAT与NRG1的融合物,其包含SEQ ID NO:828或由其组成,且优选地包括位置75或76的核酸;以及
-所述DSCAML1与NRG1的融合物,其包含SEQ ID NO:868或由其组成,且优选地包括位置75或76的核酸。
27.根据权利要求24至26中任一项所述的核酸探针、引物或引物对,其中:
-用于检测所述VAPB与NRG1的融合物的探针、引物或引物对特异性地与由VAPB的外显子1所组成的序列或位于外显子1的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述CADM1与NRG1的融合物的探针、引物或引物对特异性地与由CADM1的外显子7所组成的序列或位于外显子7的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述CD44与NRG1的融合物的探针、引物或引物对特异性地与由CD44的外显子5所组成的序列或位于外显子5的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述SLC3A2的转录本6与NRG1的融合物的探针、引物或引物对特异性地与由SLC3A2的外显子1所组成的序列或位于外显子1的5’处的序列杂交,和/或特异性地与由NRG1的外显子5所组成的序列或位于外显子5的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述VTCN1与NRG1的融合物的探针、引物或引物对特异性地与由VTCN1的外显子2所组成的序列或位于外显子2的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述CDH1与NRG1的融合物的探针、引物或引物对特异性地与由CDH1的外显子11所组成的序列或位于外显子11的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述CXADR与NRG1的融合物的探针、引物或引物对特异性地与由CXADR的外显子1所组成的序列或位于外显子1的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述GTF2E2与NRG1的融合物的探针、引物或引物对特异性地与由GTF2E2的外显子2所组成的序列或位于外显子2的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述CSMD1与NRG1的融合物的探针、引物或引物对特异性地与由CSMD1的外显子23所组成的序列或位于外显子23的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述PTN与NRG1的融合物的探针、引物或引物对特异性地与由PTN的外显子4所组成的序列或位于外显子4的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述ST14与NRG1的融合物的探针、引物或引物对特异性地与由ST14的外显子11所组成的序列或位于外显子11的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述THBS1与NRG1的融合物的探针、引物或引物对特异性地与由THBS1的外显子9所组成的序列或位于外显子9的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述AGRN与NRG1的融合物的探针、引物或引物对特异性地与由AGRN的外显子12所组成的序列或位于外显子12的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述PVALB与NRG1的融合物的探针、引物或引物对特异性地与由PVALB的外显子4所组成的序列或位于外显子4的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述SLC3A2的转录本3与NRG1的融合物的探针、引物或引物对特异性地与由SLC3A2的外显子2所组成的序列或位于外显子2的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述APP与NRG1的融合物的探针、引物或引物对特异性地与由APP的外显子14所组成的序列或位于外显子14的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述WRN与NRG1的融合物的探针、引物或引物对特异性地与由WRN的外显子33所组成的序列或位于外显子33的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述DAAM1与NRG1的融合物的探针、引物或引物对特异性地与由DAAM1的外显子1所组成的序列或位于外显子1的5’处的序列杂交,和/或特异性地与由NRG1的外显子1所组成的序列或位于外显子1的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述ASPH与NRG1的融合物的探针、引物或引物对特异性地与由ASPH的外显子22所组成的序列或位于外显子22的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述NOTCH2与NRG1的融合物的探针、引物或引物对特异性地与由NOTCH2的外显子6所组成的序列或位于外显子6的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述CD74与NRG1的融合物的探针、引物或引物对特异性地与由CD74的外显子2所组成的序列或位于外显子2的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述SDC4与NRG1的融合物的探针、引物或引物对特异性地与由SDC4的外显子2所组成的序列或位于外显子2的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述CD44与NRG1的融合物的探针、引物或引物对特异性地与由CD44的外显子5所组成的序列或位于外显子5的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述SLC4A4与NRG1的融合物的探针、引物或引物对特异性地与由SLC4A4的外显子14所组成的序列或位于外显子14的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述SDC4与NRG1的融合物的探针、引物或引物对特异性地与由SDC4的外显子4所组成的序列或位于外显子4的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述ZFAT与NRG1的融合物的探针、引物或引物对特异性地与由ZFAT的外显子12所组成的序列或位于外显子12的5’处的序列杂交,和/或特异性地与由NRG1的外显子6所组成的序列或位于外显子6的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性;或
-用于检测所述DSCAML1与NRG1的融合物的探针、引物或引物对特异性地与由DSCAML1的外显子3所组成的序列或位于外显子3的5’处的序列杂交,和/或特异性地与由NRG1的外显子2所组成的序列或位于外显子2的3’处的序列杂交,或是与其具有95%或更高的互补序列一致性。
28.根据权利要求27所述的核酸探针、引物或引物对,其中:
-来自VAPB的外显子1包含SEQ ID NO:17或其等位基因变体,或是由其组成;
-来自CADM1的外显子7包含SEQ ID NO:39或其等位基因变体,或是由其组成;
-来自CD44的外显子5包含SEQ ID NO:65或其等位基因变体,或是由其组成;
-来自SLC3A2的外显子1包含SEQ ID NO:103或其等位基因变体,或是由其组成;
-来自VTCN1的外显子2包含SEQ ID NO:169或其等位基因变体,或是由其组成;
-来自CDH1的外显子11包含SEQ ID NO:198或其等位基因变体,或是由其组成;
-来自CXADR的外显子1包含SEQ ID NO:219或其等位基因变体,或是由其组成;
-来自GTF2E2的外显子2包含SEQ ID NO:236或其等位基因变体,或是由其组成;
-来自CSMD1的外显子23包含SEQ ID NO:279或其等位基因变体,或是由其组成;
-来自PTN的外显子4包含SEQ ID NO:318或其等位基因变体,或是由其组成;
-来自ST14的外显子11包含SEQ ID NO:342或其等位基因变体,或是由其组成;
-来自THBS1的外显子9包含SEQ ID NO:386或其等位基因变体,或是由其组成;
-来自AGRN的外显子12包含SEQ ID NO:416或其等位基因变体,或是由其组成;
-来自PVALB的外显子4包含SEQ ID NO:442或其等位基因变体,或是由其组成;
-来自SLC3A2的外显子2包含SEQ ID NO:457或其等位基因变体,或是由其组成;
-来自APP的外显子14包含SEQ ID NO:501或其等位基因变体,或是由其组成;
-来自WRN的外显子33包含SEQ ID NO:562或其等位基因变体,或是由其组成;
-来自DAAM1的外显子1包含SEQ ID NO:606或其等位基因变体,或是由其组成;
-来自ASPH的外显子22包含SEQ ID NO:658或其等位基因变体,或是由其组成;
-来自NOTCH2的外显子6包含SEQ ID NO:700或其等位基因变体,或是由其组成;
-来自CD74的外显子2包含SEQ ID NO:720或其等位基因变体,或是由其组成;
-来自SDC4的外显子2包含SEQ ID NO:746或其等位基因变体,或是由其组成;
-来自CD44的外显子5包含SEQ ID NO:65或其等位基因变体,或是由其组成;
-来自SLC4A4的外显子14包含SEQ ID NO:780或其等位基因变体,或是由其组成;
-来自SDC4的外显子4包含SEQ ID NO:748或其等位基因变体,或是由其组成;
-来自ZFAT的外显子12包含SEQ ID NO:841或其等位基因变体,或是由其组成;
-来自DSCAML1的外显子3包含SEQ ID NO:872或其等位基因变体,或是由其组成;以及
-来自NRG1的外显子1、2、5和6分别包含SEQ ID NO:125、126、129和130或其等位基因变体,或是由其组成。
29.根据权利要求27所述的核酸探针、引物或引物对,其中:
-用于检测所述VAPB与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:17所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述CADM1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:57所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述CD44与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:99所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述SLC3A2与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:103所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:157所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述VTCN1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:181所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述CDH1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:213所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述CXADR与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:219所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述GTF2E2与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:252所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述CSMD1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:309所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述PTN与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:326所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述ST14与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:372所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述THBS1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:399所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述AGRN与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:433所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述PVALB与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:450所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述SLC3A2与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:482所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述APP与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:524所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述WRN与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:601所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述DAAM1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:606所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:138所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述ASPH与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:689所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述NOTCH2与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:713所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述CD74与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:739所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述SDC4与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:757所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述CD44与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:99所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述SLC4A4与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:820所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述SDC4与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:940所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;
-用于检测所述ZFAT与NRG1的融合物的探针、引物或引物对特异性地与由SEQ ID NO:864所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:155所组成的序列杂交,或是与其具有95%或更高的互补序列一致性;以及
-用于检测所述DSCAML1与NRG1的融合物的探针、引物或引物对特异性地与由SEQ IDNO:938所组成的序列杂交或其等位基因变体杂交,和/或特异性地与由SEQ ID NO:153所组成的序列杂交,或是与其具有95%或更高的互补序列一致性。
30.一种用于原位杂交测定法以检测根据权利要求1至17中任一项所述的多核苷酸融合物的第一核酸探针和第二核酸探针,
-其中所述第一探针特异性地与位于SEQ ID NO:3的位置43的核酸5’处的VAPB序列杂交,且所述第二探针特异性地与位于SEQ ID NO:3的位置44的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:7的位置53的核酸5’处的CADM1序列杂交,且所述第二探针特异性地与位于SEQ ID NO:7的位置54的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:11的位置52的核酸5’处的CD44序列杂交,且所述第二探针特异性地与位于SEQ ID NO:11的位置53的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:15的位置53的核酸5’处的SLC3A2序列杂交,且所述第二探针特异性地与位于SEQ ID NO:15的位置54的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:166的位置65的核酸5’处的VTCN1序列杂交,且所述第二探针特异性地与位于SEQ ID NO:166的位置66的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:186的位置119的核酸5’处的CDH1序列杂交,且所述第二探针特异性地与位于SEQ ID NO:186的位置120的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:217的位置43的核酸5’处的CXADR序列杂交,且所述第二探针特异性地与位于SEQ ID NO:217的位置44的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:233的位置141的核酸5’处的GTF2E2序列杂交,且所述第二探针特异性地与位于SEQ ID NO:233的位置142的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:255的位置88的核酸5’处的CSMD1序列杂交,且所述第二探针特异性地与位于SEQ ID NO:255的位置89的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:313的位置102的核酸5’处的PTN序列杂交,且所述第二探针特异性地与位于SEQ ID NO:313的位置103的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:330的位置95的核酸5’处的ST14序列杂交,且所述第二探针特异性地与位于SEQ ID NO:330的位置96的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:376的位置56的核酸5’处的THBS1序列杂交,且所述第二探针特异性地与位于SEQ ID NO:376的位置57的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:403的位置106的核酸5’处的AGRN序列杂交,且所述第二探针特异性地与位于SEQ ID NO:403的位置107的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:437的位置102的核酸5’处的PVALB序列杂交,且所述第二探针特异性地与位于SEQ ID NO:437的位置103的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:454的位置93的核酸5’处的SLC3A2序列杂交,且所述第二探针特异性地与位于SEQ ID NO:454的位置94的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:486的位置54的核酸5’处的APP序列杂交,且所述第二探针特异性地与位于SEQ ID NO:486的位置55的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:528的位置96的核酸5’处的WRN序列杂交,且所述第二探针特异性地与位于SEQ ID NO:528的位置97的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:605的位置75的核酸5’处的DAAM1序列杂交,且所述第二探针特异性地与位于SEQ ID NO:605的位置76的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:635的位置75的核酸5’处的ASPH序列杂交,且所述第二探针特异性地与位于SEQ ID NO:635的位置76的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:693的位置75的核酸5’处的NOTCH2序列杂交,且所述第二探针特异性地与位于SEQ ID NO:693的位置76的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:717的位置75的核酸5’处的CD74序列杂交,且所述第二探针特异性地与位于SEQ ID NO:717的位置76的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:743的位置75的核酸5’处的SDC4序列杂交,且所述第二探针特异性地与位于SEQ ID NO:743的位置76的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:761的位置75的核酸5’处的CD44序列杂交,且所述第二探针特异性地与位于SEQ ID NO:761的位置76的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:765的位置75的核酸5’处的SLC4A4序列杂交,且所述第二探针特异性地与位于SEQ ID NO:765的位置76的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:824的位置75的核酸5’处的SDC4序列杂交,且所述第二探针特异性地与位于SEQ ID NO:824的位置76的核酸3’处的NRG1序列杂交;
-其中所述第一探针特异性地与位于SEQ ID NO:828的位置75的核酸5’处的ZFAT序列杂交,且所述第二探针特异性地与位于SEQ ID NO:828的位置76的核酸3’处的NRG1序列杂交;或
-其中该所述第一探针特异性地与位于SEQ ID NO:868的位置75的核酸5’处的DSCAML1序列杂交,且所述第二探针特异性地与位于SEQ ID NO:868的位置76的核酸3’处的NRG1序列杂交。
31.一种用于检测根据权利要求1至17中任一项所述的多核苷酸融合物所编码的多肽的第一抗体或第一与第二抗体组。
32.一种包含用于检测根据权利要求1至17中任一项所述的多核苷酸融合物所编码的多肽的存在的第一抗体或第一与第二抗体组的检测测定法,其中所述第一抗体或第一与第二抗体组优选为根据权利要求31所述的第一抗体或第一与第二抗体组。
33.根据权利要求31所述的第一抗体或第一与第二抗体组,或根据权利要求32所述的检测测定法,其中所述第一抗体结合选自VAPB-NRG1、CADM1-NRG1、CD44-NRG1、SLC3A2-NRG1、VTCN1-NRG1、CDH1-NRG1、CXADR-NRG1、GTF2E2-NRG1、CSMD1-NRG1、PTN-NRG1、ST14-NRG1、THBS1-NRG1、AGRN-NRG1、PVALB-NRG1、APP-NRG1、WRN-NRG1、ASPH-NRG1、NOTCH2-NRG1、CD74-NRG1、SDC4-NRG1、SLC4A4-NRG1、ZFAT-NRG1或DSCAML1-NRG1的多肽融合物,并且所述第一与第二抗体组分别结合VAPB与NRG1、或CADM1与NRG1、或CD44与NRG1、SLC3A2与NRG1、VTCN1与NRG1、CDH1与NRG1、CXADR与NRG1、GTF2E2与NRG1、CSMD1与NRG1、PTN与NRG1、ST14与NRG1、THBS1与NRG1、AGRN与NRG1、PVALB与NRG1、APP与NRG1、WRN与NRG1、ASPH与NRG1、NOTCH2与NRG1、CD74与NRG1、SDC4与NRG1、SLC4A4与NRG1、ZFAT与NRG1、或DSCAML1与NRG1。
34.一种用于在样本中鉴定根据权利要求1至17中任一项所述的多核苷酸融合物、或由其所编码的多肽的方法,所述方法包括检验获自受试者的样本以检测所述样本中所述融合物的存在。
35.一种用于在样本中检测根据权利要求1至17中任一项所述的多核苷酸融合物、或由其所编码的多肽是否存在的方法,所述方法包括检验获自受试者的样本以检测所述样本中所述融合物的存在。
36.一种用于确定来自受试者的异常细胞是否包含根据权利要求1至17中任一项所述的多核苷酸融合物、或由其所编码的多肽的方法,所述方法包括针对样本中所述融合物的存在,检验获自所述受试者的异常细胞的多核苷酸或多肽内容物。
37.一种用于鉴定受试者携带根据权利要求1至17中任一项所述的多核苷酸融合物、或由其所编码的多肽的方法,所述方法包括检验获自受试者的样本以检测所述样本中所述融合物的存在。
38.根据权利要求34至37中任一项所述的方法,其中所述检验包括利用特异性地结合所述多核苷酸的结合剂,诸如根据权利要求24至29中任一项所述的核酸探针、引物或引物对以检测所述融合物、或由其所编码的多肽,或是利用结合包含所述多核苷酸融合物的多核苷酸的结合剂进行检测。
39.根据权利要求34至38中任一项所述的方法,其中所述检验包括扩增或检测能区分所述多核苷酸融合物或由其所编码的多肽存在或不存在的序列。
40.根据权利要求34至39中任一项所述的方法,其中所述多核苷酸融合物获自表达包含NRG1的EGF样结构域的多核苷酸融合物的异常细胞。
41.根据权利要求34至40中任一项所述的方法,其中所述方法包括从受试者获得样本的步骤,随后为从所述样本中分离所述多核苷酸或由其所编码的多肽的步骤。
42.根据权利要求34至41中任一项所述的方法,其中所述方法包括从所述样本纯化或分离所述多核苷酸的步骤。
43.根据权利要求34至42中任一项所述的方法,其中所述结合剂是或包含引物、引物对、探针或抗体。
44.根据权利要求34至43中任一项所述的方法,其中所述检验为离体方法,优选为体外方法。
45.根据权利要求34至44中任一项所述的方法,其中所述结合剂包含可检测标记或与其相关联。
46.根据权利要求34至45中任一项所述的方法,其中所述样本为液态活检样本或固态样本,诸如经福尔马林固定的石蜡包埋组织(FFPE)样本。
47.根据权利要求34至46中任一项所述的方法,其中所述样本包含血液、血清、血浆、胸水、尿液、精液、羊水或腹水。
48.根据权利要求34至47中任一项所述的方法,其中所述样本包含变异细胞,诸如肿瘤细胞或癌细胞,或其多核苷酸或多肽内容物。
49.一种治疗患有包含多核苷酸融合物和/或表达由其所编码的融合多肽的ErbB-2和/或ErbB-3阳性癌症或肿瘤的受试者的方法,所述方法包括向所述受试者施用有效量的ErbB-2和/或ErbB-3靶向剂,其中所述融合物为根据权利要求1至17中任一项所述的融合物。
50.一种用于抑制患有包含多核苷酸融合物和/或表达由其所编码的融合多肽的ErbB-2和ErbB-3阳性癌症或肿瘤的受试者进程的方法,所述方法包括向所述受试者施用有效量的ErbB-2和/或ErbB-3靶向剂,其中所述融合物为根据权利要求1至17中任一项所述的融合物。
51.一种用于治疗患有包含多核苷酸融合物和/或表达由其所编码的融合多肽的ErbB-2和ErbB-3阳性癌症或肿瘤的受试者的ErbB-2和/或ErbB-3靶向剂,所述治疗包括向所述受试者施用有效量的ErbB-2和/或ErbB-3靶向剂,其中所述融合物为根据权利要求1至17中任一项所述的融合物。
52.一种用于诊断受试者是否有包含根据权利要求1至17中任一项所述的多核苷酸融合物或由其所编码的多肽的异常细胞的方法,所述方法包括检验获自受试者的样本以检测所述样本中所述融合物的存在。
53.根据权利要求52所述的方法,其中所述检验包括利用特异性地结合所述多核苷酸的结合剂,诸如根据权利要求24至29中任一项所述的核酸探针、引物或引物对以检测所述融合物、或由其所编码的多肽,或是利用结合包含所述多核苷酸融合物的多核苷酸的结合剂进行检测。
54.一种用于评估受试者是否罹患癌症或肿瘤或是易于罹患癌症或肿瘤的方法,所述方法包括检验获自受试者的样本以检测所述样本中根据权利要求1至17中任一项所述的多核苷酸融合物或由其所编码的多肽的存在,并且通过鉴定所述多核苷酸或多肽融合物的存在来评估所述受试者罹患所述癌症或肿瘤或是易于罹患所述癌症或肿瘤。
55.根据权利要求49至51中任一项所述的方法或用途,其中所述ErbB-2和/或ErbB-3靶向剂选自由以下组成的组:包含结合ErbB-2的胞外部分的第一抗原结合位点和结合ErbB-3的胞外部分的第二抗原结合位点的多特异性抗体、ErbB-2的酪氨酸激酶抑制剂、包含结合ErbB-2的胞外部分的抗原结合位点的单特异性二价抗体、包含结合ErbB-3的胞外部分的抗原结合位点的单特异性二价抗体、或其任何组合。
56.根据权利要求49至51或55中任一项所述的方法或用途,其中所述ErbB-2和/或ErbB-3靶向剂为泽妥珠单抗(zenocutuzumab)。
57.根据权利要求35至56中任一项所述的方法或用途,其中所述异常细胞、癌细胞、肿瘤细胞或样本包含根据权利要求1至17所述的多核苷酸融合物或由其编码的多肽,并且其中所述细胞或样本所包含的多核苷酸融合物进一步包含编码NRG1的EGF样结构域的编码序列的框内融合物。
58.根据权利要求35至57中任一项所述的方法或用途,其中所述异常细胞来自癌症,特别是所述癌症为腺癌,更特别是黏液腺癌、胰脏癌,更特别是胰脏腺癌,更特别是胰脏导管腺癌、肾细胞癌、肉瘤、膀胱癌、大肠癌、直肠癌、大肠直肠癌、胆囊癌、头颈癌、前列腺癌、子宫癌、乳癌、卵巢癌、肝癌、子宫内膜癌、肺癌,优选为非小细胞肺癌,优选地、更优选地为浸润性黏液腺癌、或是原发性癌或转移性癌。
59.一种包含根据权利要求1至17中任一项所述的多核苷酸融合物和/或表达由其所编码的多肽融合物的体内动物模型,其中由所述动物模型所包含的多核苷酸融合物或多肽融合物优选地是由存在于所述动物模型中的移植异常细胞所包含,或是由所述动物模型的基因组所包含。
60.一种用Erb2和/或Erb3靶向剂治疗根据权利要求59所述的体内动物模型的方法,所述靶向剂选自由以下所组成的组:包含结合ErbB-2的胞外部分的第一抗原结合位点和结合ErbB-3的胞外部分的第二抗原结合位点的多特异性抗体、ErbB-2的酪氨酸激酶抑制剂、包含结合ErbB-2的胞外部分的抗原结合位点的单特异性二价抗体、包含结合ErbB-3的胞外部分的抗原结合位点的单特异性二价抗体、或其任何组合,所述方法包括向所述动物施用所述Erb2和/或Erb3靶向剂。
61.一种用于原位杂交测定法以检测VAPB、CADM1、CD44、SLC3A2、VTCN1、CDH1、CXADR、GTF2E2、CSMD1、PTN、ST14、THBS1、AGRN、PVALB、APP、WRN、DAAM1、ASPH、NOTCH2、CD74、SDC4、SLC4A4、ZFAT或DSCAML1的基因重排的第一核酸探针和第二核酸探针,其中:
-用于检测VAPB的基因重排的所述第一探针特异性地与SEQ ID NO:1的位置43的核酸5’处的VAPB序列杂交,且所述第二探针特异性地与位于SEQ ID NO:1的位置43的核酸3’处的VAPB序列杂交;
-用于检测CADM1的基因重排的所述第一探针特异性地与SEQ ID NO:5的位置53的核酸5’处的CADM1序列杂交,且所述第二探针特异性地与位于SEQ ID NO:5的位置53的核酸3’处的CADM1序列杂交;
-用于检测CD44的基因重排的所述第一探针特异性地与SEQ ID NO:9的位置52的核酸5’处的CD44序列杂交,且所述第二探针特异性地与位于SEQ ID NO:9的位置52的核酸3’处的CD44序列杂交;
-用于检测SLC3A2的基因重排的所述第一探针特异性地与SEQ ID NO:13的位置53的核酸5’处的SLC3A2序列杂交,且所述第二探针特异性地与位于SEQ ID NO:13的位置53的核酸3’处的SLC3A2序列杂交;
-用于检测VTCN1的基因重排的所述第一探针特异性地与SEQ ID NO:164的位置65的核酸5’处的VTCN1序列杂交,且所述第二探针特异性地与位于SEQ ID NO:164的位置65的核酸3’处的VTCN1序列杂交;
-用于检测CDH1的基因重排的所述第一探针特异性地与SEQ ID NO:184的位置119的核酸5’处的CDH1序列杂交,且所述第二探针特异性地与位于SEQ ID NO:184的位置119的核酸3’处的CDH1序列杂交;
-用于检测CXADR的基因重排的所述第一探针特异性地与SEQ ID NO:215的位置43的核酸5’处的CXADR序列杂交,且所述第二探针特异性地与位于SEQ ID NO:215的位置43的核酸3’处的CXADR序列杂交;
-用于检测GTF2E2的基因重排的所述第一探针特异性地与SEQ ID NO:231的位置141的核酸5’处的GTF2E2序列杂交,且所述第二探针特异性地与位于SEQ ID NO:231的位置141的核酸3’处的GTF2E2序列杂交;
-用于检测CSMD1的基因重排的所述第一探针特异性地与SEQ ID NO:253的位置88的核酸5’处的CSMD1序列杂交,且所述第二探针特异性地与位于SEQ ID NO:253的位置88的核酸3’处的CSMD1序列杂交;
-用于检测PTN的基因重排的所述第一探针特异性地与SEQ ID NO:311的位置102的核酸5’处的PTN序列杂交,且所述第二探针特异性地与位于SEQ ID NO:311的位置102的核酸3’处的PTN序列杂交;
-用于检测ST14的基因重排的所述第一探针特异性地与SEQ ID NO:328的位置95的核酸5’处的ST14序列杂交,且所述第二探针特异性地与位于SEQ ID NO:328的位置95的核酸3’处的ST14序列杂交;
-用于检测AGRN的基因重排的所述第一探针特异性地与SEQ ID NO:401的位置106的核酸5’处的AGRN序列杂交,且所述第二探针特异性地与位于SEQ ID NO:401的位置106的核酸3’处的AGRN序列杂交;
-用于检测THBS1的基因重排的所述第一探针特异性地与SEQ ID NO:374的位置56的核酸5’处的THBS1序列杂交,且所述第二探针特异性地与位于SEQ ID NO:374的位置56的核酸3’处的THBS1序列杂交;
-用于检测PVALB的基因重排的所述第一探针特异性地与SEQ ID NO:435的位置102的核酸5’处的PVALB序列杂交,且所述第二探针特异性地与位于SEQ ID NO:435的位置102的核酸3’处的PVALB序列杂交;
-用于检测SLC3A2的基因重排的所述第一探针特异性地与SEQ ID NO:452的位置93的核酸5’处的SLC3A2序列杂交,且所述第二探针特异性地与位于SEQ ID NO:452的位置93的核酸3’处的SLC3A2序列杂交;
-用于检测APP的基因重排的所述第一探针特异性地与SEQ ID NO:484的位置54的核酸5’处的APP序列杂交,且所述第二探针特异性地与位于SEQ ID NO:484的位置54的核酸3’处的APP序列杂交;
-用于检测WRN的基因重排的所述第一探针特异性地与SEQ ID NO:526的位置96的核酸5’处的WRN序列杂交,且所述第二探针特异性地与位于SEQ ID NO:526的位置96的核酸3’处的WRN序列杂交;
-用于检测DAAM1的基因重排的所述第一探针特异性地与SEQ ID NO:603的位置75的核酸5’处的DAAM1序列杂交,且所述第二探针特异性地与位于SEQ ID NO:603的位置75的核酸3’处的DAAM1序列杂交;
-用于检测ASPH的基因重排的所述第一探针特异性地与SEQ ID NO:633的位置75的核酸5’处的ASPH序列杂交,且所述第二探针特异性地与位于SEQ ID NO:633的位置75的核酸3’处的ASPH序列杂交;
-用于检测NOTCH2的基因重排的所述第一探针特异性地与SEQ ID NO:691的位置75的核酸5’处的NOTCH2序列杂交,且所述第二探针特异性地与位于SEQ ID NO:691的位置75的核酸3’处的NOTCH2序列杂交;
-用于检测CD74的基因重排的所述第一探针特异性地与SEQ ID NO:715的位置75的核酸5’处的CD74序列杂交,且所述第二探针特异性地与位于SEQ ID NO:715的位置75的核酸3’处的CD74序列杂交;
-用于检测SDC4的基因重排的所述第一探针特异性地与SEQ ID NO:741的位置75的核酸5’处的SDC4序列杂交,且所述第二探针特异性地与位于SEQ ID NO:741的位置75的核酸3’处的SDC4序列杂交;
-用于检测CD44的基因重排的所述第一探针特异性地与SEQ ID NO:759的位置75的核酸5’处的CD44序列杂交,且所述第二探针特异性地与位于SEQ ID NO:759的位置75的核酸3’处的CD44序列杂交;
-用于检测SLC4A4的基因重排的所述第一探针特异性地与SEQ ID NO:763的位置75的核酸5’处的SLC4A4序列杂交,且所述第二探针特异性地与位于SEQ ID NO:763的位置75的核酸3’处的SLC4A4序列杂交;
-用于检测SDC4的基因重排的所述第一探针特异性地与SEQ ID NO:822的位置75的核酸5’处的SDC4序列杂交,且所述第二探针特异性地与位于SEQ ID NO:822的位置75的核酸3’处的SDC4序列杂交;
-用于检测ZFAT的基因重排的所述第一探针特异性地与SEQ ID NO:826的位置75的核酸5’处的ZFAT序列杂交,且所述第二探针特异性地与位于SEQ ID NO:826的位置75的核酸3’处的ZFAT序列杂交;或
-用于检测DSCAML1的基因重排的所述第一探针特异性地与SEQ ID NO:866的位置75的核酸5’处的DSCAML1序列杂交,且所述第二探针特异性地与位于SEQ ID NO:866的位置75的核酸3’处的DSCAML1序列杂交。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
NL2028384 | 2021-06-03 | ||
NL2030006 | 2021-12-03 | ||
NL2030006 | 2021-12-03 | ||
PCT/NL2022/050302 WO2022255871A2 (en) | 2021-06-03 | 2022-06-01 | New nrg1 fusions, fusion junctions and methods for detecting them |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117460844A true CN117460844A (zh) | 2024-01-26 |
Family
ID=81927825
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280040112.2A Pending CN117460844A (zh) | 2021-06-03 | 2022-06-01 | 新nrg1融合物、融合接点以及检测它们的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117460844A (zh) |
-
2022
- 2022-06-01 CN CN202280040112.2A patent/CN117460844A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220372582A1 (en) | Tert promoter mutations in cancer | |
EP3062106B1 (en) | Method for determining androgen receptor variants in prostate cancer | |
AU2005227148B2 (en) | Mutations of the PIK3CA gene in human cancers | |
EP2706068B1 (en) | Identification of tumor-associated markers for diagnosis and therapy | |
JP2008546387A (ja) | 癌を処置および診断するための組成物および方法 | |
JP2009501004A (ja) | 切除された膵臓癌のサージカルマージンにおける分子/遺伝子の異常により、疾患転帰と相関する新生物疾患を示す方法 | |
US10183991B2 (en) | Antibodies that recognize a DENN/MADD-domain-containing 1A variant 2 (DENND1A variant 2) | |
EP2894169B1 (en) | Fusion protein comprising axl and composition for treating cancer comprising same | |
JP6858563B2 (ja) | Braf変異検出によるegfr阻害剤の効果予測 | |
WO2011085134A2 (en) | Methods and compositions for the diagnosis, prognosis and treatment of cancer | |
Schreuder et al. | Mutual exclusion of t (11; 18)(q21; q21) and numerical chromosomal aberrations in the development of different types of primary gastric lymphomas | |
WO2009126804A2 (en) | Expression of kir in human cancer cells as a biomarker for immuno-escape and cancer metastasis | |
CN117460844A (zh) | 新nrg1融合物、融合接点以及检测它们的方法 | |
WO2021198303A1 (en) | New method of prostate cancer diagnosis | |
Coppola | Molecular pathology and diagnostics of cancer | |
CN101365800B (zh) | 用于确定ck19表达的组合物和方法 | |
EP4347893A2 (en) | New nrg1 fusions, fusion junctions and methods for detecting them | |
CN110713544B (zh) | 融合基因plekha6-ntrk3及其在lch中的应用 | |
JP7410480B2 (ja) | がんにおける融合遺伝子 | |
JP6806440B2 (ja) | 新規融合体及びその検出法 | |
WO2017111129A1 (ja) | 急性リンパ性白血病関連の新規遺伝学的異常及びその利用 | |
US7504212B2 (en) | Cancer monitoring and therapeutics | |
WO2013142982A1 (en) | Colca1 and colca2 and their use for the treatment and risk assessment of colon cancer | |
KR102089371B1 (ko) | 혈관면역아세포성 t 세포 림프종 진단용 마커 및 이의 용도 | |
Ruhen | Comprehensive genomic profiling of circulating tumour DNA and tumour-derived extracellular vesicles from breast cancer patients |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |