AT505726A2 - Set von tumor-markern - Google Patents

Set von tumor-markern Download PDF

Info

Publication number
AT505726A2
AT505726A2 AT0135907A AT13592007A AT505726A2 AT 505726 A2 AT505726 A2 AT 505726A2 AT 0135907 A AT0135907 A AT 0135907A AT 13592007 A AT13592007 A AT 13592007A AT 505726 A2 AT505726 A2 AT 505726A2
Authority
AT
Austria
Prior art keywords
tumor markers
pii
specific
markers
tumor
Prior art date
Application number
AT0135907A
Other languages
English (en)
Original Assignee
Arc Austrian Res Centers Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Arc Austrian Res Centers Gmbh filed Critical Arc Austrian Res Centers Gmbh
Priority to AT0135907A priority Critical patent/AT505726A2/de
Priority to EP08782839.8A priority patent/EP2191272B1/de
Priority to CN200880111283A priority patent/CN101821628A/zh
Priority to PCT/AT2008/000311 priority patent/WO2009026605A2/en
Priority to US12/675,736 priority patent/US20110152110A1/en
Priority to CN201610885157.6A priority patent/CN106483290B/zh
Priority to ES08782839T priority patent/ES2429299T3/es
Publication of AT505726A2 publication Critical patent/AT505726A2/de
Priority to US14/691,405 priority patent/US10100364B2/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/60Complex ways of combining multiple protein biomarkers for diagnosis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Description

1
Die vorliegende Erfindung betrifft den Bereich der Krebsdiagnose und diagnostische Mittel dafür.
Schilddrüsenknötchen sind in Gebieten mit lodmangel, wie den europäischen Alpenregionen, endemisch, wo sie eine Prävalenz von 10-20% haben. Sie werden durch ihre Histologie in die 2 gutartigen Typen Struma nodosa (SN) und follikuläres Schilddrüsenadenom (FTA) und die bösartigen Gebilde follikuläres Schilddrüsenkarzinom (FTC), papilläres Schilddrüsenkarzinom (PTC), medulläres Schilddrüsenkarzinom (MTC) und anaplastisches Schilddrüsenkarzinom (ATC) klassifiziert. Herkömmlicherweise wird Unterscheidung zwischen gutartigen und bösartigen Schilddrüsenknötchen durch Szintigraphie und Feinnadelaspiration, gefolgt von Histologie durchgeführt. Trotz vieler Fortschritte bei der Diagnose und Therapie von Schilddrüsenknötchen und Schilddrüsenkrebs haben diese Verfahren einen gut bekannten Mangel an Spezifität, insbesondere für die Unterscheidung zwischen FTA und FTC, was dazu führt, dass eine Anzahl von Patienten unnötigerweise auf bösartige Krankheit behandelt wird.
In Anbetracht der diagnostischen Beschränkungen von vorhergehenden Verfahren, insbesondere Feinnadelaspiration gefolgt von Zytologie, haben mannigfaltige Forscher Expressionsprofilierungsstudien mit der Hoffnung durchgeführt, neue diagnostische Werkzeuge zu identifizieren. Solche Analysen versuchen unterschiedlich exprimierte Gene mit einer wichtigen Rolle bei Krankheitsentwicklung oder Fortschreiten unter Verwendung von Transkriptlevel Expressions-Profiling-Technologien in großem Maßstab wie cDNA Microarrays, Oligonukleotid-Arrays und Serieller Analyse von Genexpression (SAGE) zu identifizieren. Typischerweise werden Duzende oder Hunderte von Genen identifiziert, wobei von vielen erwartet wird, dass sie falsche Positive sind, und nur ein kleiner Bruchteil als diagnostische/prognostische Marker oder therapeutische Ziele brauchbar ist (Griffith et al., J. Clin. Oncol. 24 (31): 5043-5051 (2006)).
Bei anderen Krebstypen ist gezeigt worden, dass Genexpressi-ons-Profiling wesentlichen Wert zur Unterscheidung der verschiedenen klinisch relevanten Tumorgebilde beitragen kann. US-2006/183141 A beschreibt z.B. Klassifizierung von Tumormarkern aus einer Kern-Serumantwort-Signatur. Verschiedene Studien haben versucht, die verschiedenen Gebilde von Schilddrüsenkarzi-
NACHGEREICHT
• * ·· ···« • · · · · · • · · · · • ♦ · · · • · · · ♦ · - 2 - nom auf der Basis ihrer Genexpressionsprofile zu klassifizieren, von denen jedes zwischen 2 der 5 Gebilde unterscheidet. Jedoch haben die Studien keine oder nur sehr wenige Gene gemeinsam und Anwenden eines Klassifikators von einer Studie auf die Daten von einer anderen Studie ergeben im Allgemeinen schlechte Klassifizierungsergebnisse.
Es ist ein Ziel der vorliegenden Erfindung, verlässliche unterscheidende Marker für die Diagnose von Krebs vorzusehen, insbesondere um gutartige Schilddrüsenknötchen von bösartigem follikulärem Schilddrüsenkarzinom (FTC) und papillärem Schilddrüsenkarzinom (PTC) zu unterscheiden.
Daher sieht die vorliegende Erfindung ein Set von Komponenten vor, welche für mindestens 3 Tumormarker spezifisch sind, ausgewählt aus den Tumormarkern PI-1 bis PI-33, PII-1 bis PII-64, PIII-1 bis PIII-70, fi-1 bis fi-147, PIV-1 bis PIV-9, vorzugsweise PIV-4 oder PIV-5, und PV-1 bis PV-11, vorzugsweise PV-1, PV-2 und PV-4 bis PV-11. Diese Tumormarker betreffen verschiedene Gene, welche aberrierend in Tumoren exprimiert werden, und werden in Tabellen 1 bis 6 angegeben und können durch ihr Genidentifizierungszeichen, ihren deskriptiven Gennamen, aber am eindeutigsten durch ihre UniGenelD oder ihre Eingangsnummer identifiziert werden, welche sich auf spezifische Sequenzen in üblichen Sequenz-Datenbanken bezieht, wie NCBI GenBank, EMBL-EBI Database, EnsEMBL oder die DNA Data Bank von Japan. Diese Marker sind in Form von bevorzugten Sets (PI bis PV, FI) identifiziert worden, aber können für das Set der Erfindung in jeder Form als Ziele vereinigt werden.
Tabelle 1: PTC-Markerset PI-1 bis PI-33
Num mer PI- Marker- gen Beschreibung des Gens Eingangsnummer UniGenelD 1 BBS9 Bardet-Bied Syndrom 9 NM 198428 NM 001033605 NM 001033604 NM 014451 Hs.372360 2 C13orf1 Chromosom 13 offenes Leseraster 1 NM 020456 Hs.44235 3 CB- FA2T3 Kern-bindender Faktor, Runt Domäne, alpha Untereinheit 2 NM 005187 NM 175931 Hs.513811 4 CDT1 Chromatin Lizenzierung und DANN Replikationsfaktor 1 NM 030928 Hs. 122908
NACHGEF.BC. iT ♦ · ·♦ ♦♦♦♦ • · · · · · • · · · · • · · · · • · · · · «
- 3 -
5 CRK V-crk Sarkom Virus CT10 Onkogen Homolog (Avian) NM 016823 NM 005206 Hs.638121 6 CTPS CTP Synthase NM 001905 Hs.473087 7 DAPK2 Tod-assoziierte Proteinkinase 2 NM 014326 Hs.237886 8 EIF5 Eukaryotischer Translation-Initiationsfaktor 5 NM 001969 NM 183004 Hs.433702 9 EREG Epiregulin NM 001432 Hs.115263 10 GK Glycerinkinase NM 203391 NM 000167 Hs.1466 11 GPAT- CH8 G Patch Domain enthaltend 8 NM 001002909 Hs.463129 12 HDGF Hepatoma-abgeleiteter Wachstumsfaktor (High-Mobility-Group Protein 1-ähnlich) NM 004494 Hs.506748 13 IRF2BP1 Interferon regulatorischer Faktor 2 Bindungsprotein 1 NM 015649 Hs.515477 14 KRT83 Keratin 83 NM 002282 Hs.661428 15 MYOD1 Myogene Differenzierung 1 NM 002478 Hs.181768 16 NME6 Nicht-metastatische Zellen 6, Protein exprimiert in (Nukleosid-Diphosphat Kinase) NM 005793 Hs.465558 17 POLE3 Polymerase (DNA dirigiert), Epsilon 3 (p17 Untereinheit) NM 017443 Hs.108112 18 PPP1R1 3B Proteinphosphatase 1, regulatorische (Inhibitor) Untereinheit 13B NM 015316 Hs.436113 19 PRPH2 Peripherin 2 (retinale Degeneration, langsam) NM 000322 Hs.654489 20 RASSF7 RAS-Aassoziations (RalGDS/AF-6) Domänen Familie 7 NM 003475 Hs.72925 21 ROCK2 Rho-assoziiert, Coiled-Coil enthaltende Proteinkinase 2 NM 004850 Hs.591600 22 RTN1 Reticulon 1 NM 021136 NM 206857 NM 206852 Hs.368626 23 S100B S100 Calcium-bindendes Protein B NM 006272 Hs.422181 24 SLIT2 Slit homolog 2 (Drosophila) NM 004787 Hs.29802 25 SNRPB2 Kleines nukleares Ribonucleoprotein Polypeptid B" NM 003092 NM 198220 Hs.280378 26 SPAG7 Sperma-assoziiertes Antigen 7 NM 004890 Hs.90436 27 STAU1 Staufen, RNA Bindungsprotein, Homolog 1 (Drosophila) NM 017453 NM_001037328 NM 004602 NM 017452 NM 017454 Hs.596704 28 SUPT5H Suppressor von Tv 5 Homolog (S. cerevisiae) NM 003169 Hs.631604 29 TBX10 T-Box10 NM_ 005995 Hs.454480 30 TLK1 Tousled-ähnliche Kinase 1 NM 012290 Hs.655640 31 TM4SF4 TransMembran 4 L six Familie Mitglied 4 NM_ 004617 Hs.133527 32 7XN Thioredoxin NM 003329 Hs.435136 33 UFD1L Ubiouitin fusion deoradation 1 ähnlich (Hefe) NM 005659 NM 001035247 NACHGE REICHT
• · - 4 -
Tabelle 2: PTC Markerset PII-1 bis PII-64
Num mer Pli- Marker- aen Beschreibung des Gens Eingangsnummer UniGenelD 1 ADH1B Alkohol Dehydrogenase IB (Klasse I), beta Polypeptid NM 000668 Hs.4 2 AGR2 Anterior Gradient Homolog 2 (Xenopus laevis) NM 006408 Hs.530009 3 AGTR1 Angiotensin II Rezeptor, Typ 1 NM 031850 NM 004835 NM 009585 NM 032049 Hs.477887 4 AGTR1 Angiotensin II Rezeptor, Typ 1 NM 000685 Hs.654382 5 ALDH1A1 Aldehyd Dehydrogenase 1 Familie, Mitglied A1 NM 000689 Hs.76392 6 ALDH1A3 Aldehyd Dehydrogenase 1 Familie, Mitglied A3 NM 000693 Hs.459538 7 AMIG02 Adhäsionsmolekül mit Ig-ähnlicher Domaine 2 NM 181847 Hs.121520 8 ATP2C2 ATPase, Ca++ transportierend, Typ 2C, Mitglied 2 NM 014861 Hs.6168 9 BID BH3 interagierende Domäne Tod-Agonist NM 197966 NM 001196 NM 197967 Hs.591054 10 C7orf24 Chromosom 7 offenes Leseraster 24 NM 024051 Hs.530024 11 CA4 Carbonische Anhydrase IV NM 000717 Hs.89485 12 CCL21 Chemokin (C-C Motiv) Ligand 21 NM 002989 Hs.57907 13 CD55 CD55 Molekül, Zerfall-Beschleunigungsfaktor für Komplement (Cromer blood group) NM 000574 Hs.527653 14 CDH16 Cadherin 16, KSP-Cadherin NM 004062 Hs.513660 15 CDH3 Cadherin 3, Typ 1, P-Cadherin (plazental) NM 133458 NM 001793 Hs.461074 16 CFI Komplement-Faktor I NM 000204 Hs.312485 17 CHI3L1 Chitinase 3-ähnlich 1 (Cartilage Glycoprotein-39) NM 001276 Hs.382202 18 CHST2 Kohlenhydrat (N-Acetylglucosamin-6-O) Sulfotransferase 2 NM 004267 Hs.8786 19 CITED2 Cbp/p300-interagierender Transaktivator, mit Glu/Asp-reicher carboxyterminaler Domäne, 2 NM 006079 Hs.82071 20 CLCNKB Chlorid-Kanal Kb NM 000085 Hs.352243 21 COMP Cartilage Oligomeres Matrixprotein NM 000095 Hs. 1584 22 CTSH Cathepsin H NM 004390 NM 148979 Hs.148641 23 DI02 Deiodinase, lodthyronin, Typ II NM 013989 NM 000793 NM 001007023 Hs.202354
NACHGEF.BC: TT 24 DIRAS3 Dl RAS Familie, GTP-bindend RAS-ähnlich 3 NM 004675 Hs.194695 25 DUSP4 Dual spezifische Phosphatase 4 NM 057158 NM 001394 Hs.417962 26 DUSP5 Dual spezifische Phosphatase 5 NM 004419 Hs.2128 27 EDN3 Endothelin 3 NM 207032 NM 207034 NM 207033 NM 000114 Hs. 1408 28 ENTPD1 Ectonucleosid Triphosphat Diphosphohydrolase 1 NM 001776 NM 001098175 Hs.576612 29 FHL1 Vier und eine Halbe LIM Domänen 1 NM 001449 Hs.435369 30 GDF15 Wachstumsdifferenzierungsfaktor 15 NM 004864 Hs.616962 31 GPM6A Glvcoprotein M6A NM 201591 NM 005277 NM 201592 Hs.75819 32 HBA1 Hämoglobin, alpha 1 NM 000558 Hs.449630 33 IRS1 Insulin Rezeptor Substrat 1 NM 005544 Hs.471508 34 KCNJ2 Einwärts gleichrichtender Kaliumkanal, Unterfamilie J, Mitglied 2 NM 000891 Hs. 1547 35 KCNN4 Calcium-aktivierter Kaliumkanal von mittlerer/niedriger Leitfähigkeit, Unterfamilie N, Mitglied 4 NM 002250 Hs.10082 36 KLK10 Kailikrein-bezogene Peptidase 10 NM 002776 NM 001077500 NM 145888 Hs.275464 37 LAMB3 Laminin, beta 3 NM 001017402 NM 000228 Hs.497636 38 LCN2 Lipocalin 2 (Onkogen 24p3) NM 005564 Hs.204238 39 LMOD1 Leiomodin 1 (Glattmuskel) NM 012134 Hs.519075 40 MATN2 Matrilin 2 NM 002380 NM 030583 Hs.189445 41 MPPED2 Metallophosphoesterase Domäne enthaltend 2 NM 001584 Hs.289795 42 MVP Major-Vault-Protein NM 017458 NM 005115 Hs.632177 43 NELL2 NEL-ähnlich 2 (Huhn) NM 006159 Hs.505326 44 NFE2L3 Nuklearer Faktor (Erythroid-abgeleitet 2)-ähnlich 3 NM 004289 Hs.404741 45 NPC2 Niemann-Pick Krankheit, Typ C2 NM 006432 Hs.433222 46 NRCAM Neuronales ZelladhäsionsmolekUI NM 001037132 NM 005010 NM 001037133 Hs.21422 47 NRIP1 Nuklearrezeptor interagierendes Protein 1 NM 003489 Hs.155017 48 PAPSS2 3'-Phosphoadenosin 5-Phosphosulfat Synthase 2 NM 001015880 NM 004670 Hs.524491 49 PDLIM4 PDZ und LIM Domäne 4 NM 003687 Hs.424312 50 PDZ- K1IP1 PDZK1 interagierendes Protein 1 NM 005764 Hs.431099 51 PIP3-E Phosphoinositid-bindendes Protein PIP3-E NM 015553 Hs.146100 52 PLAU Plasminogen Aktivator, Urokinase NM 002658 Hs.77274 53 PRSS2 Protease, Serin, 2 (Trypsin 2) NM 002770 Hs.622865 54 PRSS23 Protease, Serin, 23 NM 007173 Hs.25338 55 RAP1- GAP RAP1 GTPase aktivierendes Protein NM 002885 Hs.148178 56 S100A11 S100 Calcium bindendes Protein A11 NM 005620 Hs.417004
I #· ♦ # ···· • • • · • · • ·· ·· • · • · • ♦ • »·· • * • • • • • • · • · • • • · - 6 - 57 SFTPB Surfaktant, pulmonal-assoziiertes Protein B NM 198843 NM 000542 Hs.512690 58 SLPI Sekretorischer Leukozyten Peptidase Inhibitor NM 003064 Hs.517070 59 SOD3 Superoxid Dismutase 3, extrazellulär NM 003102 Hs.2420 60 SPINT1 Serin-Peptidase Inhibitor. Kunitz Typ 1 NM 181642 NM 003710 NM 001032367 Hs.233950 61 SYNE1 Spectrin repeat containing, nuclear envelope 1 NM 182961 NM 033071 NM 015293 NM 133650 Hs.12967 62 TACSTD2 Tumor-assoziierter Calcium Signal-Transducer 2 NM 002353 Hs.23582 63 UPP1 Uridin-Phosphorylase 1 NM 181597 NM 003364 Hs.488240 64 WASF3 WAS Proteinfamilie, Mitglied 3 NM_006646 Hs.635221
Tabelle 3: PTC Markerset PIII-1 bis PIII-70 Nummer P III- Markergen Beschreibung des Gens Eingangsnummer UniGenelD 1 APOE Apolipoprotein E NM 000041 Hs.654439 2 ATIC 5-Aminoimidazol-4-carboxamid Ribonu-kleotid Formyltransferase/IMP Cyclohy-drolase NM 004044 Hs.90280 3 BASP1 Brain abundant, Membran-gebundenes Signalprotein 1 NM 006317 Hs.201641 4 C9orf61 Chromosom 9 offenes Leseraster 61 NM 004816 Hs.118003 5 CCL13 Chemokin (C-C Motiv) Ligand 13 NM 005408 Hs.414629 6 CD36 CD36 Molekül (Thrombospondin-Rre-zeptor) NM 001001548 NM 001001547 NM 000072 Hs.120949 7 CDH6 Cadherin 6, Typ 2, K-Cadherin (fötal Niere) NM 004932 Hs.171054 8 CFB Komplement-Faktor B NM 001710 Hs.69771 9 CFD Komplement-Faktor D (Adipsin) NM 001928 Hs.155597 10 CLDN10 Claudin 10 NM 182848 NM 006984 Hs.534377 11 COL11A1 Collagen, Typ XI, alpha 1 NM 080629 NM 001854 NM 080630 Hs.523446 12 COL13A1 Collagen, Type XIII, alpha 1 NM 005203 NM 080804 NM 080798 NM 080803 NM 080802 NM 080799 NM 080800 NM 080801 NM 080808 NM 080809 NM 080805 NM 080807 NM 080806 NM 080811 NM 080810ΝΜ 080812 NM 080813 NM 080814 NM 080815 Hs.211933 13 COR02B Coronin, Actin-bindendes Protein, 2B NM 006091 Hs.551213 14 CRLF1 Cytokin-Rezeptor-ähnlicher Faktor 1 NM 004750 Hs.114948 15 CXorf6 Chromosom X offenes Leseraster 6 NM 005491 Hs.20136 16 DDB2 Defekt-spezifisches DNA-Bbindungspro-tein 2, 48kDa NM 000107 Hs.655280 17 DPP6 Dipeptidyl-Peptidase 6 NM 001039350 NM 130797 NM 001936 Hs.490684 18 ECM1 Extrazelluläres Matrixprotein 1 NM 004425 NM 022664 Hs.81071
19 EFEMP1 ·· ·· ··♦· ψ • · · · · ·· • · · · · · • ♦ · t · • · ♦ · · · « ♦ ♦ ·« ·♦ Mt - 7 - EGF-enthaltendes Fibulin-ähnliches extrazelluläres Matrixprotein 1 ♦ ·· ·· · • ··« • · · ··« ·· NM 004105 NM 001039348 NM 001039349 Hs.76224 20 ESRRG Estrogen-bezogener Rezeptor gamma NM 206594 NM 001438 NM 206595 Hs.444225 21 ETHE1 Ethylmalonsäure-Enzephalopathie 1 NM 014297 Hs.7486 22 FAS Fas (TNF-Rrezeptor Überfamilie, Mitglied 6)_ NM 000043 NM 152872 NM 152871 NM 152873 NM 152875 NM 152874 NM 152877 NM 152876 Hs.244139 23 FMOD Fibromodulin NM 002023 Hs.519168 24 GABBR2 Gamma-Aminobuttersäure (GABA) B Rezeptor, 2 NM 005458 Hs.198612 25 GALE UDP-Galactose-4-Epimerase NM 000403 NM 001008216 Hs.632380 26 GATM Glycine-Amidinotransferase (L-Arginine:Glycin-Amidinotransferase) NM 001482 Hs.75335 27 GDF10 Wachstumsdifferenzierungsfaktor 10 NM 004962 Hs.2171 28 GHR Wachstumshormonrezeptor NM 000163 Hs.125180 29 GPC3 Glypican 3 NM 004484 Hs.644108 30 ICAM1 Interzelluläres Adhäsionsmolekül 1 (CD54), humaner Rhinovirus-Rezeptor NM 000201 Hs.643447 31 ID3 Inhibitor von DNA bindendem 3, dominant negativem Helix-Schleife-Helix Protein NM 002167 Hs.76884 32 IER2 Immediate-Early-Respons 2 NM 004907 Hs.501629 33 IGFBP6 Insulin-ähnliches Wachstumsfaktor bindendes Protein 6 NM 002178 Hs.274313 34 IQGAP2 IQ Motiv enthaltendes GTPase aktivierendes Protein 2 NM 006633 Hs.291030 35 ITGA2 Integrin, alpha 2 (CD49B, alpha 2 Untereinheit von VLA-2 Rezeptor) NM 002203 Hs.482077 36 ITGA3 Integrin, alpha 3 (Antigen CD49C, alpha 3 Untereinheit von VLA-3 Rezeptor) NM 002204 NM 005501 Hs.265829 37 ITM2A Integrales Membranprotein 2A NM 004867 Hs.17109 38 KIAA0746 KIAA0746 Protein NM 015187 Hs.479384 39 LRIG1 Leucin-reiche Wiederholungen und Immunoglobulin-ähnliche Domänen 1 NM 015541 Hs.518055 40 LRP2 niedrigdichtes Lipoprotein-bezogenes Protein 2 NM 004525 Hs.470538 41 LY6E Lymphozyten Antigen 6 Lomplex, Lokus E NM 002346 Hs.521903 42 MAPK13 Mitogen-aktivierte Proteinkinase 13 NM 002754 Hs. 178695 43 MDK Midkin (Neurit wachstumsfördernder Faktor 2) NM 001012334 NM 001012333 NM 002391 Hs.82045 44 MLLT11 Myeloid/Lymphoid oder Leukämie von gemischter Abstammung (trithorax homolog, Drosophila) NM 006818 Hs.75823 45 MMRN1 Multimerin 1 NM 007351 Hs.268107 46 MTMR11 Myotubularin-bezogenes Protein 11 NM 181873 Hs.425144 47 MXRA8 Matrix-Remodelling assoziiertes 8 NM 032348 Hs.558570 48 NAB2 NGFI-A Bindungsprotein 2 (EGR1 Bindungsprotein 2) NM 005967 Hs. 159223 49 NMU Neuromedin U NM 006681 Hs.418367 50 OCA2 Okulokutaner Albinismus II (pink-eye di-lution homolog, Maus) NM 000275 Hs.654411 51 PDE5A Phosphodiesterase 5A, cGMP-spezifisch NM 001083 NM 033430 NM 033437 Hs.647971 52 PLAG1 Pleiomorphes Adenom-Gen 1 NM 002655 Hs. 14968
NACHGEREICHT 53 PLP2 Proteolipidpprotein 2 (Kolonepithelium-angereichert) NM 002668 Hs.77422 54 PLXNC1 Plexin C1 NM 005761 Hs.584845 55 PRKCQ Proteinkinase C, theta NM 006257 Hs.498570 56 PRUNE Prune homolog (Drosophila) NM 021222 Hs.78524 57 RAB27A RAB27A, Mitglied RAS Onkogen Familie NM 004580 NM 183234 NM 183235 NM 183236 Hs.654978 58 RYR2 Ryanodin-Rezeptor 2 (Herz) NM 001035 Hs.109514 59 SCEL Sciellin NM 144777 NM 003843 Hs.534699 60 SE- LENBP1 Selenium bindendes Protein 1 NM 003944 Hs.632460 61 SORBS2 Sorbin und SH3 Domäne enthaltend 2 NM 021069 NM 003603 Hs.655143 62 STMN2 Stathmin-ähnlich 2 NM 007029 Hs.521651 63 TBC1D4 TBC1 Domänen-Familie, Mitglied 4 NM 014832 Hs.210891 64 TM4SF4 Transmembran 4 L six Familie Mitglied 4 NM 004617 Hs. 133527 65 TNC Tenascin C (Hexabrachion) NM 002160 Hs. 143250 66 TPD52L1 Tumorprotein D52-ähnlich 1 NM 001003395 NM 003287 NM 001003396 NM 001003397 Hs.591347 67 TSC22D1 TSC22 Domänen-Familie,Mitglied 1 NM 183422 NM 006022 Hs.507916 68 TTC30A Tetratricopeptid Wiederholungsdomäne 30A NM 152275 Hs.128384 69 VLDLR Sehr niedrigdichter Lipoproteinrezeptor NM 003383 NM 001018056 Hs.370422 70 WFS1 Wolfram-Syndrom 1 (Wolframin) NM 006005 Hs.518602
Tabe. .le 4: FTC Markerset FI-1 bis FI-147 Num mer Fl- Markergen Beschreibung des Gens Eingangsnummer UniGenelD 1 AATF Apoptose antagonisierender Transkriptionsfaktor NM 012138 Hs.195740 2 ACOX3 Acyl-Coenzym A Oxidase 3, Pristanoyl NM 003501 Hs.479122 3 AHDC1 AT-Haken, DNA bindendes Motiv, enthaltend 1 NM 001029882 Hs.469280 4 ALAS2 Aminolevulinat, delta-, Synthase 2 (sideroblastische/hypochrome Anämie) NM 000032 NM 001037968 NM 001037967 NM 001037969 Hs.522666 5 ALKBH1 AlkB, Alkylierung Repair Homolog 1 (E. coli) NM 006020 Hs.94542 6 ANGPTL2 Angiopoietin-ähnlich 2 NM 012098 Hs.653262 7 AP2A2 Adaptor-bezogener Proteinkomplex 2, al-pha 2 Untereinheit NM 012305 Hs. 19121 8 APOBEC3G Apolipoprotein B mRNA editierendes Enzym, katalytisch Polypeptid-ähnlich 3G NM 021822 Hs.660143 9 APRIN Androgen-induzierter Proliferationshemmer NM 015032 Hs.693663 10 ARNT Aryl Kohlenwasserstoff Rezeptor nuklearer Translokator NM 001668 NM 178427 NM 178426 Hs.632446 11 AZGP1 Alpha-2-Glycoprotein 1, Zink-bindend NM 001185 Hs.546239 12 BAT2D1 BAT2 Domäne enthaltend 1 NM 015172 Hs.494614 13 BATF Basischer Leukin-Zipper Transkriptionsfaktor, ATF-ähnlich NM 006399 Hs.509964
NACHGEF.EICHT 14 BPHL Biphenyl hydrolase-ähnlich (Serin-Hhydro-lase NM 004332 Hs.10136 15 C13orf1 Chromosom 13 offenes Leseraster 1 NM 020456 Hs.44235 16 C14orf1 Chromosom 14 offenes Leseraster 1 NM 007176 Hs.15106 17 C2orf3 Chromosom 2 offenes Leseraster 3 NM 003203 Hs.303808 18 CBFB Kern-bindender Faktor, beta Untereinheit NM 001755 NM 022845 Hs.460988 19 CBR3 Carbonyl-Rreduktase 3 NM 001236 Hs.154510 20 CBX5 Chromobox Homolog 5 (HP1 alpha Homolog, Drosophila) NM 012117 Hs.632724 21 CCNE2 Cyclin E2 NM 057749 NM 057735 Hs.567387 22 CD46 CD46 Molekül, Komplement regulatorisches Protein NM 002389 NM 172354 NM 172351 NM 172355 NM 172352 NM 172359 NM 172357 NM 172360 NM 153826 NM 172358 NM 172356 NM 172353 NM 172361 NM 172350 Hs.510402 23 CHPF Chondroitin polymerisierender Faktor NM 024536 Hs.516711 24 CHST3 Kohlenhydrat (Chondroitin 6) Sulfotrans-ferase 3 NM 004273 Hs. 158304 25 CLCN2 Chlorid-Kanal 2 NM 004366 Hs.436847 26 CLCN4 Chlorid-Kanal 4 NM 001830 Hs.495674 27 CLIC5 Chlorid intrazellulärer Kanal 5 NM 016929 Hs.485489 28 CNOT2 CCR4-NOT Transkriptionskomplex, Untereinheit 2 NM 014515 Hs. 133350 29 COPS6 COP9 konstitutive photomorphogene homologe Untereinheit 6 (Arabidopsis) NM 006833 Hs. 15591 30 CPZ Carboxypeptidase Z NM 001014448 NM 001014447 NM 003652 Hs.78068 31 CSK C-src Tyrosinkinase NM 004383 Hs.77793 32 CTDP1 CTD (Carboxy-terminale Domäne, RNA Polymerase II, Polypeptide A) Phosphatase, Untereinheit 1 NM 004715 NM 048368 Hs,465490 33 DDEF2 Entwicklung and Differenzierung verstärkender Faktor 2 NM 003887 Hs.555902 34 DKFZ- P586H2123 Regenerations-assoziierte Muskelprotease NM 015430 NM 001001991 Hs.55044 35 DLG2 Scheiben, großes Homolog 2, Chapsyn-110 (Drosophila) NM 001364 Hs.654862 36 DPAGT1 Dolichyl-Phosphat (UDP-N-Acetylglucosa-min) N-Acetylglucosaminphosphotransfera-se 1 (GlcNAc-1-P Transferase) NM 001382 NM 203316 Hs.524081 37 DSCR1 Down Syndrom kritische Region Gen 1 NM 004414 NM 203418 NM 203417 Hs.282326 38 DUSP8 Dual-spezifische Phosphatase 8 NM. 004420 Hs.41688
NACHGEREICHT ·· ♦ ·9 #· · • ··· • · « • · · ·♦♦ f» ·· ···· · • · # · · ·« t · · · t · • · · · ♦ · • · · · · · ·♦ ·· #· ·♦· - 10 - 39 EI24 Etoposid-induzierte 2.4 mRNA NM 004879 NM 001007277 Hs.643514 40 ENOSF1 Enolase Überfamilie Mitglied 1 NM 017512 Hs.369762 41 ERCC1 Excision-Repair kreuz-komplementierende Nager Repair-Deficiency Komplementierungsgruppe 1 (schließt überlappende Antisense-Sequenz ein) NM 202001 NM 001983 Hs.435981 42 ERCC3 Excision Repair kreuz-komplementierende Nager Repair-Deficiency, Komplementierungsgruppe 3 (Xeroderma pigmentosum Gruppe B komplementierend) NM 000122 Hs.469872 43 ERH Verstärker von rudimentärem Homolog (Drosophila) NM 004450 Hs.509791 44 F13A1 Koagulationsfaktor XIII, A1 Polypeptid NM 000129 Hs.335513 45 FAM20B Familie mit Sequenz-Ähnlichkeit 20, Mitglied B NM 014864 Hs.5737 46 FBP1 Fructose-1,6-bisphosphatase 1 NM 000507 Hs.494496 47 FCGR2A Fc Fragment von IgG, niedrige Affinität lla, Rezeptor (CD32) NM 021642 Hs.352642 48 FGF13 Fibroblast-Wachstumsfaktor 13 NM 004114 NM 033642 Hs.6540 49 FGFR10P FGFR1 Onkogen-Partner NM 007045 NM 194429 Hs.487175 50 FLNC Filamin C, gamma (Actin Bindungsprotein 280) NM 001458 Hs.58414 51 FM05 Flavin enthaltende Monooxvgenase 5 NM 001461 Hs.642706 52 FRY Furry Homolog (Drosophila) NM 023037 Hs.591225 53 GADD45G Wachstumsarrest und DNA-schädigungsin-duzierbar, gamma NM 006705 Hs.9701 54 GCH1 GTP Cyclohydrolase 1 (Dopa-responsive Dystonie) NM 000161 NM 001024024 NM 001024070 NM 001024071 Hs.86724 55 GFRA1 GDNF Familie Rezeptor alpha 1 NM 005264 NM 145793 Hs.591913 56 GLB1 Galactosidase, beta 1 NM 001039770 NM 000404 NM 001079811 Hs.443031 57 GOLGA8A Golgi Autoantigen, Golgin Unterfamilie a, 8A NM 181077 NM 001023567 Hs.182982 58 HCLS1 Hämatopoietisches Zell-spezifisches Lyn-Substrat 1 NM 005335 Hs.14601 59 HDGF Hepatom-abgeleiteter Wachstumsfaktor (High-Mobility-Group Protein 1-ähnlich) NM 004494 Hs.506748 60 HRC Histidin-reiches Calcium-Bindungsprotein NM 002152 Hs.436885 61 ICMT Isoprenylcystein Carboxyl-Methyltransfera-se NM 012405 Hs.562083 62 IFNA5 Interferon, alpha 5 NM 002169 Hs.37113 63 IGF2BP3 Insulin-ähnlicher Wachstumsfaktor 2 mRNA Bindungsprotein 3 NM 006547 Hs.648088 64 IL12A Interleukin 12A (natürlicher Killerzellen stimulierender Faktor 1, zytotoxischer Lymphozyten Reifungsfaktor 1, p35) NM 000882 Hs.673 65 ITIH2 Inter-alpha (Globulin) Inhibitor H2 NM 002216 Hs.75285 66 ITPKC Inositol 1,4,5-Trisphosphat 3-Kinase C NM 025194 Hs.515415 67 JMJD2A Jumonji Domäne enthaltend 2A NM 014663 Hs.155983
NACHGEREICHT ·· ·· ···· • · · · · • · · · · • · · · « • · · · · · • · ♦· ·· ·· · • * ··· • · ♦ ♦ • · ♦ · - 11 - 68 KCNJ15 Einwärts gleichrichtender Kaliumkanal Unterfamilie J, Mitglied 15 NM 170736 NM 002243 NM 170737 Hs.411299 69 KCTD12 Kaliumkanal Tetramerisationsdomäne enthaltend 12 NM 138444 Hs.693617 70 KIAA0652 KIAA0652 NM 014741 Hs.410092 71 KIAA0913 KIAA0913 NM 015037 Hs.65135 72 KLKB1 Kallikrein B, Plasma (Fletcher-Faktor) 1 NM 000892 Hs.646885 73 KRT37 Keratin 37 NM 003770 Hs.673852 74 LAMB3 Laminin, beta 3 NM 001017402 NM 000228 Hs.497636 75 LPHN3 Latrophilin 3 NM 015236 Hs.694758 Hs.649524 76 LRIG1 Leuzin-reiche Wiederholungen und Immunoglobulin-ähnliche Domänen 1 NM 015541 Hs.518055 77 LSR Lipolyse-stimulierender Lipoprotein-Rezeptor NM 205834 NM 015925 NM 205835 Hs.466507 78 MANBA Mannosidase, beta A, Ivsosomal NM 005908 Hs.480415 79 MAP7 Mikrotubulus-assoziiertes Protein 7 NM 003980 Hs.486548 80 MAPKAPK5 Mitogen-aktivierte Proteinkinase-aktivierte Proteinkinase 5 NM 139078 NM 003668 Hs.413901 81 MET Met Proto-Onkogen (Hepatozyten Wachstumsfaktor Rezeptor) NM 000245 Hs.132966 82 MMP14 Matrix-Metallopeptidase 14 (Membran-in-sertiert) NM 004995 Hs.2399 83 MX1 Myxovirus (Influenza-Virus) Resistenz 1, In-terferon-induzierbares Protein p78 (Maus) NM 002462 Hs.517307 84 MYL9 Myosin, leichte Kette 9, regulatorisch NM 006097 NM 181526 Hs.504687 85 MY09B Myosin IXB NM 004145 Hs.123198 86 NCOR1 Nuklearer Rezeptor Co-Repressor 1 NM 006311 Hs.462323 87 NDRG4 NDRG Familie Mitglied 4 NM 020465 NM 022910 Hs.322430 88 NDUFA5 NADH Dehydrogenase (Ubiquinon) 1 alpha Subkomplex, 5,13kDa NM 005000 Hs.651219 89 NEUROD2 Neurogene Differenzierung 2 NM 006160 Hs.322431 90 NFKB2 Nuklearer Faktor von kappa leichtem Polypeptid Gene-Verstärker in B-Zellen 2 (P49/P100) NM 001077494 NM 001077493 NM 002502 Hs.73090 91 NME6 Nicht-metastatische Zellen 6, Protein expri-miert in (Nucleoside-Diphosphat-Kinase) NM 005793 Hs.465558 92 NPY1R Neuropeptid Y Rezeptor Y1 NM 000909 Hs.519057 93 NUP50 Nucleoporin 50kDa NM 007172 NM 153645 Hs.475103 94 PDGFRA Plättchen-abgeleiteter Wachstumsfaktor Rezeptor, alpha Polypeptid NM 006206 Hs.74615 95 PDHX Pyruvat-Dehydrogenase-Komplex, Bestandteil X NM 003477 Hs.502315 96 PDLIM1 PDZ und LIM Domäne 1 (elfin) NM 020992 Hs.368525 97 PEX1 Peroxisom-Biogenese-Faktor 1 NM 000466 Hs.164682 98 PEX13 Peroxisom-Biogenese-Faktor 13 NM 002618 Hs.567316 99 PIB5PA Phosphatidylinositol (4,5) Bisphosphat 5-Phosphatase, A NM 014422 NM 001002837 Hs.517549 NACHGERBC: ΓΓ 100 PICK1 Protein interagierend mit PRKCA1 NM 012407 NM 001039583 NM 001039584 Hs.180871 101 PLEC1 Plectin 1, Zwischenfilament Bindungsprotein 500kDa NM 201380 NM 201384 NM 000445 NM 201379 NM 201383 NM 201382 NM 201381 NM 201378 Hs.434248 102 POLE2 Polymerase (DNA-dirigiert), Epsilon 2 (p59 Untereinheit) NM 002692 Hs.162777 103 POLE3 Polymerase (DNA-dirigiert), Epsilon 3 (p17 Untereinheit) NM 017443 Hs.108112 104 PPIF Peptidylprolyl-Isomerase F (Cyclophilin F) NM 005729 Hs.381072 105 PPP2R5A Protein-Phosphatase 2, regulatorische Untereinheit B', alpha Isoform NM 006243 Hs.497684 106 PSCD2 Pleckstrin Homologie, Sec7 und Coiled-Coil Domänen 2 (Cytohesin-2) NM 017457 NM 004228 Hs.144011 107 PSMA5 Proteasom (Prosom, Makropain) Untereinheit, alpha Typ, 5 NM 002790 Hs.485246 108 PTPN12 Protein Tyrosin Phosphatase, Nicht-Rezeptor Typ 12 NM 002835 Hs.61812 109 PTPN3 Protein Tyrosin Phosphatase, Nicht-Rezeptor Typ 3 NM 002829 Hs.436429 110 PTPRCAP Protein Tyrosin Phosphatase, Rezeptor Typ, C-assoziiertes Protein NM 005608 Hs. 155975 111 QKI Quaking Homolog, KH Domäne RNA-bind-end (Maus) NM 206855 NM 206854 NM 206853 NM 006775 Hs.510324 112 RASAL2 RAS Protein Aktivator ähnlich 2 NM 170692 NM 004841 Hs.656823 113 RASSF7 Ras Assoziierungs (RalGDS/AF-6) Domä-nen-Familie 7 NM 003475 Hs.72925 114 RBM10 RNA-bindendes Motiv Protein 10 NM 005676 NM 152856 Hs.401509 115 RBM38 RNA-bindendes Motiv Protein 38 NM 017495 NM 183425 Hs.236361 116 RER1 RER1 Retention in endoplasmischem Re-ticulum 1 Homolog (S. cerevisiae) NM 007033 Hs.525527 117 RGL2 Rai Guanin Nukleotid Dissoziierungsstimu-lator-ähnlich 2 NM 004761 Hs.509622 118 RHOG Ras Homolog Gen Familie, Mitglied G (rho G) NM 001665 Hs.501728 119 RNASE1 Ribonuklease, RNase A Familie, 1 (pankreatisch) NM 198235 NM 198234 NM 198232 NM 002933 Hs.78224 120 RTN4 Retikulon 4 NM 020532 NM 207521 NM 207520 NM 153828 NM 007008 Hs.645283 121 RYR2 Ryanodin Rezeptor 2 (Herz) NM 001035 Hs.109514 122 SCC-112 SCC-112 Protein NM 015200 Hs.331431 123 SOS Serin-Dehvdratase NM 006843 Hs.654416 124 SF3B2 Spleißfaktor 3b, Untereinheit 2,145kDa NM 006842 Hs.406423
NACHGEREICHT ·· ·· ···· • · • · • • • · • · • • · • « • • · • · • · ·· ·· ·· • - 13 - • t ··· ·♦· ·ι 125 SH3PXD2A SH3 und PX Domänen 2A NM 014631 Hs.594708 126 SIX6 Sine oculis Homeobox Homolog 6 (Drosophila) NM 007374 Hs. 194756 127 SLC10A1 Solute Carrier Familie 10 (Natrium/Gal-lensäure Co-Transporter Familie), Mitglied 1 NM 003049 Hs.952 128 SLC6A8 Solute Carrier Familie 6 (Neurotransmitter Transporter, Creatin), Mitglied 8 NM 005629 Hs.540696 129 SMG6 Smg-6 Homolog, nonsense vermittelter mRNA Zerfallsfaktor (C. elegans) NM 017575 Hs.448342 130 SNRPB2 Kleines nukleares Ribonukleoprotein Polypeptid B" NM 003092 NM 198220 Hs.280378 131 SOX11 SRY (Geschlecht bestimmende Region Y)-Box 11 NM 003108 Hs.432638 132 SPI1 Milz Fokus bildendes Virus (SFFV) provirale Integration Onkogen spi1 NM 001080547 NM 003120 Hs.502511 133 SRGAP3 SLIT-ROBO Rho GTPase aktivierendes Protein 3 NM 014850 NM 001033117 Hs.654743 134 STX12 Syntaxin 12 NM 177424 Hs.523855 135 SYK Milz Tyrosinkinase NM 003177 Hs.371720 136 TAF4 TAF4 RNA Polymerase II, TATA Box Bindungsprotein (TBP)-assoziierter Faktor, 135kDa NM 003185 Hs.18857 137 TCN2 Transcobalamin II NM 000355 Hs.417948 138 TGOLN2 Trans-golgi Netzwerk-Protein 2 NM 006464 Hs.593382 139 TIA1 TIA1 cytotoxisches Granalien-assoziiertes RNA Bindungsprotein NM 022173 NM 022037 Hs.516075 140 TOMM40 Translokase von äußerer mitochondrialer Membran 40 Homolog (Hefe) NM 006114 Hs.655909 141 TXN2 Thioredoxin2 NM 012473 Hs.211929 142 UGCG UDP-Glucose Ceramid Glucosyltransferase NM 003358 Hs.304249 143 USP11 Ubiguitin spezifische Peptidase 11 NM 004651 Hs. 171501 144 VDR Vitamin D (1,25- Dihydroxyvitamin D3) Rezeptor NM 001017535 NM 000376 Hs.524368 145 VEGFC Vaskulärer endothelialer Wachstumsfaktor C NM 005429 Hs.435215 146 YWHAQ Tyrosin 3-Monooxygenase/Tryptophan 5-Monooxygenase Aktivierungsprotein, theta Polypeptid NM 006826 Hs.74405 147 ZNF140 Zinkfinger-Protein 140 NM_003440 Hs.181552
Tabelle 5: PTC Markerset PIV-1 bis PIV-9 Num mer PIV- Markergen Beschreibung des Gens Eingangsnummer UniGenelD 1 WAS Wiskott-Aldrich Syndrom (Ekzema-Thrombozytopenie) BC012738 Hs.2157 2 LRP4 niedrigdichtes Lipoprotein Rezeptorbezogenes Protein 4 BM802977 Hs.4930 3 TFF3 Trefoil Faktor 3 (intestinal) BC017859 Hs.82961 4 ST3GAL6 ST3 beta-Galactosid alpha-2,3-Sialyl-transferase 6 BC023312 Hs. 148716 5 STK39 Serin-Threoninkinase 39 (STE20/SPS1 Homolog, Hefe) BM455533 Hs.276271
NACHGEREICHT ·· ···
·· • · · • # · • · · • · · ·· ···♦ • · • · • ♦ • · · - 14 - 6 DPP4 Dipeptidyl-Peptidase 4 (CD26, Adenosin Deaminase komplexierendes Protein 2) BC065265 Hs.368912 7 CHI3L1 Chitinase 3-ähnlich 1 (Cartilage Glyco-protein-39) BC038354 Hs.382202 8 FABP4 Fettsäure Bindungsprotein 4, Adipozyt BC003672 Hs.391561 9 LAMB3 Laminin, beta 3 BC075838 Hs.497636
Tabelle 6: PTC Markerset PV-1 bis PV-11
Num mer PV- Markergen Beschreibung des Gens Eingangsnummer UniGenelD 1 GPR4 G Protein-gekoppelter Rezeptor 4 BC067535 Hs.17170 2 STAM2 Signal transduzierendes Adaptor-Molekül (SH3 Domäne und ITAM Motiv) 2 BC028740 Hs.17200 3 QPCT Glutaminyl-Peptid Cyclotransferase (Glutaminyl-Cyclase) BC047756 Hs.79033 4 CDK7 Cyclin-abhängige Kinase 7 (M015 Homolog, Xenopus laevis, cdk-aktivie-rende Kinase) BC000834 Hs. 184298 5 SFTPD Surfactant, pulmonal-assoziiertes Protein D BC022318 Hs.253495 6 CYB5R1 Cytochrome b5 Reduktase 1 BC018732 Hs.334832 7 VWF Von Willebrand Faktor BI490763 Hs.440848 8 VWF Von Willebrand Faktor BQ888783 Hs.440848 9 PDHX Pyruvat Dehydrogenase Komplex, Bestandteil X BC010389 Hs.502315 10 HOXA4 Homeobox A4 BM996071 Hs.654466 11 HOXA4 Homeobox A4 BI521357 Hs.654466
Das Set der Erfindung kann verwendet werden, um Krebs oder Tumorzellen nachzuweisen, insbesondere Schilddrüsenkrebs, und sogar, um gutartige Schilddrüsenknötchen von bösartigem follikulärem Schilddrüsenkarzinom (FTC) und papillärem Schilddrüsenkarzinom (PTC) zu unterscheiden. In bevorzugten Ausführungsformen umfasst das Set Komponenten, welche für mindestens 3 Tumormarker spezifisch sind, ausgewählt aus den Tumormarkern PI-1 bis PI-33, PII-1 bis PII-64, PIII-1 bis Plll-70 und PIV-1 bis PIV-9, vorzugsweise PIV-4 oder PIV-5, und PV-1 bis PV-11, vorzugsweise PV-1, PV-2 und PV-4 bis PV-11, insbesondere von den Tumormarkern PI-1 bis PI-33. Diese Marker sind für papilläres Schilddrüsenkarzinom (PCT) spezifisch und der diagnostizierte Schilddrüsenkrebs kann als PTC gekennzeichnet werden.
In einer ähnlichen bevorzugten Ausführungsform umfasst das Set Komponenten, welche für mindestens 3 Tumormarker spezifisch sind, ausgewählt aus den Tumormarkern FI-1 bis FI-147. Diese Marker sind für follikuläres Schilddrüsenkarzinom (FTC) spezifisch und der diagnostizierte Schilddrüsenkrebs kann als FTC ge-
NACHGEREICHT t* · · » · ·· 15 kennzeichnet werden.
Besonders bevorzugt umfasst das Set eine Komponente, welche für den Tumormarker SERPINA1 (Serin (oder Cystein) Protease-Inhibitor, Stamm A (alpha-1 Antiproteinase, Antitrypsin), Mitglied 1; NM__000295, NM_001002236, NM_001002235) spezifisch ist, welcher ein sehr wirkkräftiger Marker für PTC ist. Dieser Marker kann als einzelnes Mitglied des Sets PTC von gutartigen Zuständen unterscheiden.
Vorzugsweise umfasst das Set mindestens 5 oder mindestens 10, vorzugsweise mindestens 15, bevorzugter mindestens 20, besonders bevorzugt mindestens 25, insbesondere bevorzugt mindestens 30 Komponenten, welche für die Tumormarker von Tabelle 1 bis 6 oben spezifisch sind. Das Set kann ausgewählt werden aus Komponenten, welche für beliebige mindestens 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 33, 35, 40, 45, 50, 55, 60, 64, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 145, 147, 150, 160, 170, 180, 190 oder 200 der obigen Tumormarker spezifisch sind, z.B. ausgewählt aus PI-1 bis PI-33, PII-1 bis PII-64, PIII-1 bis PIII-70, FI-1 bis FI-147, PIV-1 bis PIV-9, vorzugsweise PIV-4 oder PIV-5, und PV-1 bis PV—11, vorzugsweise PV-1, PV—2 und PV-4 bis PV-11, insbesondere von beliebigen von PI-1, PI-2, PI-3, PI-4, PI-5, PI-6, PI-7, PI-8, PI—9, PI-10, PI-11, PI-12, PI-13, PI-14, PI-15, PI-16, PI-17, PI—18, PI -19, PI- •20, PI-21, PI-22 , PI-23, PI-24, PI-25, PI—26, PI—27, PI -28, PI- •29, PI—30, PI-31 , PI-32, PI-33, PII-1, PII-2, PII-3, PII-4, PII >5, PII-6, PII-7 , PII—8, PII-9, PII-10, PII-11, PII—12, PII-13, PII-14, PII-15, PII—16, PII-17, PII-18, PII-19, PII-20, PII-21, PII—22, PII-23, PII-24, PII-25, PII-26, PII-27, PII-28, PII-29, PII-30, PII-31, PII-32, PII-33, PII-34, PII-35, PII—36, PII-37, PII-38, PII-39, PII—40, PII-41, PII-42, PII-43, PII-44, PII-45, PII—46, PII-47, PII—48, PII-49, PII-50, PII-51, PII-52, PII-53, PII-54, PII-55, PII—56, PII-57, PII-58, PII-59, PII-60, PII-61, PII—62, PII-63, PII-64, PIII-1, PIII-2, PIII-3, PIII-4, PIII-5, PIII-6, PIII-7, PIII-8, PIII-9, PIII-10 PIII-11, PIII-12, PIII-13, PIII-14, PIII-15, PIII-16, PIII-17, PIII-18, PIII-19, PIII-20, PIII-21, PIII-22, PIII-23, PIII-24, PIII-25, PIII-26, PIII-27, PIII-28, PIII-29, PIII-30, PIII-31, PIII-32, PIII-33, PIII-34, PIII-35, PIII-36, PIII-37, PIII-38, PIII-39, PIII-40, PIII-41, PIII-42, PIII-43, PIII-44, PIII-45,
NACHGEREICHT Μ ···· · • · ·· - 16 - ΡΙΙΙ-46, ΡΙΙΙ-47, ΡΙΙΙ-48, ΡΙΙΙ-49, ΡΙΙΙ-50, ΡΙΙΙ-51, ΡΙΙΙ-52, ΡΙΙΙ-53, ΡΙΙΙ-54, ΡΙΙΙ-55, ΡΙΙΙ-56, ΡΙΙΙ-57, ΡΙΙΙ-58, ΡΙΙΙ-59, ΡΙΙΙ-60, ΡΙΙΙ-61, ΡΙΙΙ-62, ΡΙΙΙ-63, ΡΙΙΙ-64, ΡΙΙΙ-65, ΡΙΙΙ-66, ΡΙΙΙ-67, ΡΙΙΙ-68, ΡΙΙΙ-69, ΡΙΙΙ-70, FI-1, FI-2, FI-3, FI-4, FI-5, FI-6, FI-7, FI-8, FI-9, FI-10, FI-11, FI-12, FI-13, FI-14, FI-15, FI-16, FI-17, FI-18, FI-19, FI-20, FI-21, FI-22, FI-23 FI-24, FI-25, FI-26, FI-27, FI-28, FI-29, FI-30, FI-31, FI-32 FI-33, FI-34, FI-35, FI-36, FI-37, FI-38, FI-39, FI-40, FI-41 FI-42, FI-43, FI-44, FI-45, FI—46, FI-47, FI-48, FI-49, FI-50 FI-51, FI-52, FI-53, FI-54, FI-55, FI-56, FI-57, FI-58, FI-59 FI-60, FI-61, FI-62, FI-63, FI—64, FI-65, FI-66, FI-67, FI-68 FI-69, FI-70, FI-71, FI-72, FI—73, FI-74, FI-75, FI-76, FI-77 FI-78, FI-79, FI-80, FI-81, FI-82, FI-83, FI-84, FI-85, FI-86 FI-87, FI-88, FI-89, FI-90, FI-91, FI-92, FI-93, FI-94, FI-95 FI-96, FI-97, FI-98, FI-99, FI-100 , FI-101, FI-102, FI-103, FI-104, FI-105, FI-106, FI-107, FI-108, FI-109, FI-110, FI-111, 112, FI-113, FI-114, FI-115, FI-116, FI-117, FI-118, FI-119, FI-120, FI-121, FI-122, FI-123, FI-124, FI-125, FI-126, FI-127, FI-128, FI-129, FI-130, FI-131, FI-132, FI-133, FI-134, FI-135, FI-136, FI-137, FI-138, FI-139, FI-140, FI-141, FI-142, FI-143, FI-144, FI-145, FI-146, FI-147, PIV-1, PIV-2, PIV-3, PIV-4, PIV-5, PIV-6, PIV-7, PIV-8, PIV-9, PV-1, PV-2, PV-3, PV-4, PV-5, PV-6, PV-7, PV-8, PV-9, PV-10, PV-11. Vorzugsweise ist das Set spezifisch für ein vollständiges Subset, ausgewählt aus PI, PII, PIII, PIV, PV oder FI. Jedoch ist es ebenfalls möglich, eine kleine Anzahl aus diesen Subsets oder vereinigtem Set auszuwählen, da eine Unterscheidung zwischen gutartigen und bösartigen Zuständen oder die Diagnose von Krebs auch mit annehmbarer Sicherheit durchgeführt werden kann. Zum Beispiel umfasst in einer bevorzugten Ausführungsform das Set der Erfindung mindestens 5 (oder eine der oben erwähnten Anzahlen) Komponenten, welche für die Tumormarker spezifisch sind, ausgewählt aus FI-1 bis FI-147. Figuren 4 und 5 zeigen solche diagnostischen Klassifizierungswahrscheinlichkeiten für PTC und FTC. Zum Beispiel hat ein Set, spezifisch für eine Anzahl von Markern aus Tabelle 2 (Subset PII), spezifisch für 5 Marker, nur eine Fehlerspanne von 4%, also 96% aller Fälle würden korrekt klassifiziert. Ein Fehlerwert von 1% (99% Sicherheit) wird mit mindestens 20 Mitgliedern erreicht. Im Fall der FTC-spezifischen Marker wird ein stabiler nachgereicht 17
Wert von 8% Fehlern mit mindestens 11 unterschiedlichen Markern erreicht, ausgewählt aus dem FI Subset.
Vorzugsweise sind die Komponenten Nukleinsäuren, insbesondere Oligonukleotide oder Primer, welche für Tumormarker-Nukleinsäuren spezifisch sind. In einer weiteren Ausführungsform sind die Komponenten Antikörper (monoklonal oder polyklonal) oder Antikörperfragmente, vorzugsweise ausgewählt aus Fab, Fab', Fab2, F(ab')2 oder scFv (einkettige variable Fragmente), welche für Tumormarker-Proteine spezifisch sind.
In einer bevorzugten Aus führungs form sind die Komponenten des Sets auf einem festen Träger immobilisiert, vorzugsweise in Form eines Microarrays oder Nanoarrays. Der Begriff „Microarray", gleichermaßen „Nanoarray" wird verwendet, um eine Reihe einer mikroskopischen Anordnung (Nanoarray für eine Reihe im Nanometer-Maßstab) zu beschreiben oder betrifft einen Träger, der solch eine Reihe umfasst. Beide Definitionen wiedersprechen einander nicht und sind im Sinn der vorliegenden Erfindung anwendbar .
In einem weiteren Aspekt betrifft die vorliegende Erfindung ein Verfahren für den Nachweis von einem oder mehreren Schilddrüsenkrebs-Markern in einer Probe, umfassend Verwenden des Sets der Erfindung und Nachweisen der Anwesenheit oder Messen der Menge des Vorkommens von Tumormarkern in der Probe. Das Auftreten oder Muster der nachgewiesenen Marker kann spezifisch die Anwesenheit dieser Marker identifizieren, was für Krebsdiagnose oder als eine Referenz von gesunden Proben relevant, oder einfach eine genetische Erforschung von Objekten sein kann.
Vorzugsweise umfasst die Probe Zellen, vorzugsweise Säugerzellen, besonders bevorzugt menschliche Zellen, welche von einer Biopsie oder Körperflüssigkeit beschafft werden können. Insbesondere wird die Anwesenheit oder Menge der Tumormarker in diesen Zellen nach z.B. Zellzerfall nachgewiesen oder gemessen.
Das Verfahren kann einen Nachweis oder eine Messung durch RNA-Expressionsanalyse, vorzugsweise durch Microarray oder quantitative PCR oder Proteinanalyse, vorzugsweise durch Gewebe-Mi-croarray-Nachweis, Protein-Microarray-Nachweis, mRNA-Microarray-Nachweis, ELISA, Multiplex-Tests, Immunhistochemie oder DNA-Ana-lyse, komparative Genomhybridisierung (CGH)-Arrays oder Einzel-Nukleotid-Polymorphismus (SNP)-Analyse umfassen. Diese Verfahren
NACHGEREICHT
- 18 - sind nach Stand der Technik bekannt und können als Beispiele für das weite Feld der genetischen Markeranalyse leicht für das Verfahren der vorliegenden Erfindung verwendet werden.
In einem weiteren Aspekt sieht die vorliegende Erfindung ein Verfahren für die Diagnose von Krebs in einem Patienten vor, umfassend Beschaffen einer Probe, vorzugsweise einer Probe von Zellen, von dem Patienten, Nachweisen von einem oder mehreren Tumormarkern durch Messen von Tumormarker-Signalen mit dem Set gemäß der vorliegenden Erfindung, Vergleichen der gemessenen Signalwerte der Tumormarker mit Werten der Tumormarker in gesunden Proben und Diagnostizieren von Krebs falls mehr als 50%, vorzugsweise mehr als 60%, bevorzugter mehr als 70%, insbesondere bevorzugt mehr als 80% der Werte sich verglichen mit den Werten der gesunden Proben durch mindestens die Standardabweichung, vorzugsweise zweimal die Standardabweichung, sogar bevorzugter dreimal die Standardabweichung des Messverfahrens unterscheiden. Der Unterschied in genetischer Expression zwischen Proben von erkrankten Objekten und gesunden Objekten kann von jeder Art sein und schließt Hochregulation (z.B. von Onkogenen) oder Herunterregulation (z.B. von Tumorsuppressorgenen) ein. Es ist möglich, dass in gesunden Proben ein Gen nicht exprimiert ist, während Expression in erkrankten Proben auftritt. Andererseits ist es ebenfalls möglich, dass ein Gen in erkrankten Proben nicht exprimiert ist, während Expression in gesunden Proben auf-tritt.
Krebs kann auch diagnostiziert werden, falls sich mehr als 50%, bevorzugt mehr als 60%, bevorzugter mehr als 70%, insbesondere bevorzugt mehr als 80% der Werte der Probe verglichen mit den Werten der gesunden Proben um mindestens einen Faktor 1,5, mindestens einen Faktor 2, mindestens einen Faktor 3 oder mindestens einen Faktor 4 unterscheiden. Üblicherweise werden die Tumormarker-Expressionsprodukte durch einen Faktor von 2 bis 6 hoch- oder herunterreguliert, aber Unterschiede um einen Faktor 60 sind ebenfalls möglich.
In noch einem weiteren Aspekt betrifft die Erfindung ein Verfahren für die Identifizierung von krankheitsspezifischen Markern, wie z.B. in Tabellen 1 bis 6 angegeben, vorzugsweise Genen oder Genexpressionsmustern, umfassend: • Vorsehen von Genexpressionsdaten zu mehrfachen potentiellen
NACHGEREICHT
- 19 - krankheitsspezifischen Genen von mindestens zwei unterschiedlichen Expressionsdatensätzen, • Bestimmen gemeinsamer Gene der Datensätze, • Normalisieren von jedem Genexpressionsdatensatz, vorzugsweise durch Lowess- oder Quantil-Normalisierung, • Vereinigen der Genexpressionsdatensätze zu einem vereinigten Datensatz und vorzugsweise Normalisieren des vereinigten Datensatzes und Integrieren des vereinigten Datensatzes, • Bestimmen von Genen des vereinigten Datensatzes durch Bestimmen seines Nearest-Shrunken-Centroids, was die Bestimmung eines kreuzvalidierten Fehlerwerts von Zuweisen der Gene zur Krankheit und Minimieren des Fehlerwerts durch Verringern der Anzahl an Mitgliedern des vereinigten, vorzugsweise normalisierten Datensatzes einschließt, wobei die Gene des verringerten Datensatzes die für die Krankheit spezifischen Marker sind. Die Kreuzvalidierung kann z.B. das Leave-One-Out Verfahren sein. Vorzugsweise umfasst der Bestimmungsschritt (der Klassifizierungsschritt) die Bestimmung eines maximierten Schwellenwerts des Unterschieds des normalisierten Expressionswerts für jedes Gen zum Zentroid-Wert durch die Kreuzvalidierung. Dann werden die Gene mit niedrigeren normalisierten Expressionswerten als der Schwellenwert aus dem verringerten (oder geschrumpften) Satz entfernt und Gene mit größeren Werten als der Schwellenwert zum Zentroid sind für die Krankheit spezifisch.
Der Bestimmungsschritt kann mehrere Male durch Auslassen der sich ergebenden Marker aus jedem vorhergehenden Schritt wiederholt werden. Das Nearest-Shrunken-Centroid Verfahren wird einen neuen Ergebnissatz von weiteren Markern ergeben, welche für die Krankheit spezifisch sind. Vorzugsweise wird der Bestimmungsschritt 2, 3, 4, 5, 6, 7, 8, 9, 10 oder mehr Male wiederholt. Je nach Größe des vereinigten Datensatzes wird er weitere spezifische Marker ergeben. Vorzugsweise wird für jedes Ergebnis eine Kreuzvalidierung durchgeführt. Die Bestimmung kann wiederholt werden, bis die Kreuzvalidierung einen Fehlerwert von z.B. unter 50%, 60%, 70% oder 80% anzeigt. Bei niedrigeren Werten kann erwartet werden, dass alle Marker identifiziert worden sind.
Die anfänglichen Genexpressionsdatensätze sind rohe Expressionsprofile, z.B. jeweils aus einer multi-genetischen Microar-
NACHGEREICHT ·· ··· ·· ·« • · · • · · • · · • · · - 20 - ray-Analyse erhalten. Von den meisten gemessenen Genen wird erwartet, dass sie nicht an der Krankheit beteiligt sind und das Verfahren der Erfindung kann kennzeichnende Markergene von mindestens zwei, vorzugsweise drei, vier, fünf, sechs, sieben oder acht Expressionsdatensätzen identifizieren. Daher umfassen die Expressionsdaten der anfänglichen Datensätze vorzugsweise Daten von mindestens zwei unterschiedlichen Microarray-Datensätzen, insbesondere mit Studien- oder platformspezifischen Verzerrungen. Solche Verzerrungen können durch Verwenden von nur einem spezifischen Aufbau während der Messung der Expressionsdaten, z.B. eines Microarrays, auftreten, welcher sich von Aufbauten von anderen Datensätzen signifikant unterscheiden kann. Die vorliegende Erfindung hat den Vorteil, dass während der Vereinigung solcher Sätze die Probleme solcher Messungsverzerrungen überwunden werden. Ferner sind die erhaltenen (anfänglichen) Genexpressionsdaten rohe, unverarbeitete Genexpressionsdaten, also es wurde keine Verfeinerung oder Datenumwandlung vor dem Verfahren der Erfindung durchgeführt.
Vorzugsweise ist die Erkrankung eine genetische Störung, vorzugsweise eine Störung mit veränderter Genexpression, insbesondere bevorzugt Krebs. Andere Typen von Störungen mit veränderter Genexpression können z.B. pathogene Infektionen, insbesondere Virus-, einschließlich Retrovirusinfektionen, Strahlungsschaden und altersbezogene Störungen sein.
Der Schritt des Vereinigens und Integrierens des vereinigten Datensatzes entfernte studienspezifische Verzerrungen. In bevorzugten Ausführungsformen wird dieser Schritt durch schrittweise Vereinigung von zwei Genexpressionsdatensätzen pro Schritt und Integration des vereinigten Datensatzes, vorzugsweise durch DWD (Distance-Weighted-Discrimination) durchgeführt. Im Fall von 3 Datensätzen wird z.B. zuerst Satz 1 mit Satz 2 vereinigt und der verschmolzene Satz 1+2 wird mit Satz 3 vereinigt. Integration kann z.B. Berechnen des Normalenvektors des vereinigten Datensatzes und nachfolgend einer Hyperebene, welche Cluster (z.B. der anfänglichen Datensätze) von Datenwerten des Datensatzes trennt, und Subtrahieren der Datensatz-Mittelwerte wie im DWD-Verfahren einschließen. Im Prinzip kann jedes Datenintegrationsverfahren, welches Verzerrungen entfernt, für das Verfahren der Erfindung verwendet werden.
NACHGEREICHT
- 21 -
Vorzugsweise umfassen die mindestens ein, vorzugsweise zwei, drei, vier, fünf, sechs, sieben oder acht erhaltenen Expressionsdatensätze Daten von mindestens 10, vorzugsweise mindestens 20, bevorzugter mindestens 30, noch bevorzugter mindestens 40, mindestens 50, mindestens 70, mindestens 100, mindestens 120, mindestens 140, mindestens 160 oder mindestens 200 unterschiedlichen Genen. Das Verfahren der Erfindung ist besonders geeignet, um durch große Datensätze zu filtrieren und die kennzeichnenden Marker darin zu identifizieren. Das erhaltene Set dieser Marker wird auch als „Klassifikator" bezeichnet.
Dieses Verfahren, Krebs-spezifische Marker und somit Komponenten, also Oligonukleotide oder Antikörper, welche für Krebs spezifisch sind, zu identifizieren, kann ebenfalls im obigen Verfahren des Diagnostizierens von Krebs verwendet werden. Also werden die Marker entsprechend dem für das diagnostische Verfahren verwendeten Set von Komponenten gemäß dem obigen Verfahren identifiziert (auch „klassifiziert" genannt), was die Verfeinerung und Festsetzen von Zentroid-Werten der gemessenen Werte der anfänglichen Datensätze einschließt. Dieses Muster kann dann verwendet werden, um Krebs zu diagnostizieren, falls die Werte der Probe des Patienten näher am geclusterten Zentroid-Wert der Tumormarker sind. Demgemäß wird ein Verfahren für die Diagnose von Krebs in einem Patienten vorgesehen, umfassend Beschaffen einer Probe, vorzugsweise einer Probe von Zellen, von dem Patienten, Nachweisen von einem oder mehreren Tumormarkern durch Messen von Tumormarker-Signalen mit dem Set gemäß der vorliegenden Erfindung, Vergleichen der gemessenen Signalwerte der Tumormarker mit Werten der Tumormarker in Krebsproben durch das oben erwähnte Identifizierungsverfahren und Diagnostizieren von Krebs, falls der Nearest-Shrunken-Centroid von Werten der Probe des Patienten für mindestens 50%, vorzugsweise mindestens 60%, bevorzugter mindestens 70% oder sogar mindestens 80%, insbesondere bevorzugte 90% Marker des Sets innerhalb der Standardabweichung, vorzugsweise zweimal der Standardabweichung, noch bevorzugter dreimal der Standardabweichung des Messverfahrens zum Nearest-Shrunken-Centroid der mit den Krebsproben identifizierten Tumormarker ist.
Die vorliegende Erfindung wird ferner durch die folgenden Figuren und Beispiele veranschaulicht, ohne darauf spezifisch nachgereicht • ·
22 beschränkt zu werden.
Figuren
Figur 1: Die ersten beiden Hauptbestandteile vor und nach DWD-Integration. Datensätze werden durch Farbe kodiert und Tumorgebilde werden durch Buchstaben gemäß der Legende kodiert.
Figur 2: Dendrogramm der DWD-integrierten Daten für alle Gene. Die Farben der Zweige des Dendrogramms zeigen den Datensatz der entsprechenden Probe an, die Farbe der Blattmarkierung zeigt das Tumorgebilde an.
Figur 3: Unterscheidung zwischen papillärem Karzinom und gutartigen Knötchen über vier unterschiedliche Datensätze durch nur ein Gen (SERPINAl).
Figur 4 zeigt einen Graph der durchschnittlichen Fehlerwahrscheinlichkeit während PTC-Klassifizierung von reduzierten Sets (Klassifikator) von Markern von Tabelle 2.
Figur 5 zeigt einen Graph der durchschnittlichen Fehlerwahrscheinlichkeit während FTC-Klassifizierung von reduzierten Sets (Klassifikator) von Markern von Tabelle 4.
Beispiele
Beispiel 1: Datensätze
Datensätze wurden von entweder Webseiten oder von öffentlichen Quellen (GEO, ArrayExpress) herunter geladen. Tabelle 7 zeigt eine Zusammenfassung der in dieser Studie verwendeten Datensätze (He et al., PNAS USA 102 (52): 19075-80 (2005); Huang et al., PNAS USA 98 (26): 15044-49 (2001); Jarzab Cancer Res. 65 (4): 1587-97 (2005); Lacroix Am. J. Pathol. 167 (1): 223-231 (2005); J. Clin. Endocrinol. Metab. 90 (5): 2512-21 (2005)).
Hier werden drei unterschiedliche Kategorien von Nicht-Krebsgeweben verwendet: kontralateral (c.lat) für gesundes umgebendes Gewebe gepaart mit einer Tumorprobe, andere Krankheit (o.d.) für Schilddrüsengewebe, operiert für andere Krankheit, und SN (Struma nodosa) für gutartige Schilddrüsenknötchen. Für alle nachfolgenden Analysen wurden diese als gesund vereinigt.
NACHGERSCHT * ·· ·· ···· • · · · · • · · · • · · · · - 23 -
Tabelle 7: Microarray-Daten, verwendet für Meta-Analyse
veröffentlicht FTA FTC PTC SN o.d. c.lat Platform He PNAS 2005 0 0 9 0 0 9 AiTy U133plus Huang PN AS 2001 0 0 8 8 0 0 AiTy U133A Jarzab Cancer Res 2005 0 0 23 0 11 17 AiTy U133A Lacroix Am J Path 2005 4 8 0 11 0 0 Agilent Cuslom Reyes nicht veröffentlicht? 0 0 7 0 0 7 AiTy U133A Weber J Clin Endocr Metaboi 2005 12 12 0 0 0 0 AiTy U95A
Beispiel 2: Finden der Gen-Überschneidung
Der erste Schritt in jeder MetaAnalyse von Microarray-Daten ist es, das Set von Genen zu finden, welches von allen in der Analyse verwendeten Microarray-Platformen geteilt wird. Traditionell wird Überschneidung durch das Finden gemeinsamer UniGen-Identifikatoren bestimmt. Dies lässt jedoch alle möglichen Spleißvariationen in den untersuchten Genen außer Acht. Falls ein Gen zum Beispiel 2 Spleißvarianten hatte, von welchen eine in dem Versuch differentiell exprimiert war und die andere nicht und falls eine Platform ein Oligo enthalten würde, welches nur für die differentiell exprimierte Variante spezifisch ist, und die andere Platform nur ein Oligo zur anderen Variante, dann würde ein auf UniGene basiertes Abgleichen Sonden verschmelzen, welche unterschiedliche Dinge messen.
Um dieses Problem zu überwinden, verschmilzt die hier angenommene Herangehensweise nur Sonden, welche den gleichen Satz von RefSeq Identifikatoren annotieren. Zu diesem Zweck wurden alle passenden RefSeqs für jede(s) Sonde(nset) herunter geladen, entweder durch Bioconductor Annotationspakete (hgul33a, hgu95a und hgul33plus2; erhältlich im Web www.bioconductor.org) oder durch eine BLAST-Suche der Sequenzen bei NCBI-Database. Dann wurden für jede Sonde die RefSeqs sortiert und konzentriert.
Dies ist die genaueste Darstellung der an dem Array gemessenen Einheit. Der Medianwert wurde verwendet, falls ein Set von RefSeqs durch Mehrfachsonden an dem Array repräsentiert war. Es waren 5707 unterschiedliche Sets von RefSeqs an allen Arrays vorhanden.
Beispiel 3: Vorverarbeitung und Datenintegration nachgereicht |
Zuerst wurde jeder Datensatz untergrundkorrigiert und getrennt normalisiert, wie für jede Platform empfohlen (Lowess für duale Farbe und Quantil-Normalisierung für einfarbige Experimente) (Boistad et al. Bioinformatics 19 (2): 185-193 (2003); Smyth et al. Methods 31 (4): 265-273 (2003)), dann wurden sie verschmolzen und gemeinsam Quantil-normalisiert. Trotz aller Vorverarbeitung ist gezeigt worden, dass auf unterschiedlichen Microarray-Platformen oder auf unterschiedlichen Generationen der selben Platform erzeugte Daten aufgrund der Platform-spezi-fischen Verzerrungen nicht vergleichbar sein können (Eszlinger et al., Clin. Endocrinol. Metab. 91 (5): 1934-1942 (2006)). Dies ist von Hauptbestandteilsanalyse der verschmolzenen Daten wie in Fig. 1 gezeigt ebenfalls offensichtlich. Um diese Verzerrungen zu bereinigen, sind Verfahren für Integration von Microarray-Da-ten entwickelt worden. Eines dieser Verfahren ist Distance-Weighted-Discrimination (DWD), welches woanders detailliert beschrieben wird (Benito et al., Bioinformatics 20 (1): 105-114 (2004)). Kurz: DWD projiziert Datenpunkte auf den Normalenvektor einer Klasse (Datensatz) - welcher wie durch eine modifizierte Support-Vector-Machine (SVM) berechnet Hyperebene trennt, und subtrahiert die Klassen (Datensatz) Mittelwerte. Daher müssen für ein Mehrklassenproblem (mehr als 2 Datensätze zu verschmelzen) die Datensätzen sequentiell verschmolzen werden. Für 6 Datensätze führt dies zu 720 unterschiedlichen Möglichkeiten für Verschmelzung, was Baum-strukturierte Herangehensweisen nicht einschließt, z.B. statt (((1+2) +3) +4) erwäge ((1+2) + (3 + 4)). Die hier angewandten Verschmelzungsreihenfolgen wurden nach der allgemeinen Idee ausgewählt, dass ähnliche und größere Datensätze zuerst verschmolzen werden sollten und disparatere später. Es lohnt sich ebenfalls anzumerken, dass Zugeben einer Probe zu einem DWD-verschmolzenen Datensatz den ganzen Datensatz verändern wird, genau wie Zugeben einen neuen Zahl zu einem Vektor von Zahlen seinen Mittelwert verändern wird.
Datenintegration durch DWD wird in Figur 1 veranschaulicht, welche die Wirkung des Datenintegrationsverfahrens auf die ersten beiden Hauptbestandteile zeigt. In dieser Analyse war DWD in der Lage, die Trennung zwischen den Datensätzen zu entfernen, wie durch die PC-Plots und durch das Mischen der Zweige in dem Dendrogramm (siehe Fig. 2) angezeigt. Jedoch trennen sich selbst
NACHGEr.se: I
♦ t ·· ···· • ♦ · · · • · · · · • · · · · • · · · · · - 25 - in dem DWD-integrierten Datensatz die Lacroix-Daten noch teilweise von den anderen Daten. Sehr wahrscheinlich liegt dies an der Platform; die Lacroix-Daten sind die einzigen Daten von einer Nicht-Affymetrix Platform. Figur 2 zeigt Dendrogramme der jeweiligen integrierten Datensätze. Auch scheint DWD-Integration nicht die Unterscheidung zwischen den Tumorgebilden zu behindern (siehe Tabelle 8 unten).
Beispiel 4: Klassifizierung Für Sondenselektion wurde Klassifizierung und Kreuzvalidierung eines Nearest-Shrunken-Centroid Verfahrens gewählt (Tibshi-rani et al. PNAS USA 99 (10): 105-114 (2004)) (implementiert im Bioconductor-Paket pamr). Es wurde aus mehreren Gründen gewählt: es ermöglicht Mehrklassen-Klassifizierung und es betreibt Merkmalsselektion, Klassifizierung und Kreuzvalidierung in einem Druchgang. Kurz: es errechnet mehrere unterschiedliche mögliche Klassifikatoren unter Verwendung unterschiedlicher Schrumpfungs-Schwellenwerte (also unterschiedlich Anzahl von Genen) und findet den besten Schwellenwert aus Kreuzvalidierung. Der Klassifikator wurde mit der kleinsten Anzahl an Genen (größter Schwellenwert) ausgewählt, falls mehr als ein Schwellenwert die gleichen Kreuzvalidierungsergebnisse ergaben.
Beispiel 5: Papilläres Schilddrüsenkarzinom (PTC)
Zuerst und als Qualitätsmaßstab für jede Studie wurde jeder Datensatz getrennt genommen (vor DWD-Integration) und eine pamr-Klassifizierung und Leave-One-Out Kreuzvalidierung (loocv) wurden durchgeführt. Die Ergebnisse der Kreuzvalidierung sind nahezu perfekt bei einzelnen falsch klassifizierenden Proben. Jedoch kann mit Ausnahme des Klassifikators vom He-Datensatz keiner dieser Klassifikatoren auf einen der anderen Datensätze angewendet werden. Klassifizierungsergebnisse sind selten auch nur höher als durch Zufall erwartet. Falls man jedoch die DWD-integrierten Daten (unten) verwendet, passen die Klassifikatoren schon viel besser (siehe Tabelle 8).
Tabelle 8: Klassifizierungsergebnisse bei Anwenden von Klassifikatoren von einer Studie auf eine andere Studie. Vor Datenintegration (links) und nach DWD-Integration (rechts) nachgereicht
Test reihe he huang jarzab reyes Test reihe he huang jarzab reyes he 1,00 1,00 0,98 1,00 he 1,00 1,00 0,96 1,00 huang 0,50 1,00 0,55 0,50 huang 0,50 1,00 0,90 0,71 jarzab 0,50 0,81 1,00 0,57 jarzab 0,89 1,00 1,00 1,00 reyes 0,78 0,50 0,92 1,00 reyes 0,89 0,88 0,90 1,00
Dann wurde ein pamr-Klassifikator für den vollständigen DWD-integrierten Datensatz konstruiert und in einer Leave-One-Out Kreuzvalidierung validiert. Dies identifizierte einen (!) Gen-Klassifikator, welcher 99% von Proben korrekt in loocv klassifiziert. Dieses unterscheidende Gen ist SERPINAl. Fig. 3 zeigt die Unterscheidung von PTC gegenüber SN vor und nach DWD. Man könnte bis zu 422 Gene zum Klassifikator dazugeben und noch 99% Genauigkeit (von loocv) erreichen. Falls man die SERPINAl-Sonde aus der Analyse entfernt, kann man wieder einen Klassifikator (nachfolgend Klassifikator 2 genannt) mit 99% Genauigkeit in loocv konstruieren, dieses Mal unter Verwendung einer 9-Gen Signatur (siehe Tabelle 3). Entfernen dieser 9 Gene ergibt einen weiteren 9-Gen Klassifikator mit einer ähnlichen Leistung (99% Genauigkeit) und ferner einen 11-Gen Klassifikator mit 99% Genauigkeit. Solche weiteren Klassifikator werden z.B. in Tabellen 1 bis 3, 5 und 6 (oben) für PTC angegeben.
Jedoch werden ähnliche Ergebnisse unter Durchführung der gleichen Analyse von nicht-integrierten Daten erhalten. Unter Berücksichtigung der Ergebnisse von PCA (Fig. 1), wo es offensichtlich war, dass die Varianz, erklärt durch die unterschiedlichen Datensätze, viel größer ist, als die durch Tumorgebilde erklärte Varianz, könnte man sich vorstellen, dass die durch die Datensätze eingeführte Verzerrung Klassifizierung unterstützen (oder behindern) kann. Daher wurde eine Studien-Kreuzvalidierung durchgeführt, wobei sequenziell eine Studie aus dem Datensatz genommen wurde, ein Klassifikator aus den verbleibenden Proben konstruiert wurde und am eliminierten Datensatz getestet wurde. Für die DWD-integrierten Daten war die Genauigkeit der Vorhersage 100, 100, 98 und 100% beim Auslassen von jeweils He, Huang, Jarzab und Reyes aus dem Klassifikator. Für nicht-integrierte Daten waren die Ergebnisse ähnlich (100, 100, 94 und 100%).
Tabelle 9: Gene in Klassifikator 2 (nach Auslassen von SERPINAl)
NACHGEREICHT ·· ·· ···· • · · · · * · · · · • · · » · • · · · · · ·· ·· ·· • • ·· ·· ·· • • • ··· • • · • • • ··· ··· ·· - 27 -
Symbol Titel Cluster Eingang WAS Wiskott-Aldrich-Syndrom (Ekzem-Thrombozytopenie) Hs.2157 BC012738 LRP4 Niedrigdichtes Lipoprotein Rezep-tor-bezogenes Protein 4 Hs.4930 BM802977 TFF3 Trefoil-Faktor 3 (intestinal) Hs.82961 BC017859 ST3GAL6 ST3 beta-Galactosid alpha-2,3-Sia-lyltransferase 6 Hs.148716 BC023312 STK39 Serin-Threonin-Kinase 39 (STE20/SPS1 Homolog, Hefe) Hs.276271 BM455533 DPP4 Dipeptidyl-Peptidase 4 (CD26, Ade-nosin-Deaminase-komplexierendes Protein 2) . Hs.368912 BC065265 CHI3L1 Chitinase 3-ähnlich 1 (Cartilage-Glycoprotein-39) Hs.382202 BC038354 FABP4 Fettsäure-bindendes Protein 3, Adipozyt Hs.391561 BC003672 LAMB3 Laminin, beta 3 Hs.497636 BC075838
Beispiel 6: Follikuläres Karzinom
Eine ähnliche Analyse wurde ebenfalls für die FTC-Daten durchgeführt, aber Kreuzvalidierung wurde wegen der sehr begrenzten Verfügbarkeit von Daten behindert. Wieder wurde ein Klassifikator für jeden Datensatz konstruiert (Lacroix und Weber) . Sie erreichten eine loocv-Genauigkeit von 96% (Weber) und 100% (Lacroix) an 25 und 3997 Genen. Die Anzahl an Genen in den Lacroix-Daten legt bereits Überanpassung nahe, welche durch Kreuzklassifizierung mit dem anderen Datensatz (jeweils 25 und 35% Genauigkeit) bestätigt wurde. Auch ist die Gen-Überschneidung zwischen den beiden Klassifikatoren niedrig (zwischen 0 und 10% je nach Schwellenwert). Wenn jedoch die 2 Datensätze unter Verwendung von DWD vereinigt werden, konnte ein 147-Gen Klassifikator (Tabelle 4 oben) konstruiert werden, welcher in der Lage war, Proben richtig zu identifizieren (mit einer 92% Genauigkeit) .
NACHGEREICHT ·· ·· ···· • · • · • • ♦ • · • • · • · • • ♦ • · • · ·· ·· ·· • · ·· ·· ·· · • · ♦·· • · ♦ · • · ♦ · ··· ··# ·· - 28 -
Beispiel 7: Diskussion
Die vorliegende Erfindung stellt die größte Kohorte von Schilddrüsenkarzinom-Microarray-Daten dar, welche bis jetzt analysiert wurde. Sie nutzt das neuartige kombinatorische Verfahren unter Verwendung der neuesten Algorithmen für Microarray-Daten-Integration und Klassifizierung. Dennoch stellt Meta-Analyse von Microarray-Daten noch eine Herausforderung dar, hauptsächlich weil einzelne Microarray-Untersuchungen auf zumindest teilweise unterschiedliche Fragen zielen und somit unterschiedliche experimentelle Entwürfe verwenden. Darüber hinaus ist die Anzahl an bis jetzt verfügbaren Schilddrüsentumor-Microarray-Daten noch vergleichsweise niedrig (verglichen mit z.B. Brustkrebs). Daher ist man beim Durchführen von Meta-Analyse gezwungen, alle verfügbaren Daten zu verwenden, selbst wenn die Patientenkohorten eine eher heterogene und potentiell verzerrte Population repräsentieren. Insbesondere ist es schwierig, eine homogene Sammlung von Kontrollmaterial (von gesunden Patienten) zu erhalten. Diese werden üblicherweise von Patienten genommen, welche wegen anderer Schilddrüsenerkrankung operiert wurden, was seinerseits sehr wahrscheinlich eine Veränderung in Genexpression wie an Microar-rays gemessen verursacht. Die Erzeugung von homogenen Patientenkohorten wird weiter durch die begrenzte Verfügbarkeit von Patientendaten wie Alter, Geschlecht, genetischer Hintergrund usw. behindert.
Beim Durchführen von Meta-Analyse von Mircroarray-Daten haben viele Forscher ihre Herangehensweise auf Vergleichen von Genlisten von veröffentlichten Studien (Griffith et al., oben zitiert) basiert. Dies ist sehr nützlich, da man alle Studien in der Analyse einschließen kann und nicht auf die Studien beschränkt ist, wo Rohdaten verfügbar sind. Jedoch folgen die Studien im Allgemeinen sehr unterschiedlichen Analysestrategien, einige strenger als andere. Es ist nicht unter der Kontrolle des Meta-Analysierers, wie die Autoren zu den Genlisten kamen. Daher können diese Analysen verzerrt sein.
Hinsichtlich Datenintegration leistet DWD gemäß dem ursprünglichen DWD-Dokument am besten, wenn mindestens 25-30 Proben pro Datensatz vorhanden sind. In der vorliegenden Studie enthielten 4 von 6 Datensätzen weniger als 20 Proben. Dennoch
NACHGEREICHT ·· • · · V ♦ · • · ♦ • · · ·· ··♦ • · • · ·· ···· • · • · • · • · · - 29 -arbeitete DWD für das Entfernen von Platform-Verzerrungen vergleichsweise gut (siehe Tabelle 8) . DWD verbesserte in hohem Maße die Ergebnisse von PCA (Figur 1) , hierarchischem Clustern (Figur 2) und die Klassifizierungsgenauigkeit beim Anwenden eines Klassifikators von einer Studie auf eine andere Studie (Tabelle 8). In diesem Licht war es überraschend zu sehen, dass die nicht-integrierten Daten in der Stu-dien-Kreuzvalidierung gleich gut leisteten, verglichen mit den DWD-integrierten Daten. Eine Erklärung hierfür ist, dass jede studienspezifische Verzerrung weniger wichtig wird, je mehr Studien bewertet werden. Vorausgesetzt, dass die Studienverzerrung einige Gene mehr als andere beeinträchtigt, werden die beein-trächtigteren Gene wegen der durch die Studienverzerrung eingeführte Varianz weniger wahrscheinlich das pamr-Schwellenwertverfahren überleben. Jedoch gibt es, wie oben gezeigt, eine große Fülle von Genen, welche PTC und gutartige Knötchen unterscheiden. So lange eines (oder ein paar) jener Gene nicht durch die Studienverzerrung beeinträchtigt wird (werden) , wird (werden) es (sie) Schwellenwertverfahren überleben und Unterscheidung zwischen Tumorgebilden wird noch möglich sein.
Es gibt eine offensichtliche Diskrepanz, wenn man Fig. 3 anschaut: Vor DWD haben die PTC-Proben eine höhere SERPINAl-Ex-pression, während es nach DWD anders herum ist. Jedoch wie im Abschnitt Materialien und Methoden angemerkt, subtrahiert DWD die Klassenmittelwerte für jede Probe. Dies bedeutet einfach, dass vor DWD die Studienverzerrung für SERPINAl höher ist als die Differenz in der Expression zwischen den Tumorklassen. Dies erklärt ebenfalls, warum SERPINAl bei den nicht-integrierten Daten kein gut arbeitender Klassifikator ist.
Eine kürzliche Meta-Analyse und Meta-Übersicht von Griffith et al. (oben zitiert) hat Gene mit einem diagnostischen Potential im Zusammenhang von Schilddrüsenerkrankung zusammengefasst.
Sie veröffentlichten Listen von Genen, welche in mehr als einer Schilddrüsenerkrankung analysierenden Studie mit hohem Durchsatz (Microarray, SAGE) erschienen, und wendeten ein Rangsystem an.
In ihrer Analyse erreichte SERPINAl den höchsten Rang, und TFF3, welches Teil von Klassifikator 2 ist (wenn SERPINAl ausgelassen wird) erreichte den zweiten Rang. Vier von neun Genen von Klas-
NACHGEREICHT sifikator 2 erschienen in der Liste von Griffith et al. (LRP4, TFF3, DPP4 und FABP4).
Die meisten dieser Listen wurden von Microarray-Analyse erzeugt. Jedoch selbst beim Vergleichen der Gene in den Klassifikatoren mit Genlisten, welche mit unabhängigen Technologien erzeugt wurden, wie cDNA-Bibliothek Erzeugung, gibt es wesentliche Überschneidung. SERPINA1 erscheint in ihren Listen, wie auch vier der neun Gene von Klassifikator 2 (TFF3, DPP4, CHI3L1 und LAMB3). Für den Fall von follikulärer Schilddrüsenkrankheit ist Aufbauen eines robusten Klassifikators viel schwieriger. Dies ist hauptsächlich wegen der begrenzten Verfügbarkeit von Daten. Auch waren die beiden Datensätze bezüglich der verwendeten Platformen sehr unterschiedlich; während alle anderen Datensätze an Affyme-trix GeneChips Arrays von unterschiedlichen Generationen erzeugt wurden, wurden die Lacroix-Daten auf einer maßgeschneiderten Agilent Platform erzeugt. Dennoch war der Klassifikator (Set) von Tabelle 4 in der Lage, die meisten Proben in loocv richtig zu identifizieren.
Das Leistungsvermögen der hier angenommenen Herangehensweise der Meta-Analyse wird durch eine 99% loocv-Genauigkeit (97,9% gewichtete durchschnittliche Genauigkeit in der Studien-Kreuzva-lidierung) für die Unterscheidung zwischen papillärem Schilddrüsenkarzinom und gutartigen Knötchen gezeigt. Dies ist mit dem bislang größten und mannigfaltigsten Datensatz erreicht worden (99 Proben von 4 unterschiedlichen Studien) .
Eine Probe wurde falsch klassifiziert und obwohl es nicht möglich ist, die Proben von dieser Analyse zur ursprünglichen Analyse abzubilden, ist die fehlklassifizierte Probe von der selben Gruppe (PTC, Validierungsgruppe) wie die Probe, welche in der ursprünglichen Analyse falsch klassifiziert war. Gemäß Jarz-ab et al. war die Probe ein Ausreißer, weil sie nur ~20% Tumorzellen enthielt.
NACHGEREICHT

Claims (22)

  1. - 31 i • ··· ·· Patentansprüche: 1. Set von Komponenten, spezifisch für mindestens 3 Tumormarker, ausgewählt aus den Tumormarkern Pl-1 bis PI-33, PII-1 bis PII-64, PIII-1 bis PIII-70, FI-1 bis FI-147, PIV-1 bis PIV-9, vorzugsweise PIV-4 oder PIV-5, und PV-1 bis PV-11, vorzugsweise PV-1, PV-2 und PV-4 bis PV-11.
  2. 2. Set gemäß Anspruch 1, dadurch gekennzeichnet, dass das Set Komponenten umfasst,, welche für mindestens 3 Tumormarker spezifisch sind, ausgewählt aus den Tumormarkern PI-1 bis PI-33, PII-1 bis PII-64, PIII-1 bis PIII-70 und PIV-1 bis PIV-9, vorzugsweise PIV-4 oder PIV-5, und PV-1 bis PV-11, vorzugsweise PV-1, PV-2 und PV-4 bis PV-11. <
  3. 3. Set gemäß Anspruch 1, dadurch gekennzeichnet, dass das Set Komponenten umfasst, welche für mindestens 3 Tumormarker spezifisch sind, ausgewählt aus den Tumormarkern PI-1 bis PI-33.
  4. 4. Set gemäß Anspruch 1, dadurch gekennzeichnet, dass das Set Komponenten umfasst, welche für mindestens 3 Tumormarker spezifisch sind, ausgewählt aus den Tumormarkern FI-1 bis FI-147.
  5. 5. Set gemäß einem von Ansprüchen 1 bis 4, dadurch gekennzeichnet, dass das Set eine Komponente umfasst, welche für den Tumormarker SERPINAl spezifisch ist.
  6. 6. Set gemäß einem von Ansprüchen 1 bis 5, dadurch gekennzeichnet, dass das Set mindestens 5, vorzugsweise mindestens 10, ebenfalls bevorzugt mindestens 15, bevorzugter mindestens 20, besonders bevorzugt mindestens 25, insbesondere bevorzugt 30 Komponenten, spezifisch für die Tumormarker und ausgewählt aus Tabellen 1 bis 6, umfasst.
  7. 7. Set gemäß einem von Ansprüchen 1 bis 6, dadurch gekennzeichnet, dass die Komponenten Oligonukleotide sind, welche für Tumormarker-Nukleinsäuren spezifisch sind.
  8. 8. Set gemäß einem von Ansprüchen 1 bis 7, dadurch gekennzeichnet, dass die Komponenten Antikörper oder Antikörperfragmente sind, vorzugsweise ausgewählt aus Fab, Fab' Fab2, F(ab')2 oder scFv, welche für Tumormarker-Proteine spezifisch sind.
  9. 9. Set gemäß einem von Ansprüchen 1 bis 8, dadurch gekennzeichnet, dass die Komponenten auf einem festen Träger immobilisiert sind, vorzugsweise in Form eines Microarrays. nachgereicht | 32
  10. 10. Verfahren für den Nachweis von einem oder mehreren Schilddrüsenkrebs-Markern in einer Probe, welches Verwenden des Sets nach einem von Ansprüchen 1 bis 9 und Nachweisen der Anwesenheit oder Messen der Menge des Vorkommens von Tumormarkern in der Probe umfasst.
  11. 11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, dass die Probe Zellen, vorzugsweise Säugerzellen, besonders bevorzugt menschliche Zellen umfasst.
  12. 12. Verfahren gemäß Anspruch 10 oder 11, dadurch gekennzeichnet, dass der Nachweis oder die Messung durch RNA-Expressionsanalyse, vorzugsweise durch Microarray oder quantitative PCR, oder Proteinanalyse, vorzugsweise durch Gewebe-Microarray-Nachweis, Prote-in-Microarray-Nachweis, mRNA-Microarray-Nachweis, ELISA, Multiplex-Tests, Immunhistochemie oder DNA-Analyse, komparative Genomhybridisierung (CGH)-Arrays oder Einzel-Nukleotid-Polymor-phismus (SNP)-Analyse durchgeführt wird.
  13. 13. Verfahren für die Diagnose von Krebs in einem Patienten, umfassend Beschaffen einer Probe, vorzugsweise einer Probe von Zellen, von dem Patienten, Nachweisen von einem oder mehreren Tumormarkern gemäß einem Verfahren nach einem der Ansprüche 10 bis 12 oder durch Messen von Tumormarker-Signalen mit dem Set gemäß einem von Ansprüchen 1 bis 9, Vergleichen der gemessenen Signalwerte der Tumormarker mit Werten der Tumormarker in gesunden Proben und Diagnostizieren von Krebs falls (a) mehr als 50%, vorzugsweise mehr als 60%, bevorzugter mehr als 70%, insbesondere bevorzugt mehr als 80% der Werte sich verglichen mit den Werten der gesunden Proben durch mindestens die Standardabweichung, vorzugsweise zweimal die Standardabweichung, sogar bevorzugter dreimal die Standardabweichung des Messverfahrens unterscheiden und/oder (b) sich mehr als 50%, bevorzugt mehr als 60%, bevorzugter mehr als 70%, insbesondere bevorzugt mehr als 80% der Werte der Probe verglichen mit den Werten der gesunden Proben um mindestens einen Faktor 1,5 unterscheiden.
  14. 14. Verfahren für die Identifizierung von krankheitsspezifischen Markern, vorzugsweise Genen oder Genexpressionsmustern, umfassend: • Vorsehen von Genexpressionsdaten zu mehrfachen potentiellen krankheitsspezifischen Genen von mindestens zwei unterschiedlichen Expressionsdatensätzen, ^_ NACHGEREC: iT % %
    - 33 - • Bestimmen gemeinsamer Gene der Datensätze, • Normalisieren von jedem Genexpressionsdatensatz, vorzugsweise durch Lowess- oder Quantil-Normalisierung, • Vereinigen der Genexpressionsdatensätze zu einem vereinigten Datensatz und vorzugsweise Normalisieren des vereinigten Datensatzes und Integrieren des vereinigten Datensatzes, • Bestimmen von Genen des vereinigten Datensatzes durch Bestimmen seines Nearest-Shrunken-Centroids, was die Bestimmung eines kreuzvalidierten Fehlerwerts von Zuweisen der Gene zur Krankheit und Minimieren des Fehlerwerts durch Verringern der Anzahl an Mitgliedern des vereinigten, vorzugsweise normalisierten Datensatzes einschließt, wobei die Gene des verringerten Datensatzes die für die Krankheit spezifischen Marker sind.
  15. 15. Verfahren nach Anspruch 14, dadurch gekennzeichnet, dass die Expressionsdaten Daten von mindestens zwei unterschiedlichen Mi-croarray-Datensätzen umfassen, insbesondere mit studienspezifischen Verzerrungen.
  16. 16. Verfahren nach Ansprüchen 14 oder 15, dadurch gekennzeichnet, dass die Krankheit eine genetische Störung, vorzugsweise eine Störung mit veränderter Genexpression, insbesondere bevorzugt Krebs ist.
  17. 17. Verfahren nach einem von Ansprüchen 14 bis 16, dadurch gekennzeichnet, dass die erhaltenen Genexpressionsdaten rohe, unverarbeitete Genexpressiondaten sind.
  18. 18. Verfahren nach einem von Ansprüchen 14 bis 17, dadurch gekennzeichnet, dass der Vereinigungsschritt durch schrittweise Vereinigung von zwei Genexpressionsdatensätzen und Integration der vereinigten Daten, vorzugsweise durch DWD, durchgeführt wird.
  19. 19. Verfahren nach einem von Ansprüchen 14 bis 18, dadurch gekennzeichnet, dass jeder Expressionsdatensatz Daten von mindestens 10, vorzugsweise mindestens 20, bevorzugter mindestens 30, noch bevorzugter mindestens 40, insbesondere bevorzugt mindestens 50 unterschiedlichen Genen umfasst.
  20. 20. Verfahren nach einem von Ansprüchen 14 bis 19, dadurch gekennzeichnet, dass der Bestimmungsschritt für einen vereinigten Satz wiederholt wird, ohne dass die Gene in einem vorhergehenden Bestimmungsschritt bestimmt wurden. NACHGEREICi ΪΤ
    • ·
    34
  21. 21. Verfahren nach einem von Ansprüchen 14 bis 20, dadurch gekennzeichnet, dass der Bestimmungsschritt die Bestimmung eines maximierten Schwellenwerts des Unterschieds des normalisierten Expressionswerts für jedes Gen zum Zentroid durch die Kreuzvalidierung umfasst, und worin die Gene mit niedrigeren normalisierten Expressionswerten als der Schwellenwert aus dem verringerten Satz entfernt werden.
  22. 22. Verfahren für die Diagnose von Krebs in einem Patienten, umfassend Beschaffen einer Probe, vorzugsweise einer Probe von Zellen, von dem Patienten, Nachweisen von einem oder mehreren Tumormarkern gemäß einem Verfahren nach einem von Ansprüchen 10 bis 12 oder durch Messen von Tumormarker-Signalen mit dem Set gemäß einem von Ansprüchen 1 bis 9, Vergleichen der gemessenen Signalwerte der Tumormarker mit Werten der Tumormarker in Krebsproben durch das Identifizierungsverfahren nach einem von Ansprüchen 14 bis 21 und Diagnostizieren von Krebs, falls der Nearest-Shrunken-Centroid von Werten der Probe des Patienten für mindestens 50% Marker des Sets innerhalb der Standardabweichung, vorzugsweise zweimal der Standardabweichung, noch bevorzugter dreimal der Standardabweichung des Messverfahrens zum Nearest-Shrunken-Centroid der mit den Krebsproben identifizierten Tumormarker ist. NACHGEREiC: ΓΓ
AT0135907A 2007-08-30 2007-08-30 Set von tumor-markern AT505726A2 (de)

Priority Applications (8)

Application Number Priority Date Filing Date Title
AT0135907A AT505726A2 (de) 2007-08-30 2007-08-30 Set von tumor-markern
EP08782839.8A EP2191272B1 (de) 2007-08-30 2008-08-29 Tumormarkersatz
CN200880111283A CN101821628A (zh) 2007-08-30 2008-08-29 肿瘤-标志物的组
PCT/AT2008/000311 WO2009026605A2 (en) 2007-08-30 2008-08-29 Set of tumour-markers
US12/675,736 US20110152110A1 (en) 2007-08-30 2008-08-29 Set of Tumour-Markers
CN201610885157.6A CN106483290B (zh) 2007-08-30 2008-08-29 肿瘤-标志物的组
ES08782839T ES2429299T3 (es) 2007-08-30 2008-08-29 Conjunto de marcadores tumorales
US14/691,405 US10100364B2 (en) 2007-08-30 2015-04-20 Set of tumor-markers

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
AT0135907A AT505726A2 (de) 2007-08-30 2007-08-30 Set von tumor-markern

Publications (1)

Publication Number Publication Date
AT505726A2 true AT505726A2 (de) 2009-03-15

Family

ID=39790437

Family Applications (1)

Application Number Title Priority Date Filing Date
AT0135907A AT505726A2 (de) 2007-08-30 2007-08-30 Set von tumor-markern

Country Status (6)

Country Link
US (2) US20110152110A1 (de)
EP (1) EP2191272B1 (de)
CN (2) CN101821628A (de)
AT (1) AT505726A2 (de)
ES (1) ES2429299T3 (de)
WO (1) WO2009026605A2 (de)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8338109B2 (en) 2006-11-02 2012-12-25 Mayo Foundation For Medical Education And Research Predicting cancer outcome
EP2291553A4 (de) 2008-05-28 2011-12-14 Genomedx Biosciences Inc Systeme und verfahren zur expressionsbasierten unterscheidung unterschiedlicher klinischer krankheitsstadien bei prostatakrebs
US10407731B2 (en) 2008-05-30 2019-09-10 Mayo Foundation For Medical Education And Research Biomarker panels for predicting prostate cancer outcomes
CA2743473C (en) * 2008-11-17 2022-06-14 Veracyte, Inc. Methods and compositions of molecular profiling for disease diagnostics
US10236078B2 (en) 2008-11-17 2019-03-19 Veracyte, Inc. Methods for processing or analyzing a sample of thyroid tissue
US9495515B1 (en) 2009-12-09 2016-11-15 Veracyte, Inc. Algorithms for disease diagnostics
US9074258B2 (en) 2009-03-04 2015-07-07 Genomedx Biosciences Inc. Compositions and methods for classifying thyroid nodule disease
US8669057B2 (en) 2009-05-07 2014-03-11 Veracyte, Inc. Methods and compositions for diagnosis of thyroid conditions
US10446272B2 (en) 2009-12-09 2019-10-15 Veracyte, Inc. Methods and compositions for classification of samples
EP2519651A2 (de) * 2009-12-30 2012-11-07 Rigshospitalet Klassifizierung von follikulärer thyroidneoplasie auf grundlage von mrna-expression
EP2366800A1 (de) 2010-03-01 2011-09-21 Centrum Onkologii-Instytut im M. Sklodowskiej-Curie Oddzial w Gliwicach Kit, Methode und Verwendung eines Genexpressionsprofils zur Diagnose von papillären Schilddrüsenkrebs
US20140236621A1 (en) * 2011-09-26 2014-08-21 Universite Pierre Et Marie Curie (Paris 6) Method for determining a predictive function for discriminating patients according to their disease activity status
WO2013090620A1 (en) 2011-12-13 2013-06-20 Genomedx Biosciences, Inc. Cancer diagnostics using non-coding transcripts
US20140357518A1 (en) * 2012-01-12 2014-12-04 Oncocyte Corporation Methods and Compositions for the Treatment and Diagnosis of Thyroid Cancer
EP2885640B1 (de) 2012-08-16 2018-07-18 Genomedx Biosciences, Inc. Prostatakrebsprognostik mittels biomarkern
CN105899953B (zh) * 2013-11-05 2018-09-18 新加坡科技研究局 膀胱癌生物标志物
CN114606309A (zh) 2014-11-05 2022-06-10 威拉赛特公司 使用机器学习和高维转录数据的诊断系统和方法
CN110506127B (zh) 2016-08-24 2024-01-12 维拉科特Sd公司 基因组标签预测前列腺癌患者对术后放射疗法应答性的用途
CN108165621A (zh) * 2016-12-07 2018-06-15 宁光 良性甲状腺结节特异基因
US11208697B2 (en) 2017-01-20 2021-12-28 Decipher Biosciences, Inc. Molecular subtyping, prognosis, and treatment of bladder cancer
WO2018165600A1 (en) 2017-03-09 2018-09-13 Genomedx Biosciences, Inc. Subtyping prostate cancer to predict response to hormone therapy
CN108445097A (zh) * 2017-03-31 2018-08-24 北京谷海天目生物医学科技有限公司 弥漫型胃癌的分子分型、用于分型的蛋白标志物及其筛选方法和应用
CA3062716A1 (en) 2017-05-12 2018-11-15 Decipher Biosciences, Inc. Genetic signatures to predict prostate cancer metastasis and identify tumor agressiveness
US11217329B1 (en) 2017-06-23 2022-01-04 Veracyte, Inc. Methods and systems for determining biological sample integrity
CN109613246A (zh) * 2019-01-10 2019-04-12 江苏三联生物工程有限公司 一种检测四种甲状腺肿瘤标志物的芯片及其制备方法
KR102164525B1 (ko) * 2019-02-15 2020-10-12 충남대학교 산학협력단 Gdf 15를 포함하는 갑상선 암 진단 또는 갑상선 암 예후 예측용 바이오마커 조성물
CN112881693B (zh) * 2021-01-26 2024-01-30 河南省人民医院 一组肿瘤相关抗原在制备肝癌早期筛查试剂盒中的应用
WO2023101846A2 (en) * 2021-11-30 2023-06-08 Gradalis, Inc. Methods for treatment response to cancers

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7625697B2 (en) * 1994-06-17 2009-12-01 The Board Of Trustees Of The Leland Stanford Junior University Methods for constructing subarrays and subarrays made thereby

Also Published As

Publication number Publication date
US20110152110A1 (en) 2011-06-23
EP2191272B1 (de) 2013-07-31
CN106483290B (zh) 2020-10-13
CN101821628A (zh) 2010-09-01
CN106483290A (zh) 2017-03-08
US10100364B2 (en) 2018-10-16
EP2191272A2 (de) 2010-06-02
ES2429299T3 (es) 2013-11-14
US20150252437A1 (en) 2015-09-10
WO2009026605A2 (en) 2009-03-05
WO2009026605A3 (en) 2009-05-22

Similar Documents

Publication Publication Date Title
AT505726A2 (de) Set von tumor-markern
US20220325348A1 (en) Biomarker signature method, and apparatus and kits therefor
CA2875710C (en) Molecular malignancy in melanocytic lesions
US20200256873A1 (en) Methods for treating, preventing and predicting risk of developing breast cancer
US20060252057A1 (en) Lung cancer prognostics
EP1934615A2 (de) Verfahren und materialien zur identifizierung des ursprungs eines karzinoms unbekannter primärer herkunft
US10604809B2 (en) Methods and kits for the diagnosis and treatment of pancreatic cancer
WO2008095152A2 (en) Methods and materials for identifying the origin of a carcinoma of unknown primary origin
CA2914026A1 (en) Assays, methods and kits for analyzing sensitivity and resistance to anti-cancer drugs, predicting a cancer patient's prognosis, and personalized treatment strategies
Chen et al. cDNA microarray analysis and immunohistochemistry reveal a distinct molecular phenotype in serous endometrial cancer compared to endometrioid endometrial cancer
JP2008538284A (ja) 乳房の腫瘍のレーザーマイクロダイセクションおよびマイクロアレイ解析が、エストロゲン受容体に関係する遺伝子および経路を明らかにする
US11739386B2 (en) Methods for determining response to PARP inhibitors
US20210079479A1 (en) Compostions and methods for diagnosing lung cancers using gene expression profiles
CN101356184A (zh) 对患有急性骨髓性白血病的患者进行评估的方法
DE102006035392A1 (de) Prognostische Marker für die Vorhersage des fünfjährigen progressionsfreien Überlebens von Patienten mit Kolonkarzinomen basierend auf Expressionsprofilen von biologischen Proben
Eggle Using whole-genome wide gene expression profiling for the establishment of RNA fingerprints: application to scientific questions in molecular biology, immunology and diagnostics

Legal Events

Date Code Title Description
REJ Rejection

Effective date: 20160515