DE102005004294A1 - Auswahl und Bewertung diagnostischer Tests mittels Diskordanzanalysen-Charakteristik (DAC) - Google Patents

Auswahl und Bewertung diagnostischer Tests mittels Diskordanzanalysen-Charakteristik (DAC) Download PDF

Info

Publication number
DE102005004294A1
DE102005004294A1 DE200510004294 DE102005004294A DE102005004294A1 DE 102005004294 A1 DE102005004294 A1 DE 102005004294A1 DE 200510004294 DE200510004294 DE 200510004294 DE 102005004294 A DE102005004294 A DE 102005004294A DE 102005004294 A1 DE102005004294 A1 DE 102005004294A1
Authority
DE
Germany
Prior art keywords
cut
test
dac
diagnostic
pairs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE200510004294
Other languages
English (en)
Inventor
Hermann Dr. Butz
Thomas Dr. Keller
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens Healthcare Diagnostics Products GmbH
Original Assignee
Bayer Healthcare AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bayer Healthcare AG filed Critical Bayer Healthcare AG
Priority to DE200510004294 priority Critical patent/DE102005004294A1/de
Priority to PCT/EP2006/000670 priority patent/WO2006079530A1/en
Priority to EP06701307A priority patent/EP1842139A1/de
Publication of DE102005004294A1 publication Critical patent/DE102005004294A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Hematology (AREA)
  • Chemical & Material Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Food Science & Technology (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur Ermittlung der diagnostischen Güte von diagnostischen Tests anhand von Messwerten, von zwei diagnostischen Tests gemessen an Patienten mit der (positiv) und ohne die (negativ) zu diagnostizierende Erkrankung. Es werden Cut-Off-Paare (CO¶1¶, CO¶2¶)¶k¶ nach dem Kriterium gleicher Sensitivität für die Messwerte beider Tests festgelegt und für jedes Cut-Off-Paar (CO¶1¶, CO¶2¶)¶k¶ die Messerte ausgewählt, die entweder für den ersten Test oberhalb des zugehörigen Cut-Off (CO¶1¶) und für den zweiten Test unterhalb des zugehörigen Cut-Off (CO¶2¶) liegen, oder die für den ersten Test unterhalb des zugehörigen Cut-Off (CO¶1¶) und für den zweiten Test oberhalb des zugehörigen Cut-Off (CO¶2¶) liegen. Für jedes Cut-Off-Paar (CO¶1¶, CO¶2¶)¶k¶ und für die ausgewählten Messwerte wird die Anzahl von denjenigen Messwerten bestimmt, die zu Patienten gehören, die richtig testpositiv, falsch testpositiv, richtig testnegtiv und falsch testnegativ getestet wurden. Aus diesen Anzahlen werden die Spezifitäten für beide diagnostischen Tests berechnet.

Description

  • Die Erfindung betrifft die Anwendung eines mathematischen Verfahrens, mit dessen Hilfe ein Verfahren zur Diagnose einer Erkrankung ausgewählt und bewertet werden kann. Die Auswahl und Bewertung eines diagnostischen Verfahrens erfolgt auf der Basis verschiedener Kenngrößen. Im Vordergrund stehen dabei
    • – die Laboreigenschaften (Richtigkeit, Präzision, Selektivität etc. bei der Erzeugung des Messwertes),
    • – die diagnostische Güte (Sensitivität, Spezifität der Entscheidung positiv/negativ, berechnet anhand der Anzahlen für richtig positive, richtig negative, falsch positive und falsch negative Entscheidungen.),
    • – der Kostenfaktor (monetäre Kosten, „Kosten", d.h. Belastung (z.B. invasive Folge- und Zusatzuntersuchungen für den Patienten) sowie
    • – die Wirkung (verbesserte Therapiemöglichkeiten, verbessertes Überleben aufgrund der Diagnostik).
  • Die Erfindung betrifft die Auswahl bezüglich der diagnostischen Güte. Darüber hinaus sind auch Aussagen zu den „Kosten" möglich, wobei ein direkter Link zwischen Diagnostik-Bewertung und Kostenbewertung hergestellt wird. Nach dem Stand der Technik werden auf der Basis der Sensitivitäts- und Spezifitätswerte für verschiedene Cut-Offs (Entscheidungsschwellen) des oder der zu untersuchenden Tests zwei Methoden angewandt:
  • a. Punktweise Analyse von Sensitivität und Spezifität, Vergleich mittels McNemar-Tests:
  • Für vorgegebene Cut-Off-Werte werden Sensitivität und Spezifität ermittelt und angegeben. Alternativ können für vorgegebene Werte der Spezifität (bzw. Sensitivität), z.B. 95%, die zugehörigen Werte für die Sensitivität (bzw. Spezifität) ermittelt werden. Werden Sensitivität bzw. Spezifität auf letztere Weise ermittelt, so können deren Werte für zwei diagnostische Tests durch Eintrag der jeweiligen Testergebnisse positiv/negativ in eine Vierfeldertafel verglichen werden. Die Felder beinhalten die Kombinationen „beide Tests positiv", „beide Tests negativ" sowie die beiden diskordanten Fälle. Die statistische Auswertung hinsichtlich von Unterschieden von Sensitivität bzw. Spezifität erfolgt mit dem McNemar-Test (Altman DG. Practical statistics for medical research, London: Chapman & Hall, 1991:p416).
  • b. ROC (Receiver Operating Characteristics)-Analyse:
  • Zur ROC-Analyse werden die Sensitivität/Spezifitäts-Wertepaare für alle denkbaren Cut-Offs in der Form Richtig-Positiv-Rate = f(Falsch-Positiv-Rate) oder anders formuliert Sensitivität = f(1-Spezifität) aufgetragen. Das heißt, alle Werte des Wertebereiches (Messbereiches) werden als Cut-Off-Wert verwendet, und die zugehörigen Sensitivitäten und Spezifitäten ermittelt. Als Kenngröße zum Methodenvergleich wird das Integral unter der Funktion, die AUC (Area Under Curve), verwendet. Eine höhere AUC geht mit einer verbesserten diagnostischen Güte einher. Die AUC kann Werte zwischen 0,5 (fehlende Trennschärfe des Tests) und 1 (vollständige Trennschärfe des Tests) annehmen. Der statistischen Bewertung einer AUC mittels z.B. des Wilcoxon-Tests oder der Vergleich mehrerer AUC und die Berechnung einer statistischen Signifikanz für den Unterschied durch die z.B. in Hanley JA, McNeil BJ. The meaning and use of the area under a receiver operating characteristic (ROC) curve. Radiology 1982;143:29-36 oder in DeLong ER, DeLong DM, Clarke-Pearson DL. Comparing the areas under two or more correlated receiver operating characteristic curves: a nonparametric approach. Biometrics 1988;44:837-45 angegebenen Verfahren sind als mathematische Methoden etabliert.
  • Die Ergebnisse der punktweisen Analysen hängen stark von den spezifisch zugrundeliegenden Daten und Verteilungen ab. Damit wird ein Vergleich zwischen verschiedenen Datenerhebungen zu ein und demselben diagnostischen Tests und ein Vergleich zwischen verschiedenen diagnostischen Verfahren schwierig. Punktweise Analysen werden insbesondere problematisch, wenn innerhalb der Datenerhebungen nur Teilbereiche des durch die Grundgesamtheit beschriebenen Wertebereiches untersucht werden. Bei teuren Messverfahren ist es beispielsweise üblich, nur Patienten in eine Datenerhebung einzuschließen, die Messwerte um die Entscheidungsgrenze, den Cut-Off-Wert, aufweisen. Die hierbei ermittelten Werte für Sensitivität und Spezifität sind von den entsprechenden Werten für die Grundgesamtheit völlig und prinzipiell unterschiedlich.
  • Punktweise Vergleiche zwischen zwei verschiedenen Tests oder zwischen mehreren Datenerhebungen zu ein und demselben Test sind weiterhin schwierig, wenn sie nicht auf der Basis gleicher Sensitivität (bzw. Spezifität) erfolgen. Dies ist z.B. der Fall, wenn Wertepaare (Sensitivität, Spezifität) = (70%, 80%) und (50%, 90%) verglichen werden sollen. Summenmaße, in die beide Werte eingehen, wie der Youden-Index (Sensitivität + Spezifität – 1) oder die Effizienz (Anteil aller richtig bewerteten Testergebnisse an Gesamtzahl der Fälle), haben sich nicht durchgesetzt, da ihre Aussagekraft eingeschränkt ist und fehlerhafte Schlussfolgerungen möglich sind. Der McNemar-Test erlaubt also Aussagen für spezifische Wertepaare (Sensitivität/Spezifität), das heißt für spezielle Punkte der ROC-Kurve. Die dabei vorgenommene Selektion nur eines Cut-Off-Wertes führt zu richtigen, aber eingeschränkten Aussagen.
  • Aufgrund dieser Nachteile ist es üblich, ROC-Analysen zur Bewertung der diagnostischen Güte vorzunehmen. Dadurch, dass diese Analysen den gesamten Wertebereich nutzen, lassen sich fehlerhafte Aussagen bei der punktweisen Analysen vermeiden. Jedoch führt die ROC-Analyse ihrem Wesen nach zu einer Übersichts-Betrachtung der diagnostischen Güte. In der Fachsprache wird dieser Sachverhalt so formuliert, dass in der ROC-Analyse jede Falsch-Positiv-Rate das gleiche Gewicht hat (Zweig MH, Campbell G. Receiver-operating characteristic (ROC) plots: a fundamental evaluation tool in clinical medicine [Review]. Clin Chem 1993;39:561-77).
  • Beim Einsatz eines diagnostischen Tests interessiert den Anwender aber meist nur ein ausgewählter Sensitivitäts- oder Spezifitätsbereich. Bestehende oder fehlende Unterschiede in diesem Bereich werden durch die Gesamtbetrachtung, wie sie insbesondere durch die AUC vorgenommen wird, verdeckt. So können bestehende Unterschiede nicht als signifikant ermittelt werden. Andererseits können fehlende Unterschiede durch Auftreten von Unterschieden in anderen Sensitivitäts-/Spezifitätsbereichen fälschlicherweise als Unterschiede detektiert werden.
  • Der Nachteil der ROC-Analyse, der mit dem erfindungsgemäßen Verfahren insbesondere verbessert werden soll, besteht darin, dass die diagnostische Güte um den Entscheidungspunkt (Cut-Off) – die den eigentlichen Wert eines diagnostischen Verfahrens ausmacht – durch die gleichwertigen Ergebnisse beider Verfahren fern vom Entscheidungspunkt verdeckt wird.
  • Eine übliche Strategie zur Bewältigung dieses Nachteils ist es, nur anhand von Untergruppen die ROC-Analyse durchzuführen, wobei die Untergruppen durch einen herausgeschnittenen Wertebereich eines Markers festgelegt werden. Dieses Verfahren führt jedoch zu Verzerrungen, die eine richtige und objektive Bewertung der Unterschiede zweier Verfahren nicht zulassen. An der unteren Grenze des herausgeschnittenen Wertebereichs bestehen die Verzerrungen insbesondere darin, dass Patienten mit Erkrankung bei niedrigen Werten des zur Auswahl benutzten Markers aus der Analyse ausgeschlossen werden, obwohl sie durch diesen Marker falsch negativ und durch den zweiten Marker möglicherweise richtig positiv erkannt werden würden. Eine derartige Subgruppenanalyse mittels ROC-Kurven wird also den zur Auswahl benutzten Marker bevorteilen. Analoge Auswahlartefakte bestehen an der oberen Grenze des herausgeschnittenen Wertebereichs.
  • Eine andere Strategie ist die Verwendung ausgewählter Flächenbereiche der ROC-Kurve, das heißt die Analyse von pAUC (partial Area Under Curve) (McClish DK. Analyzing a portion of the ROC curve. Med Decis Making 1989;9:190-5.). Diese Strategie führt zu richtigen Ergebnissen. Sie hat sich in der Praxis jedoch nicht durchsetzten können, da sie zu kompliziert ist, und insbesondere der statistische Nachweis von Unterschieden (Berechnung der Signifikanz und der Konfidenzintervalle) schwierig ist.
  • Die ROC-Analyse führt zu einer Kurve, in der die Richtig-Positiv-Rate über der Falsch-Positiv-Rate aufgetragen ist. Die entstandene Kurve ist nur für den statistisch vorgebildeten Fachmann interpretierbar. Da die ROC-Kurve häufig in medizinischen Artikeln oder Fachinformationen verwendet wird, ist eine kritische Würdigung des Potentials und der Grenzen des diagnostischen Tests durch den üblichen Anwender von diagnostischen Tests (Arzt) nicht möglich.
  • Weiterhin können Patienteneigenschaften wie Alter, Krankheitsstadium, Subkrankheitsklasse, die diagnostische Güte beeinflussen. Die Zusammenhänge, die zwischen der diagnostischen Güte, die z.B. anhand von Sensitivität/Spezifität Wertepaaren oder anhand einer ROC Kurve dargestellt wird, und den Patienteneigenschaften sind mit den Methoden nach dem Stand der Technik weder direkt ermittelbar noch darstellbar.
  • Die erfindungsgemäße Lösung zu den Problemen der aus dem Stand der Technik bekannten Verfahren besteht in dem Verfahren nach Anspruch 1 und den abhängigen Ansprüchen.
  • Festlegung von Cut-Off-Paaren und Ermittlung diskordanter Testergebnisse mittels Quadranten
  • Das erfindungsgemäße Verfahren sieht vor, dass nur die diskordanten Testergebnisse in die Analyse eingehen. Die diskordanten Testergebnisse machen den Vorteil eines diagnostischen Tests oder den Unterschied zweier diagnostischer Tests aus. Dies wird im Folgenden anhand des Vergleiches von zwei unterschiedlichen diagnostischen Tests erläutert. Für die Bewertung eines einzelnen diagnostischen Tests wird der hierfür notwendige zweite Test durch eine mathematische Beschreibung einer angenommenen, zufälligen Verteilung von Testergebnissen ersetzt.
  • Die diagnostischen Messwerte von zwei diagnostischen Tests, Test 1 und Test 2, werden in einem Scatterplot (Streudiagramm) aufgetragen. Durch die folgenden Verfahren können aus den so aufgetragenen Messwerten zwei Cut-Off-Werte (CO1, CO2, im weiteren Cut-Off-Paar genannt) bestimmt werden:
    • – Anwendung der Kriterien gleicher Sensitivität oder Spezifität.
    • – ein Regressionsverfahren, wie z.B. die Passing-Bablok-Regression (Passing H, Bablok W. A new biometrical procedure for testing the equality of measurements from two different analytical methods. Application of linear regression procedures for method comparison studies in clinical chemistry, Part I. J Clin Chem Clin Biochem 1983;21:709-20), in das alle Messwerte eingehen.
    • – ein Regressionsverfahren, wie z.B. die Passing-Bablok-Regression, in das die Messwerte nur einer der beiden zu diskriminierenden Gruppen eingehen.
    • – gleiche Besetzungszahlen für die Quadranten Q2 und Q4.
  • Durch das Cut-Off-Paar, das sich im Scatterplot durch je eine senkrechte und eine waagerechte Linie manifestiert, werden die Messergebnisse in 4 Quadranten unterteilt. Dies ist in 1 dargestellt. Die Quadranten unterteilen die Patienten in vier Gruppen: Entweder sind beide Testergebnisse gleichartig negativ (Q1) oder positiv (Q3), oder sie unterscheiden sich (Q2 und Q4). Nach dem erfindungsgemäßen Verfahren werden nur die Patienten mit diskordantem Testergebnis einbezogen, das heißt Patienten aus den Quadranten 2 und 4.
  • In gleicher Weise wird über den gesamten Wertebereich des bzw. der untersuchten Tests vorgegangen. Patienten mit diskordanten Testergebnisse werden für alle, nach oben genannten Verfahren berechenbaren möglichen Cut-Off-Paare ermittelt. Wenn es demnach k verschiedene Cut-Off-Paare gibt, lassen sich jeweils k verschiedene Quadranten Q1, Q2, Q3 und Q4 angeben.
  • Innerhalb dieser Gesamtbetrachtung werden die Patienten für jeweils verschiedene Cut-Off-Paare meist den Quadranten Q1 oder Q3 zugeordnet. Für bestimmte Cut-Off-Paare jedoch werden die Patienten zumindest einmal entweder Quadranten Q2 oder Quadranten Q4 zugeordnet. Dabei ist es innerhalb einer Gesamtbetrachtung nicht möglich, dass ein Patient für ein Cut-Off-Paar einem Quadranten Q2 und für ein anderes Cut-Off-Paar einem Quadranten Q4 zugeordnet wird. Mit anderen Worten, alle Patienten werden eindeutig einer von zwei Subpopulationen zugeordnet.
  • Die Patienten der einen Subpopulation zeichnen sich dadurch aus, dass sich mindestens ein Cut-Off-Paar angeben lässt, für das er dem Quadranten Q2 zugehört. Für die andere Subpopulation gilt gleiches entsprechend für Q4. Hieraus lassen sich Charakteristiken ableiten, das heißt je Cut-Off-Paar werden für beide Subpopulationen ausgewählte Parameter bestimmt und über alle oder einen Bereich von Cut-Off-Paaren aufgetragen. Diese Charakteristiken werden im weiteren Text als Diskordanz-Analysen-Charakteristik (DAC) bezeichnet. Diese Parameter können sowohl Testergebnisse (jeweils bezogen auf Q2 und Q4 Richtig- und Falsch-Testpositive bzw. Testnegative) sowie davon abgeleitete Größen wie Sensitivität, Spezifität, als auch Eigenschaften der Patienten, wie z.B. das Alter oder das Krankheitsstadium sein.
  • Auf diese Weise können in vorteilhafter Weise einerseits die diagnostische Güte selbst und andererseits auch Zusammenhänge zwischen der diagnostischen Güte und Patienteneigenschaften ermittelt und bewertet werden.
  • Ermittlung und Bewertung der diagnostischen Güte
  • Zur Ermittlung und Bewertung der diagnostischen Güte werden die Zahlen rp (richtig Testpositive), fp (falsch Testpositive), rn (richtig Testnegative und fn (falsch Testpositive) innerhalb der diskordant eingeordneten Patienten quadrantenweise in Q2 und Q4 analysiert.
  • So lassen innerhalb dieser diskordant eingeordneten Patienten Sensitivitäten rp/(rp + fn) und Spezifitäten rn/(rn + fp) – jeweils bezogen auf die beiden diagnostischen Tests – angeben. Um Verwechslungen zu vermeiden, seien diese Parameter als DAC-Sensitivität (DAC-SENS) bzw. DAC-Spezifität (DAC-SPEC) bezeichnet. Da in den Quadranten Q2 und Q4 die Patienten die Eigenschaft haben, dass ein Testergebnis für den einen Test T1 jeweils mit dem entgegengesetzten Testergebnis für den anderen Test T2 verbunden ist, gilt: rpT1 = fnT2, rpT2 = fnT1, rnT1 = fpT2, rnT2 = fpT1,
  • Für Test 1 (Marker 1) gilt: DAC-SENST1 = rpT1/(rpT1 + fnT1) = fnT2/(fnT2 + rpT2) = 1 – rpT2/(rpT2 + fnT2) = 1 – DAC-SENST2
  • Demzufolge ergänzen sich die DAC-Sensitivitäten von Test 1 und Test 2 zu 1. Entsprechendes gilt für die DAC-Spezifitäten.
  • In gleicher Weise lässt sich zeigen, dass gilt: Innerhalb der diskordant eingeordneten Patienten ist der positive Vorhersagewert DAC-pVw des einen Tests gleich dem negativen Vorhersagewert DAC-nVw des anderen Tests, z.B.: pVwT1 = rpT1/(rpT1 + fpT1) = fnT2/(fnT2 + rnT2) = nVwT2
  • Wegen dieser Abhängigkeiten ist es zur Beschreibung der diagnostischen Güte ausreichend, DAC-Sensitivität (bei Verwendung von Cut-Off-Paaren nach dem Kriterium gleicher Spezifität) bzw. DAC-Spezifität (bei Verwendung von Cut-Off-Paaren nach dem Kriterium gleicher Sensitivität) nur von einem der Tests anzugeben. Ferner ist es ausreichend, entweder den positiven oder den negativen Vorhersagewert anzugeben.
  • Nach dem erfindungsgemäßen Verfahren werden derartige Parameter oder sich durch Rechenoperationen ergebende neue Parameter wie die Differenz zweier DAC-Spezifitäten in einem Graphen über den Cut-Off-Paaren oder den zur Cut-Off-Wahl verwendeten Größe aufgetragen. Zum Beispiel kann die Differenz aus der DAC-Spezifität für Test 2 und der DAC-Spezifität für Test 1 über den zusammengehörigen Cut-Off-Paaren aufgetragen werden. Wurde das Kriterium gleicher Sensitivität für die Auswahl der Cut-Off-Werte verwendet, so lässt sich diese Differenz der DAC-Spezifitäten auch über der Sensitivität auftragen. Eine auf diese Weise erhaltene Kurve hat die Eigenschaft, dass der jeweilige zu einem Cut-Off-Paar zugehörige Funktionswert nur von Patienten abhängt, die Messwerte in der lokalen Umgebung der Cut-Off-Werte aufweisen. Diese Umgebung wird von den Fällen vorgegeben, die in den zu den Cut-Off-Paaren zugehörigen Quadranten Q2, und Q4 liegen. Diese Eigenschaft ist besonders wichtig, wenn es sich um zwei Tests handelt, die stark korrelieren. Dies kann der Fall sein, wenn in den beiden Tests verschiedene Unterformen desselben Markers verwendet werden. Damit ist es im Gegensatz zur ROC-Analyse möglich, auf einfache und verzerrungsfreie Weise die diagnostische Güte für einen eingeschränkten Bereich um die Cut-Off-Werte so anzugeben, dass ein Vergleich zwischen verschiedenen Messverfahren oder zwischen verschiedenen Datenerhebungen überhaupt erst möglich wird.
  • Ermittlung der diagnostischen Güte im Zusammenhang mit Patienteneigenschaften (PE)
  • Mit dem erfindungsgemäßen Verfahren können Patienteneigenschaften PE in gleicher Weise wie die Testergebnisse einer Analyse unterzogen werden. Hierfür werden beispielsweise die Erwartungswerte der Patienteneigenschaft PE (z.B. Mittelwert des Alters) innerhalb jeweils des Quadranten Q2 und Q4 ermittelt. Diese Vorgehen wird wieder für alle Cut-Off-Paare wiederholt, und eine Charakteristik wie oben beschrieben erstellt. Durch Gegenüberstellung der Charakteristiken für die Testergebnisse mit den Charakeristiken für die Patienteneigenschaften PE mit Hilfe von statistischen Verfahren wie z.B. Kontingenztafelanalysen, Korrelationsanalysen oder Varianzanalysen ist es möglich, Zusammenhänge der ausgewählten Patienteneigenschaften PE mit der diagnostischen Güte aufzudecken.
  • Analyse mit nur einem diagnostischen Test
  • Das erfindungsgemäße Verfahren ist auch anwendbar, wenn die diagnostische Güte nur eines diagnostischen Tests ermittelt und bewertet werden soll. In diesem Fall wird der zweite Test durch eine mathematische Beschreibung eines zufälligen Testergebnisses in der gleichen Messwertverteilung wie der des ersten Tests ersetzt.
  • Figuren und Beispiele
  • Die Figuren zeigen:
  • 1: Streudiagramm für zwei verschiedene Tests zu derselben Erkrankung
  • 2: Auswertung der Daten Lein et al. (2003) bzgl. der Diagnostik eines Prostatakarzinoms mittels der DAC-Methode
  • 3: Auswertung des Alters für Patienten mit Prostata-Karzinom aus der Studie Lein et al. (2003) mit der DAC-Methode
  • 4: Auswertung der Daten aus der Studie Keller et al. (1998) zur Wertigkeit der Tumormarker CYFRA 21-1 und CEA für die Unterscheidung Plattenepithelkarzinom – Adenokarzinom
  • 5: Auswertung der Daten aus der Studie Keller et al. (1998) zur Wertigkeit der Tumormarker CYFRA 21-1 und NSE für die Diagnostik eines Bronchialkarzinoms gegenüber benignen Erkrankungen
  • 6: Auswertung der Tumorart für Patienten mit Bronchial-Karzinom aus der Studie Keller et al. (1998) mit der DAC-Methode
  • 7a: Anwendung der DAC-Methode auf einen einzelnen Marker: NSE zur Diagnostik des Bronchialkarzinoms bei kleinzelligen Tumoren
  • 7b: Anwendung der DAC-Methode auf einen einzelnen Marker: NSE zur Diagnostik des Bronchialkarzinoms bei nichtkleinzelligen Tumoren
  • 2 zeigt ein Streudiagramm der Messergebnisse von zwei verschiedenen diagnostischen Tests, das heißt mit zwei verschiedenen diagnostischen Markern für Patienten mit (
    Figure 00080001
    ) und ohne (X) Erkrankung. Durch das Einzeichnen der jeweiligen Schwellwerte (Cut-Off) CO1 und CO2 für jeden Marker ergeben sich vier Quadranten. Nach dem erfindungsgemäßen Verfahren werden je Cut-Off-Paar nur die Patienten eingeschlossen, die den Quadranten Q2 oder Q4 zuzuordnen sind.
  • Beispiel 1
  • Es wurde ein Vergleich der diagnostischen Güte von Gesamt-PSA (tPSA) und komplexiertem PSA (cPSA) bei der Diagnostik des Prostatakarzinoms vorgenommen.
  • In der Publikation Lein M, Kwiatkowski M, Semjonow A, Luboldt H-J, Hammerer P, Stephan C, et al. A multicenter clinical trial on the use of complexed prostate specific antigen in low prostate specific antigen concentrations. J Urol 2003;170:1175-9 (Lein et al., 2003) werden in einer multizentrischen Studie erhobene Daten bezüglich der Fragestellung untersucht, ob cPSA eine höhere diagnostische Güte aufweist als tPSA. In der Studie, in die nur Patienten mit einem (zuvor unabhängig gemessenen) tPSA-Messwert < 4 μg/L einbezogen wurden, werden die Ergebnisse von ROC-Analysen wie auch Sensitivitäts-/Spezifitätswertepaare angegeben. Die Ergebnisse waren nicht eindeutig. Für den t-PSA-Wertebereich 2.5–4 μg/ L wurde AUCcPSA > AUCtPSA ermittelt. Auf der Basis von 80%, 85%, 90% und 95% Sensitivität gefundene Spezifitätsunterschiede waren dagegen nicht signifikant.
  • Das erfindungsgemäße Verfahren wurde auf die Daten aus Lein et al. (2003) angewendet, wobei als Parameter die Differenz der DAC-Spezifitäten verwendet wurde.
  • Es ergab sich, basierend auf den DAC-Spezifitäten beider Marker, die Kurve aus 2 für die Differenz DAC-SPECcPSA – DAC-SPECtPSA.
  • Die beiden Abszissenachsen geben die Cut-Off-Paare an, die nach dem Kriterium gleicher Sensitivität ermittelt wurden. Ist die DAC-SPEC-Differenz > 0, so ist cPSA überlegen, ansonsten tPSA. Die Kurve (dicke Linie) ist zusammen mit ihren punktweisen 95%-Konfidenzgrenzen angegeben. Für die Darstellung wurde eine Glättung der Kurven vorgenommen.
  • Es zeigt sich, dass entsprechend der Daten Lein et al. (2003) für den tPSA-Cut-Off-Bereich von 2,5 bis 5,5 μg/L und den zugehörigen cPSA-Cut-Off-Werten im Bereich von 2–4,5 μg/L von einer verbesserten diagnostischen Güte des cPSA ausgegangen werden kann. Es wird deutlich, dass die verschiedenen, zum Teil widersprüchlichen Aussagen in der Veröffentlichung Lein et al. (2003) durch die DAC-Methode in einer Fig. zusammengefasst werden und ihre Erklärung finden.
  • Das in der 2 zusätzlich angezeigte Konfidenzintervall zeigt näherungsweise den Bereich an, in dem von einer signifikant besseren diagnostischen Güte des cPSA ausgegangen werden kann.
  • Die Ergebnisse der DAC-Methode können unter anderem dafür verwendet werden, die Festlegung von Cut-Off-Werte vorzunehmen und diese dann zu beurteilen. Es zeigt sich, dass gerade der häufig empfohlenen tPSA-Cut-Off-Wert von 4 μg/L cPSA für diagnostische Aussagen besonders geeignet ist.
  • Beispiel 2
  • Für die Patienten der in Beispiel 1 genannten Studie Lein et al. (2003) war das Alter bekannt. Für Beispiel 2 wurde das Alter in eine Auswertung entsprechend der DAC-Methode einbezogen.
  • 3 zeigt das Ergebnis. Aufgetragen ist der zu den jeweiligen Cut-Off-Paaren (Abszissenachsen) berechnete Mittelwert der cPSA-Test-Positiven (durchgezogene Linie) und tPSA-Test-positiven (gestrichelte Linie). Es ist festzustellen, dass die durch cPSA richtig positiv erkannten PCA-Patienten im Schnitt jünger sind als die mittels tPSA richtig-postiv erkannten Patienten.
  • Auf der Basis dieser 2 sind Rückschlüsse auf vorteilhafte Einsatzbedingungen der diagnostischen Marker, z.B. des cPSA bei jüngeren Patienten möglich.
  • Beispiel 3
  • Aus der Studie Keller T, Bitterlich N, Hilfenhaus S, Bigl H, Löser T, Leonhardt P (1998): Tumour markers in the diagnosis of bronchial carcinoma: new options using fuzzy logic based tumour marker profiles. J Cancer Res Clin Oncol 124: 565-574 (Keller et al. (1998)) zur Diagnostik des Bronchialkarzinoms mittels Tumormarkern wurden die Tumomarker CYFRA 21-1 und CEA unter dem Gesichtspunkt betrachtet, welcher Marker besser in der Lage ist, zwischen einem Plattenepithel- und einem Adenokarzinom zu unterscheiden. Bei der Analyse wurde zugrundegelegt, dass hohe CYFRA 21-1- Werte eher mit einem Plattenepithel- und hohe CEA-Werte eher mit einem Adeno-Karzinom assoziiert sind.
  • Die Erkennung des Adenokarzinoms wurde als „Positiv" (Plattenepithel: „negativ") gewertet. In 4 ist sind die DAC-Spezifitäten für beide Marker in Abhängigkeit von der Sensitivität angegeben, die bei der Auswahl der Cut-Off-Paare verwendet wurde.
  • Es kann davon ausgegangen werden, dass CEA besser geeignet ist, zwischen einem Plattenepithel und einem Adenokarzinom zu differenzieren als CYFRA 21-1. Dieses Vermögen ist weitgehend gleichförmig über den gesamten möglichen Bereich von möglichen Cut-Off-Paaren gegeben.
  • Beispiel 4
  • Es wurde die diagnostische Wertigkeit von CYFRA 21-1 und NSE bei der Diagnostik des Bronchialkarzinoms untersucht. In 5 ist die Differenz der DAC-Sensitivitäten für beide Marker in Abhängigkeit von der Spezifität, die bei der Auswahl der Cut-Off-Paare verwendet wurde, aufgetragen. Es ergab sich eine bessere diagnostische Wertigkeit für CYFRA 21-1 über den gesamten Bereich der möglichen Cut-Off-Paare.
  • In einer zweiten DAC-Analyse wurde untersucht, inwieweit unterschiedliche Formen des Bronchialkarzinoms (nichtkleinzelliges (NSCLC) bzw. kleinzelliges (SCLC) Bronchialkarzinom) mit dem Ergebnis der besseren diagnostischen Wertigkeit für CYFRA 21-1 zusammenhängen. Dabei wurde ein Patient mit 1 kodiert, wenn er ein SCLC hatte und mit 2 im Falle eines NSCLC.
  • In 6 sind entsprechend der DAC-Methodik die Mittelwerte dieser Kodierung für die CYFRA 21-1-Test-Positiven (durchgezogene, dicke Linie) und NSE-Test-Positiven (gestrichelte Linie) gegenüber der zu den jeweiligen Cut-Off-Paaren gehörigen Spezifität aufgetragen. Es ist festzustellen, dass die durch CYFRA 21-1 richtig positiv erkannten BCA-Patienten größtenteils NSCLC-Patienten sind, während durch NSE vorwiegend SCLC-Patienten erkannt wurden.
  • Aus dieser DAC-Analyse kann der Schluss gezogen werden, dass NSE und CYFRA 21-1 jeweils spezifisch eine Tumorart erkennen.
  • Beispiel 5
  • Die DAC-Methode wurde zur Bewertung der diagnostischen Güte eines einzelnen Tests angewendet.
  • Die diagnostische Wertigkeit des Tumormarkers NSE bei der Detektion von kleinzelligen Bronchialkarzinomen soll gegenüber der Wertigkeit von NSE bei der Detektion nichtkleinzelliger Bronchialkarzinome unter Benutzung von Daten aus der Studie Keller et al. (1998) demonstriert werden.
  • 7a zeigt Ergebnisse für NSE bei der Diagnostik des Bronchialkarzinoms bei kleinzelligen Tumoren und 7b zeigt Ergebnisse für NSE bei der Diagnostik des Bronchialkarzinoms bei nichtkleinzelligen Tumoren. Aufgetragen ist jeweils die Differenz des positiven Vorhersagewerts pVw des NSE zum positiven Vorhersagewert eines mathematisch geeignet beschriebenen Tests mit Zufallsergebnissen. Die Differenz ist zusammen mit ihrer unteren 95%-Konfidenzgrenze angegeben. Die Abszisse beschreibt die Sensitivität, die zur Ermittlung der Cut-Off-Paare verwendet wurde.
  • Es wird deutlich, dass NSE SCLC-Tumore mit besonders höher Güte ermittelt, da die pVw-Kurve in 7a deutlich höher, und über einen großen Bereich sogar bei 1 liegt.

Claims (12)

  1. Verfahren zur Ermittlung der diagnostischen Güte von diagnostischen Tests anhand von Messwerten, enthaltend die Schritte, (a) Bereitstellung von Messwerten von zwei diagnostischen Tests (Test 1 und Test 2) gemessen an Patienten mit der (positiv) und ohne die (negativ) zu diagnostizierende Erkrankung, (b) Festlegung von Cut-Off-Paaren (CO1, CO2)k nach dem Kriterium gleicher Sensitivität für die Messwerte beider Tests, (c) für jedes Cut-Off-Paar (CO1, CO2)k Auswahl aller Messwerte, die entweder i. für Test 1 oberhalb des zugehörigen Cut-Off (CO1) und für Test 2 unterhalb des zugehörigen Cut-Off (CO2) liegen, oder ii. für Test 1 unterhalb des zugehörigen Cut-Off (CO1) und für Test 2 oberhalb des zugehörigen Cut-Off (CO2) liegen, (d) für jedes Cut-Off-Paar (CO1, CO2)k und für die in (b) ausgewählten Messwerte Bestimmung der Anzahlen (rpi,k, fpi,k, rni,k, fni,k) von denjenigen Messwerte, die zu Patienten gehören, die richtig testpositiv (rpi,k), falsch testpositiv (fpi,k), richtig testnegativ (rni,k) und falsch testnegativ (fni,k) mit i = (Test1, Test2) getestet wurden, (e) Berechnung von DAC-Spezifitäten DAC-SPECi,k für beide diagnostischen Tests aus den Anzahlen (rpi,k, fpi,k, rni,k, fni,k) für jedes Cut-Off-Paar (CO1, CO2)k nach DAC-SPECi,k = rni,k/(rni,k + fpi,k).
  2. Verfahren nach Anspruch 1, gekennzeichnet dadurch, dass die DAC-Spezifitäten DAC-SPECi,k für die beiden diagnostischen Tests über den Cut-Off-Paaren (CO1, CO2)k oder den zugehörigen Sensitivitäten aufgetragen und verglichen werden
  3. Verfahren nach Anspruch 1, gekennzeichnet dadurch, dass die Festlegung von Cut-Off-Paaren (CO1, CO2)k in Schritt (b) nach dem Kriterium gleicher Spezifität für die Messwerte beider Tests erfolgt und dass in Schritt (e) die Berechnung von DAC-Sensitivitäten DAC-SENSi,k für beide diagnostischen Tests aus den Anzahlen (rpi,k, fpi,k, rni,k, fni,k) für jedes Cut-Off-Paar (CO1, CO2)k nach DAC-SENSi,k = rpi,k/(rpi,k + fni,k) erfolgt.
  4. Verfahren nach Anspruch 3, gekennzeichnet dadurch, dass die DAC-Sensitivitäten DAC-SENSi,k für die beiden diagnostischen Tests über den Cut-Off-Paaren (CO1, CO2)k oder den zugehörigen Spezifitäten aufgetragen und verglichen werden.
  5. Verfahren nach einem der Ansprüche 1 bis 4, gekennzeichnet dadurch, dass die Cut-Off-Paare in Schritt (b) nach einem Regressionsverfahren ermittelt werden.
  6. Verfahren nach einem der Ansprüche 1 bis 4, gekennzeichnet dadurch, dass die Cut-Off-Paare in Schritt (b) so ermittelt werden, dass die Auswahl der Messwerte in Schritt (c) i. und ii. zu einer gleichen Anzahl von Messwerten in den beiden Subgruppen i. und ii. führt.
  7. Verfahren nach Anspruch 1 oder 3, gekennzeichnet dadurch, dass in Schritt (e) die Berechnung der positiven Vorhersagewerte pVwi,k = rpi,k/(rpi,k + fpi,k) oder der negativen Vorhersagewerte nVwi,k = fni,k/(fni,k + rni,k) aus den Anzahlen (rpi,k, fpi,k, rni,k, fni,k) für jedes Cut-Off-Paar (CO1, CO2)k erfolgt.
  8. Verfahren nach Anspruch 7, gekennzeichnet dadurch, dass der positive Vorhersagewert pVwi,k oder der negative Vorhersagewert nVwi,k über den Cut-Off-Paaren (CO1, CO2)k oder den zugehörigen Spezifitäten oder Sensitivitäten aufgetragen wird.
  9. Verfahren nach einem der Anspruch 1, gekennzeichnet dadurch, dass in Schritt (e) aus den Anzahlen (rpi,k, fpi,k, rni,k, fni,k) für jedes Cut-Off-Paar (CO1, CO2)k andere Parameter wie Effizienz oder Youden-Index bestimmt und über den Cut-Off-Paaren (CO1, CO2)k oder den zugehörigen Spezifitäten oder Sensitivitäten aufgetragen werden.
  10. Verfahren nach Anspruch 1, gekennzeichnet dadurch, dass in Schritt (d) für jedes Cut-Off-Paar (CO1, CO2)k und für die in (c) ausgewählten Messwerte nicht die Anzahlen (rpi,k, fpi,k, rni,k, fni,k) bestimmt, sondern die Werte PE1i,k entsprechend einer oder mehrerer Patienteneigenschaften (PE) ermittelt werden, und dass in Schritt (e) aus diesen Werten statistische Kenngrößen wie Erwartungswert Ei,k oder Streuungsmaß Si,k für die Messwerte dieser Patientengruppen berechnet werden.
  11. Verfahren nach Anspruch 10, gekennzeichnet dadurch, dass die statistischen Kenngrößen über den Cut-Off-Paaren (CO1, CO2)k oder den zugehörigen Spezifitäten oder Sensitivitäten aufgetragen werden.
  12. Verfahren nach einem der Ansprüche 1 bis 11, gekennzeichnet dadurch, dass der zweite Test in Schritt (a) durch eine mathematische Beschreibung eines zufälligen Testergebnisses in der gleichen Messwertverteilung wie der des ersten Tests ersetzt wird.
DE200510004294 2005-01-28 2005-01-28 Auswahl und Bewertung diagnostischer Tests mittels Diskordanzanalysen-Charakteristik (DAC) Withdrawn DE102005004294A1 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE200510004294 DE102005004294A1 (de) 2005-01-28 2005-01-28 Auswahl und Bewertung diagnostischer Tests mittels Diskordanzanalysen-Charakteristik (DAC)
PCT/EP2006/000670 WO2006079530A1 (en) 2005-01-28 2006-01-26 Selection and evaluation of diagnostic tests by means of discordance analysis characteristics (dac)
EP06701307A EP1842139A1 (de) 2005-01-28 2006-01-26 Auswahl und bewertung von diagnoseprüfungen mittels dac (discordance analysis characteristics)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE200510004294 DE102005004294A1 (de) 2005-01-28 2005-01-28 Auswahl und Bewertung diagnostischer Tests mittels Diskordanzanalysen-Charakteristik (DAC)

Publications (1)

Publication Number Publication Date
DE102005004294A1 true DE102005004294A1 (de) 2006-08-03

Family

ID=36190578

Family Applications (1)

Application Number Title Priority Date Filing Date
DE200510004294 Withdrawn DE102005004294A1 (de) 2005-01-28 2005-01-28 Auswahl und Bewertung diagnostischer Tests mittels Diskordanzanalysen-Charakteristik (DAC)

Country Status (3)

Country Link
EP (1) EP1842139A1 (de)
DE (1) DE102005004294A1 (de)
WO (1) WO2006079530A1 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8538778B2 (en) 2008-05-15 2013-09-17 Soar Biodynamics, Ltd. Methods and systems for integrated health systems

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002213704A1 (en) * 2000-10-27 2002-05-06 Mount Sinai Hospital Method for detecting ovarian cancer based on human kallikrein 6 (HK6)
DE10143712A1 (de) * 2001-08-30 2003-04-10 Europroteome Ag Verfahren, Computersystem und Computerprogrammprodukt zur Datenauswertung
AU2003220487A1 (en) * 2002-03-19 2003-10-08 Cengent Therapeutics, Inc. Discrete bayesian analysis of data

Also Published As

Publication number Publication date
EP1842139A1 (de) 2007-10-10
WO2006079530A1 (en) 2006-08-03

Similar Documents

Publication Publication Date Title
DE69623264T2 (de) Verfahren zur diagnose gutartiger prostataerkrankungen
DE102010038014B4 (de) Verwendung spezifischer Substanzen als Marker zur Bestimmung des Risikos einer Nierenabstoßung
DE202011106093U1 (de) Kalibrationsstreifen für einen Immunoblot
WO2008145108A1 (de) Verfahren und vorrichtung zum sondemikroskopischen untersuchen einer probe
DE102010041912B3 (de) Verfahren zur Diagnose und/oder Prognose von Krebserkrankungen durch Analyse der mechanischen Eigenschaften von Tumorzellen
DE102010014684A1 (de) Neue Ansätze zur Alzheimer-Diagnose
DE10315877B4 (de) Krankheitsverlaufkontrolle
DE102005004294A1 (de) Auswahl und Bewertung diagnostischer Tests mittels Diskordanzanalysen-Charakteristik (DAC)
DE102005022156A1 (de) Verfahren und Vorrichtung zum Einstufen von Pixeln in medizinischer Bildgebung
DE3825541C2 (de) Verfahren zur Bewertung der Reststandzeit von wärmebeständigem Stahl
DE102005058332A1 (de) Verfahren zur Ermittlung der Regulationsfähigkeit biologischer Systeme
EP1751684B1 (de) Verfahren zur anwendung von auf markerwerten basierenden dichtekarten bei der diagnose von patienten mit krankheiten insbesondere von tumoren
DE102004061064A1 (de) Verfahren und Vorrichtung zur spektroskopischen Untersuchung von Körperflüssigkeiten und Gewebeproben hinsichtlich eines erhöhten Alzheimerverdachts
DE10317717B4 (de) Verfahren zur Diagnose von Erkrankungen unter Verwendung von Indikatorstoffen
EP0922266B1 (de) Verfahren zur ermittlung signifikanter abweichungen des zellenwachstums
DE112017006114T5 (de) Dna-analysevorrichtung und dna-analyseverfahren unter verwendung der terahertzwelle
EP2310864B1 (de) Verfahren zur präoperativen bestimmung des intraoperativen blutungsrisikos eines patienten
DD202600A5 (de) Verfahren zur untersuchung von zellen durch elektrophorese
EP3076333A1 (de) Analyseverfahren zur klassifikation einer testdispersion hinsichtlich des vorliegens einer sichelzellenanämie
DE102009015784A1 (de) In-vitro-Verfahren zur Diagnostik von Tumorerkrankungen
DE102021117816A1 (de) Messvorrichtung mit zwei aufeinanderfolgenden Messungen
DE19540006C1 (de) Verfahren zur Diagnose einer malignen Erkrankung oder deren Vorläuferstadien
DE19540007C1 (de) Verfahren zur Diagnose maligner Erkrankungen oder deren Vorläuferstadien
DE102013106254A1 (de) Biomarker
EP3170154A1 (de) Verfahren und vorrichtung zur fitnessprüfung von wertdokumenten

Legal Events

Date Code Title Description
8127 New person/name/address of the applicant

Owner name: SIEMENS HEALTHCARE DIAGNOSTICS GMBH, 65760 ESC, DE

R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee

Effective date: 20110802