DE602005000834T2 - Verfahren zur Feststellung von falschen Signalen in einem DNA-Chip sowie System zur Verwendung derselben - Google Patents

Verfahren zur Feststellung von falschen Signalen in einem DNA-Chip sowie System zur Verwendung derselben Download PDF

Info

Publication number
DE602005000834T2
DE602005000834T2 DE602005000834T DE602005000834T DE602005000834T2 DE 602005000834 T2 DE602005000834 T2 DE 602005000834T2 DE 602005000834 T DE602005000834 T DE 602005000834T DE 602005000834 T DE602005000834 T DE 602005000834T DE 602005000834 T2 DE602005000834 T2 DE 602005000834T2
Authority
DE
Germany
Prior art keywords
intensity
signal
difference
variances
foreground
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE602005000834T
Other languages
English (en)
Other versions
DE602005000834D1 (de
Inventor
Ji-Young Oh
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of DE602005000834D1 publication Critical patent/DE602005000834D1/de
Application granted granted Critical
Publication of DE602005000834T2 publication Critical patent/DE602005000834T2/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B22CASTING; POWDER METALLURGY
    • B22DCASTING OF METALS; CASTING OF OTHER SUBSTANCES BY THE SAME PROCESSES OR DEVICES
    • B22D17/00Pressure die casting or injection die casting, i.e. casting in which the metal is forced into a mould under high pressure
    • B22D17/20Accessories: Details
    • B22D17/2015Means for forcing the molten metal into the die
    • B22D17/203Injection pistons
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B22CASTING; POWDER METALLURGY
    • B22DCASTING OF METALS; CASTING OF OTHER SUBSTANCES BY THE SAME PROCESSES OR DEVICES
    • B22D17/00Pressure die casting or injection die casting, i.e. casting in which the metal is forced into a mould under high pressure
    • B22D17/20Accessories: Details
    • B22D17/2007Methods or apparatus for cleaning or lubricating moulds

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Mechanical Engineering (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

  • HINTERGRUND DER ERFINDUNG
  • 1. Gebiet der Erfindung
  • Die vorliegende Erfindung betrifft ein Verfahren zum Nachweis von Fehler-Signalen (error spots) und ein System unter Verwendung des Verfahrens und genauer gesagt ein Verfahren zum Nachweis eines fehlerhaften Signals durch Quantifizieren von DNA-Chips sowie ein System, welches dieses Verfahren einsetzt.
  • 2. Beschreibung von verwandtem Stand der Technik
  • DNA-Chips wurden hergestellt unter Verwendung von molekularbiologischen Technologien und neu entwickelten mechanischen und elektronischen Ingenieur-Technologien. DNA-Chips sind Chips, in welchen mehrere Hundert bis hin zu mehrere Hunderttausend an DNAs auf einem sehr kleinen Raum unter Verwendung einer mechanischen Automation und elektronischen Steuertechnologien integriert werden. Das heißt, DNA-Chips sind Chips, an welche viele Typen von DNAs mit hoher Dichte zum Nachweis von Genen angebunden werden. DNA-Chips können die konventionellen genetischen Ingenieurs-Technologien, wie z.B. Southern Blotting und Northern Blotting, Mutantennachweis und DNA-Sequenzierung ersetzen.
  • DNA-Chips werden in vier Gruppen klassifiziert, abhängend von Herstell-Verfahren; Pin-Microarray-Chips, hergestellt durch Micro Dotting (Oberflächenkontakt) unter Verwendung eines Pins, Inkjet-Chips, hergestellt durch Mikroabscheidng unter Verwendung einer Tintenstrahltechnologie, fotolitographische Chips sowie Elektronik-Array-Chips.
  • 1 ist ein Flussdiagramm, welches ein konventionelles Verfahren zum Analysieren von Genen illustriert unter Verwendung eines DNA-Chips.
  • Unter Bezugnahme auf 1 wird eine Probenpräparation durchgeführt zum Nehmen einer Probe, d.h. eines Gens, welches analysiert werden soll (Operation (S100)). In der Proben-Präparation werden reine Gene, welche analysiert werden sollen, aus einer biologischen Probe extrahiert, beispielsweise aus Blut.
  • Als nächstes werden Gene extrahiert über Probenpräparation auf eine analysierbare Ebene amplifiziert (Operation (S110)). Die Amplifikations-Operation wird im Allgemeinen durchgeführt durch eine Polymerasekettenreaktion (PCR).
  • Als nächstes werden die amplifizierten Gene, welche Target-Proben sind, in dem DNA-Chip hybridisiert (Operation (S120)). In der Hybridisierungs-Operation wird die Target-Probe, welche getestet werden soll, mit Oligo-Sonden zur Reaktion gebracht, welche Information an Genen aufweisen, und auf dem Chip immobilisiert. Folglich wird die Target-Probe mit einer Oligo-Sonden hybridisiert, welche eine komplementäre Sequenz aufweist.
  • Als nächstes wird eine nicht hybridisierte Target-Probe, welche auf dem Chip verbleibt, abgewaschen (Operation (S130)). Als nächstes wird das Bild des Chips durch einen Scanner eingescannt, um den Grad der Hybridisierung der Target-Probe mit der Oligo-Sonde nachzuweisen (Operation S140)). Als nächstes wird das gescannte Bild für eine statistische Analyse quantifiziert (Operation (S150)).
  • Nach Quantifizieren des Bildes des DNA-Chips wird eine statistische Analyse durchgeführt unter Verwendung verschiedener Algorithmen und der quantifizierte Wert eines jeden Signals (spots) auf dem Chip wird analysiert, um zu unterscheiden, ob die Target-Probe von einer kranken Person oder einer normalen Person stammt (Operation (S160)).
  • Wie in 1 illustriert ist, umfasst das konventionelle Verfahren zum Analysieren von Genen eine Serie von sieben zusammenhängenden Operationen. Während den Experimenten zwischen der ersten Operation und der fünften Operation (Operation (S100 bis S140)) werden verschiedene Fehlerfaktoren und folglich verschiedene Typen an Fehler-Signalen (spots) erzeugt. Falls die Quantifikations-Operation durchgeführt wird, basierend auf falscher Information aufgrund der Fehler und die statistische Analyse durchgeführt wird unter Verwendung dieser quantifizierten falschen Daten, können die falschen Signal-Daten die Verlässlichkeit der Analyse reduzieren und die Möglichkeit, eine kranke Person zu identifizieren, limitieren.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die vorliegende Erfindung stellt ein Verfahren zur Verfügung des Nachweisens eines fehlerhaften Signals, welches die Verlässlichkeit in einer statistischen Analyse erhöht durch Nachweis des fehlerhaften Signals in einem DNA-Chip und Ausschluss des nachgewiesenen fehlerhaften Signals in der statistischen Analyse sowie ein System unter Verwendung dieses Verfahrens.
  • Die vorliegende Erfindung stellt auch ein computerlesbares Aufzeichnungs-Medium zur Verfügung, welches darin aufgezeichnet ein Computerprogramm aufweist zum Durchführen eines Verfahrens zum Nachweis eines fehlerhaften Signals in einem Computer, wobei das Verfahren die Verlässlichkeit einer statistischen Analyse erhöht durch Nachweis des fehlerhaften Signals in einem DNA-Chip und Ausschließen des nachgewiesenen fehlerhaften Signals in der statistischen Analyse.
  • Gemäß einem Aspekt der vorliegenden Erfindung wird ein Verfahren bereitgestellt zum Nachweis eines fehlerhaften Signals, umfassend die Operationen von: Analysieren eines Unterschiedes in den Varianzen für eine Hintergrund-Intensität und einer Vordergrund-Intensität für jedes Signal in einem DNA-Chip; Verifizieren, falls ein Mittelwert des Hintergrund-Signals und ein Mittelwert des Vordergrund-Signals signifikant voneinander unterschiedlich sind, basierend auf Unterschieden in den Varianzen; und Bewerten eines fehlerhaften Signals basierend auf den Ergebnissen der verifizierenden Operation.
  • Gemäß eines weiteren Aspekts der vorliegenden Erfindung wird ein System bereitgestellt zum Nachweis eines fehlerhaften Signals, umfassend: einen Varianz-Analyse-Teil zum Analysieren eines Unterschiedes in den Varianzen für die Hintergrund-Intensität und die Vordergrund-Intensität für jedes Signal in einem DNA-Chip; einen Mittelwert verifizierenden Teil zum Verifizieren, ob ein Mittelwert der Hintergrund-Intensität und ein Mittelwert der Vordergrund-Intensität signifikant unterschiedlich voneinander sind, basierend auf den Unterschieden in den Varianzen; und einen bewertenden Teil, welcher ein fehlerhaftes Signal bewertet zum Bewerten eines fehlerhaften Signals, basierend auf den Ergebnissen der verifizierenden Operation.
  • Gemäß noch einem weiteren Aspekt der vorliegenden Erfindung wird ein computerlesbares Aufzeichnungsmedium bereitgestellt, auf welchem ein Computerprogramm gespei chert ist, zum Durchführen eines Verfahrens zum Nachweis eines fehlerhaften Signals in einem Computer, wobei das Verfahren die folgenden Operationen umfasst: Analysieren eines Unterschiedes in den Varianzen für eine Hintergrund-Intensität und eine Vordergrund-Intensität für jedes Signal in einem DNA-Chip; Verifizieren, ob ein Mittelwert der Hintergrund-Intensität und ein Mittelwert der Vordergrund-Intensität signifikant voneinander unterschiedlich sind, basierend auf dem Unterschied in den Varianzen; und Auswerten eines fehlerhaften Signals, basierend auf den Ergebnissen der verifizierenden Operation.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Die dargelegten und weitere Merkmale und Vorteile der vorliegenden Erfindung werden mehr offensichtlich werden durch detaillierte Beschreibung von exemplarischen Ausführungsformen davon unter Verweis auf die beigefügten Abbildungen, in welchen:
  • 1 ein Flussdiagramm ist, welches ein konventionelles Verfahren illustriert zum Analysieren von Genen unter Verwendung eines DNA-Chips;
  • 2 ein Flussdiagramm ist, welches eine bildverarbeitende Prozedur für einen DNA-Chip illustriert;
  • 3 ein Diagramm ist, welches das Bildscannen eines DNA-Chips illustriert;
  • 4 ein Diagramm ist, welches Fehler illustriert, erzeugt während der Analyse eines DNA-Chips und Typen an Scan-Fehlern, korrespondierend mit den Fehlern erzeugt während der Analyse des DNA-Chips;
  • 5 ein Diagramm ist, welches die Ergebnisse illustriert, erzeugt aus den Typen an Scan-Fehlern in 4;
  • 6A eine grafische Darstellung ist, welche die Beziehung illustriert zwischen einer Signalgröße und einer Signalintensität;
  • 6B ein Graph ist, der das Verhältnis zwischen einer Signalintensität und einer Standardabweichung illustriert;
  • 7A und 7B Diagramme sind, welche die Eingabendaten illustrieren, verwendet in einem Verfahren zum Nachweis eines fehlerhaften Signals gemäß einer Ausführungsform der vorliegenden Erfindung;
  • 8 ein Flussdiagramm ist, welches ein Verfahren illustriert zum Nachweis eines fehlerhaften Signals gemäß einer Ausführungsform der vorliegenden Erfindung;
  • 9 ein Blockdiagramm ist, welches ein System illustriert zum Nachweis eines fehlerhaften Signals gemäß einer weiteren Ausführungsform der vorliegenden Erfindung;
  • 10 und 11 Diagramme sind, illustrierend das Verhältnis und den Typ an Fehler-Punkten, nachgewiesen in jedem DNA-Chip; und
  • 12 ein Diagramm ist, illustrierend eine Veränderung von Robust M, verursacht durch Ausschluss von fehlerhaften Signalen.
  • DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
  • 2 ist ein Flussdiagramm, illustrierend eine bildverarbeitende Prozedur eines DNA-Chips und 3 ist ein Diagramm, illustrierend ein Bild-Scannen eines DNA-Chips.
  • Im Allgemeinen schließt die bildverarbeitende Prozedur eines DNA-Chips eine Scan-Operation und eine Quantifizierungs-Operation ein. Die Scan-Operation und die Quantifizierungs-Operation sind eng miteinander verwandt. Werte, erhalten aus der Quantifizierungs-Operation verändern sich, abhängend von einem Scan-Verfahren.
  • Unter Verweis auf 2 und 3 wird das Adressieren einer Stelle und einer Form in jedem Signal in dem DNA-Chips durchgeführt, sowie das Abtasten einer Region, welche gelesen werden soll (Operation (S200)).
  • Als nächstes wird eine Segmentation durchgeführt (Operation (210)), in welcher Pixel, welche zu einer Hintergrund-Region gehören (310), sowie Pixel, welche zu einer Vorder grund-Region gehören (320) in den adressierten Signalen segmentiert werden. Verschiedene Verfahren wurden vorgeschlagen, um den Vordergrund (320) und den Hintergrund (310) zu segmentieren. Repräsentative Verfahren schließen die fixierte Kreis-Annahme und die adaptierte Kreis-Annahme ein.
  • Das fixierte Kreis-Annahme-Verfahren segmentiert einen Hintergrund und einen Vordergrund durch Auftragen identischer Kreise für jedes Signal unter der Annahme, dass alle Punktsignale die gleiche Größe und Form aufweisen. Die adaptierte Kreis-Annahme trägt eine Form eines Signals durch Verknüpfen von Pixeln auf mit einer Intensität, welche merklich von benachbarten Pixeln unterschiedlich ist, durch Berücksichtigung, dass ein jedes Signal eine unterschiedliche Form und eine unterschiedliche Größe aufweisen kann.
  • Nach Segmentieren des Hintergrundes und des Vordergrundes (Operation (S210)), wird ein Mittelwert der Intensität für jedes Pixel in dem Hintergrund bzw. dem Vordergrund ausgelesen und die Mittelwerte werden summiert und dann durch die Anzahl von Pixeln dividiert, um einen Mittelwert der Intensität für den Hintergrund bzw. den Vordergrund zu erhalten. Darüber hinaus wird eine Standardabweichung für den Hintergrund bzw. den Vordergrund erhalten, basierend auf den Mittelwerten der Intensität für ein jedes Pixel.
  • Auch werden verschiedene Verfahren des Quantifizierens einer Intensität durch Scannen des Signals offenbart. Repräsentative quantifizierende Verfahren schließen ein Verfahren unter Verwendung einer Standardabweichung eines Hintergrundes, ein Verfahren unter Verwendung einer gerasterten Fläche und ein Verfahren unter Verwendung eines Zentrums-Punktes ein.
  • Das Verfahren unter Verwendung einer Standardabweichung eines Hintergrundes wird durchgeführt, basierend auf der Prozentzahl an Pixeln in einem Vordergrund, einer mittleren Intensität für jedes Pixel, welche größer ist als eine mittlere Intensität für einen Hintergrund, und zu der ein oder zweimal dessen Standard-Abweichung zugezählt wird. Dieses Verfahren ist sensitiv für die Standard-Abweichung der Intensität. Jedoch ist es schwierig, einen kritischen Wert des Prozentsatzes zu bestimmen, und einen Fehler beim Abgleich sowie eine Signal-Form zu diskriminieren.
  • Das Verfahren unter Verwendung von Signal-Intensitäts-Flächen diskriminiert ein fehlerhaftes Signal durch Vergleich der Fläche eines Vordergrundes mit der Fläche der abgerasterten Region in dem Signal.
    Signalform QC-Trefferzahl = (Signalfläche = pR2/2pR)/(Signalumgebung = R/2)
    Falls die QC-Trefferzahl ≤ R/2, wird das Signal als ein fehlerhaftes Signal betrachtet
  • Das heißt, als ein Ergebnis des oben dargestellten Vergleichs von Flächen wird, falls die Fläche des Vordergrundes weniger als R/2 ist, das Signal als ein fehlerhaftes Signal betrachtet. Jedoch kann dieses Verfahren nicht Fehler unterscheiden, wie z.B. Intensitätsfehler, Signal-Verbreiterung, Uneinheitlichkeit eines Hintergrundes und dergleichen.
  • Das Verfahren unter Verwendung des Zentrums-Punktes eines Signals umfasst den Vergleich der Unterschiede zwischen dem Zentrums-Punkt eines Signals, welches in einem immobilisierten Zustand abgetastet wurde und dem Zentrums-Punkt eines Signals, welches in einem flexiblen Zustand abgetastet wurde, und das Klassifizieren von Signalen mit einem merklichen Unterschied als fehlerhafte Signale. Jedoch kann dieses Verfahren nicht die Fehler unterscheiden, wie z.B. Intensitäts-Fehler, Signal-Verbreiterung und dergleichen.
  • 4 ist ein Diagramm, welches Fehler illustriert, erzeugt während der Analyse eines DNA-Chips und die Typen an Scan-Fehlern, korrespodierend zu den Fehlern, erzeugt während des Analysierens des DNA-Chips.
  • Bezieht man sich auf 4, so schließen die Fehler (400), erzeugt während der Analyse eines DNA-Chips folgendes ein: (1) geringe DNA-Menge in dem Signal, (2) Reinheit an DNA, (3) Anbindung an Glas, (4) unpassende Hybridisierung, (5) suboptimales Labeln, (6) sekundäre Target-Strukturen, (7) Array-Oberflächen, (8) dreckige Pins, (9) das Flüssigkeitsvolumen von Abscheidungen, (10) zerkratzte Oberflächen, (11) ungleichmäßiges Coaten, (12) Ausbluten und dergleichen.
  • Die Typen der korrespondierenden Intensitäts-Fehler, erzeugt aus den Fehlern (400) schließen ein (1) Signalintensität, (2) Signalgröße, (3) Signalmorphologie, (4) Abgleichfehler, (5) Ausbluten, (6) Hintergrundintensität, (7) Hintergrundrauschen und dergleichen.
  • 5 ist ein Diagramm, welches die Ergebnisse illustriert, resultierend aus den Typen an Scan-Fehlern wie in 4 illustriert.
  • Bezieht man sich auf 5, so rührt die Intensitätsvariation aus den Fehlern der Intensitätsgröße, Intensitätsmorphologie, aus Abgleichfehlern, Ausbluten und Hintergrundrauschen her. Geringe Intensität resultiert aus den Fehlern der Signalgröße, der Signalmorphologie, aus Abgleichfehlern und Ausbluten. Darüber hinaus resultiert gesättigte Intensität aus den Fehlern der Signalgröße, der Signalmorphologie und Ausbluten.
  • Folglich werden als ein Ergebnis des Analysierens der Beziehung zwischen den Fehlertypen in dem DNA-Chips und den Ergebnissen davon, die Fehlertypen als Signale klassifiziert, welche (1) geringe Intensität zeigen, (2) Intensitätsvariation im Vordergrund und im Hintergrund zeigen oder (3) gesättigte Intensität zeigen.
  • 6A ist ein Graph, welcher die Beziehung zwischen einer Signalgröße und einer Signalintensität zeigt, und 6B ist ein Graph, welcher die Beziehung zwischen einer Intensität eines Signals und dessen Standardabweichung zeigt.
  • Bezieht man sich auf 6B, ist das statistische Ergebnis, dass, wenn die Abweichung der Intensität höher ist, die Wahrscheinlichkeit, dass die Intensität gering ist, höher ist.
  • 7A und 7B sind Diagramme, welche Beispiele zeigen von Eingabe-Daten, verwendet in einem Verfahren des Nachweises eines fehlerhaften Lichtsignals gemäß einer Ausführungsform der vorliegenden Erfindung.
  • Bezieht man sich auf 7A und 7B werden die Signale (700) in den Vordergrund (720) und in den Hintergrund (710) segmentiert. Anschließend wird ein im Vordergrund-Mittelwert (770) erhalten durch Dividieren eines Mittelwerts der Intensität eines jeden Pixels, umfassend den Vordergrund (720) durch die Vordergrundpixelanzahl (780). Außerdem wird eine Vordergrund-Standardabweichung (775) aus dem Vordergrund-Mittelwert (770) erhalten. Auch ein Hintergrund-Mittelwert (775) wird erhalten durch Dividieren eines Mittelwertes der Intensität eines jeden Pixels, umfassend den Hintergrund (710) durch die Anzahl der Pixel des Hintergrundes (765). Und eine Hintergrund-Standardabweichung (760) wird aus dem Hintergrund-Mittelwert (775) erhalten.
  • Folglich bestehen die Eingabedaten (750), verwendet in einem Verfahren zum Nachweis eines fehlerhaften Signals gemäß einer Ausführungsform der vorliegenden Erfindung aus dem Mittelwert (770) und der Standardabweichung (775) für die Vordergrund-Intensität und die Vordergrund-Pixel-Anzahl (780) sowie dem Mittelwert (755) und der Standardabweichung (760) für die Hintergrund-Intensität und die Hintergrund-Pixel-Anzahl (765).
  • Es gibt viele Programme zum Quantifizieren der Signalintensität des DNA-Chips, wobei jedes Programm einen Mittelwert, eine Standardabweichung und die Pixelzahl für den Hintergrund bzw. den Vordergrund als ein Ergebnis der Quantifizierung zeigt. Folglich können, falls die Quantifizierung unter Verwendung eines konventionellen Programmes möglich ist, Variablen, notwendig zum Durchführen einer Ausführungsform der vorliegenden Erfindung aus der Daten-Ausgabe als ein Ergebnis der Quantifizierung extrahiert werden. Im Allgemeinen gibt das Quantifizierungs-Programm Dateien mit einer GPR-Datei-Extension aus.
  • 8 ist ein Flussdiagramm, welches ein Verfahren zum Nachweis eines fehlerhaften Signals gemäß einer Ausführungsform der vorliegenden Erfindung illustriert.
  • Bezieht man sich auf 8, so erzeugt das Quantifizierungs-Programm eine Ausgabedatei, einschließend einen entsprechenden Mittelwert, eine Standardabweichung sowie die Pixelzahl für die Vordergrund-Intensität und die Hintergrund-Intensität des Signals. Ein konventionelles Quantifizierungs-Programm kann in dieser Ausführungsform der vorliegenden Erfindung verwendet werden.
  • Das Ausgabe-File wird einem Durchforsten unterzogen, um die Eingabedaten, bestehend aus dem entsprechenden Mittelwert der Standardabweichung sowie der Pixelzahl für die Vordergrund-Intensität und die Hintergrund-Intensität des Signals zu extrahieren, welche notwendig sind für die vorliegende Erfindung aus der Ausgabe-Datei.
  • Anschließend wird der Unterschied in den Varianzen analysiert unter Verwendung der Standardabweichung für jede Vordergrund-Intensität bzw. jede Hintergrund-Intensität (Operation (S805)). Der f-Test wird verwendet zum Analysieren des Unterschiedes in den Varianzen. Der f-Test wird verwendet, um zu verifizieren, ob Varianzen von zwei Gruppen signifikant voneinander unterschiedlich sind.
  • Nach Vervollständigung der Analyse (Operation (S805)) wird eine Verifizierungs-Operation durchgeführt, um zu etablieren, ob der Mittelwert der Hintergrund-Intensität und der Mittelwert der Vordergrund-Intensität signifikant voneinander unterschiedlich sind, basierend auf dem Unterschied in den Varianzen (Operationen (S810–S815)). Falls die Ergebnisse der Unterschiede in den Varianzen, erhalten durch den f-Test, signifikant sind, wird ein gepoolter t-Test durchgeführt zum Verifizieren der Mittelwerte. Im Gegensatz dazu wird, falls die Ergebnisse des Unterschiedes in den Varianzen, erhalten aus dem f-Test, nicht signifikant sind, ein nicht-gepoolter t-Test durchgeführt zum Verifizieren der Mittelwerte. Beispielsweise wird der resultierende Wert von zumindest 0,05 in dem f-Test als signifikant ausgewertet und der resultierende Wert von nicht mehr als 0,05 in dem f-Test wird als nicht signifikant ausgewertet. Der Wert von 0,05, welcher als ein Kriterium zum Etablieren der Signifikanz verwendet wird, kann in gewisser Weise verändert werden, abhängend von den Ergebnissen der statistischen Resultate.
  • Der t-Test wird eingesetzt, um zu verifizieren, ob Mittelwerte von zwei Gruppen signifikant unterschiedlich sind oder nicht.
  • Figure 00100001
  • In Gleichung 1 repräsentiert t einen Unterschied zwischen den Mittelwerten (μγ1, μγ2) der beiden Gruppen in einem gepoolten t-Test, welcher verwendet wird, wenn die beiden Gruppen einen ähnlichen Typ der Abweichung aufweisen.
  • Gleichung 2
    Figure 00110001
  • Gleichung 3
    Figure 00110002
  • In Gleichung 2 repräsentiert t einen signifikanten Unterschied zwischen dem Mittelwert der beiden Gruppen in einem nicht gepoolten t-Test und in Gleichung 3 repräsentiert df den Freiheitsgrad. Falls eine Varianz zwischen den beiden Gruppen hoch ist, ist der Freiheitsgrad erhöht und dann wird der Unterschied zwischen den Mittelwerten analysiert. Folglich ist ein signifikanter Unterschied zwischen den Mittelwerten durch die Differenz in den Varianzen beeinflusst.
  • Nach Durchführen des gepoolten t-Tests oder des nicht gepoolten t-Tests, abhängend vom Unterschied in den Varianzen wird ein p-Wert berechnet, basierend auf dem Ergebnis des gepoolten oder nicht gepoolten t-Tests (Operation (S825)). Falls der p-Wert bei einem signifikanten Niveau liegt, wird ein gemessenes Signal als ein fehlerhaftes Signal beurteilt (Operation (S835)). Beispielsweise wird, falls der p-Wert zumindest 0,05 ist, der p-Wert als auf einem signifikant unterschiedlichen Niveau beurteilt und das nachgewiesene Signal wird als fehlerhaftes Signal klassifiziert. Der Wert von 0,05, welcher als ein Kriterium für die Beurteilung des signifikanten Niveaus eingesetzt wird, kann in gewisser Weise verändert werden, abhängend von den Ergebnissen der statistischen experimentellen Resultate.
  • 9 ist ein Blockdiagramm, illustrierend ein System zum Nachweis eines fehlerhaften Signals gemäß einer Ausführungsform der vorliegenden Erfindung.
  • Bezieht man sich auf 9, so besteht das System zum Nachweis eines fehlerhaften Signals aus einem Daten-Eingabeteil (900), einen Varianz-Analyse-Teil (910), einem Mittelwert verifizierenden Teil (920) und einem das fehlerhafte Signal beurteilenden Teil (930). Der den Mittelwert verifizierende Teil (920) besteht aus einem gepoolten t-Test-Teil (922) und einem nicht gepoolten t-Test Teil (924), welche korrespondierend mit dem Unterschied in den Varianzen arbeiten.
  • Der Dateneingabe-Teil (900) empfängt eine Datei, einschließend die Ergebnisse der Quantifizierungs-Operation. Darüber hinaus extrahiert der Dateneingabe-Teil (900) Eingabedaten, welche notwendig sind, um ein fehlerhaftes Signal aus der Datei nachzuweisen. In einer Ausführungsform der vorliegenden Erfindung werden, da das Analysieren von Varianzen und das Verifizieren von Mittelwerten durchgeführt wird, um das fehlerhafte Signal nachzuweisen, der entsprechende Mittelwert, die Standardabweichung und die Pixelzahl für die Hintergrund-Intensität wie auch die Vordergrund-Intensität extrahiert, um die Eingabe Daten aus der Datei zu erhalten.
  • In dem Varianz-Analyseteil (910) wird die Analyse des Unterschiedes in den Varianzen für die Hintergrund-Intensität und die Vordergrund-Intensität durchgeführt, basierend auf einer Standardabweichung der Eingabedaten, extrahiert in dem Dateneingabe-Teil (900). Die Analyse der Varianz wird durchgeführt unter Verwendung des f-Tests.
  • In dem den Mittelwert verifizierenden Teil (920) wird das Verifizieren durchgeführt, ob der Mittelwert der Hintergrund-Intensität und der Mittelwert der Vordergrund-Intensität signifikant voneinander unterschiedlich sind, basierend auf dem Unterschied in den Varianzen in dem Varianz-Analyse-Teil (910). Die Verifikation wird durchgeführt unter Verwendung des t-Tests. Der Varianz-Analyse-Teil (920) kann den gepoolten t-Test in einem gepoolten t-Test-Teil (922) durchführen, oder den nicht gepoolten t-Test in einem nicht gepoolten t-Test-Teil (924), abhängend vom Unterschied in den Varianzen.
  • Beispielsweise wird, falls der resultierende Wert in dem f-Test zumindest 0,05 beträgt, der Unterschied in den Varianzen als eine Signifikanz aufweisend beurteilt, und der nicht gepoolte t-Test wird durchgeführt. Falls der resultierende Wert in dem f-Test nicht mehr als 0,05 beträgt, wird der gepoolte t-Test durchgeführt.
  • In dem das fehlerhafte Signal beurteilenden Teil (930) wird der p-Wert berechnet, basierend auf den Ergebnissen in dem den Mittelwert verifizierenden Abschnitt (920) und eine Beurteilung für ein fehlerhaftes Signal wird durchgeführt, basierend auf dem p-Wert. Bei spielsweise, falls der p-Wert zumindest 0,05 ist, wird das nachgewiesene Signal als ein fehlerhaftes Signal klassifiziert.
  • 10 und 11 sind Diagramme, welche das Verhältnis und den Typ der fehlerhaften Signale, nachgewiesen in jedem DNA-Chip illustrieren.
  • Bezieht man sich auf 10, so werden 0,7 bis 8,23% der Signale als fehlerhafte Signale nachgewiesen. Als ein Ergebnis des Analysierens der Daten, nachgewiesen als fehlerhafte Signale, können, während in den meisten fehlerhaften Signalen die Standardabweichung der Vordergrund-Intensität (fsd, foreground intensity) und die Standardabweichung der Hintergrund-Intensität (bsd, background intensity) hoch sind und die Vordergrund-Intensität (fmd, foreground intensity) und die Hintergrund-Intensität (bmd, background intensity) niedrig sind, einige Signale mit einer hohen Standardabweichung der Intensität nachgewiesen werden als fehlerhafte Signale, sogar obwohl ihre Intensitäten größer als 10000 sind.
  • 12 ist ein Diagramm, welches eine Veränderung von Robust M, verursacht durch Ausschluss der fehlerhaften Signale, illustriert.
  • Bezieht man sich auf 12, so ist mit Blick auf die Veränderung von Robust M, die Differenz nicht größer als ungefähr 2,5. Dies ist eine große Differenz, berücksichtigt man, dass, falls die Differenz zumindest 1 in der Analyse ist, die Kernel-Diskriminierung der Differenz sich großartig verändert. Folglich kann die Verlässlichkeit der Ergebnisse erhöht werden.
  • Die Erfindung kann auch durchgeführt werden in Form von computerlesbaren Codes auf einem computerlesbaren Aufzeichnungsmedium. Das computerlesbare Aufzeichnungsmedium ist irgendein Datenträger, der Daten speichern kann, welche danach durch ein Computersystem gelesen werden kann. Beispiel von computerlesbaren Aufzeichnungsmedium schließen Read-Only Memory (ROM), Random-Access Memory (RAM), CD-ROMS, Magnetbänder, Disketten, optischen Datenträger und Trägerwellen (beispielsweise Datenübertragung durch das Internet ein. Das computerlesbare Aufzeichnungsmedium kann auch über ein Netzwerk verteilt werden, gekoppelt an Computersysteme, so dass der computerlesbare Code gespeichert und durchgeführt werden kann in einer vernetzten Art und Weise.
  • Gemäß einer Ausführungsform der vorliegenden Erfindung werden Signale mit hoher Differenz in der Varianz für die Vordergrund-Intensität und die Hintergrund-Intensität als fehlerhafte Signale nachgewiesen (beispielsweise Signale mit geringer Intensität resultierend von kleiner Signal-Größe oder inkorrektem Abgleich oder Signale mit teilweise gesättigter Intensität) und ausgeschlossen und folglich können in der nachfolgenden statistischen Analyse Fehler beim Diskriminieren einer Probe von einer normalen Person und einer Probe von einem Patienten vermindert werden. Mit anderen Worten kann die Verlässlichkeit in der statistischen Analyse erhöht werden.

Claims (15)

  1. Ein Verfahren zum Nachweis eines fehlerhaften Signals umfassend die Operationen von: Analysieren eines Unterschieds in den Varianzen für eine Hintergrund-Intensität und eine Vordergrund-Intensität für jedes Signal in einem DNA-Chip; Verifizieren, ob ein Mittelwert der Hintergrund-Intensität und ein Mittelwert der Vordergrund-Intensität signifikant voneinander unterschiedlich sind, basierend auf dem Unterschied in den Varianzen; und Beurteilen eines fehlerhaften Signals basierend auf den Ergebnissen der verifizierenden Operation.
  2. Das Verfahren gemäß Anspruch 1, wobei die Operation des Analysierens des Unterschiedes in den Varianzen das Durchführen eines f-Tests basierend auf jeder Standardabweichung der Hintergrund-Intensität und der Vordergrund-Intensität umfasst.
  3. Das Verfahren gemäß Anspruch 1, wobei die Operation des Verifizierens der Mittelwerte das Durchführen eines gepoolten t-Tests oder eines nicht-gepoolten t-Tests umfasst, basierend auf dem Unterschied in den Varianzen.
  4. Das Verfahren gemäß Anspruch 1 oder 3, wobei die Operation des Verifizierens der Mittelwerte das Erhöhen der Freiheitsgrade umfasst, falls der Unterschied in den Varianzen hoch ist.
  5. Das Verfahren gemäß Anspruch 1, wobei die Operation des Beurteilens eines fehlerhaften Signals auf einem p-Wert basiert, berechnet aus den Ergebnissen der Operation des Verifizierens des signifikanten Unterschiedes der Mittelwerte.
  6. Das Verfahren gemäß Anspruch 5, wobei in der Operation des Beurteilens des fehlerhaften Signals ein Signal als das fehlerhafte Signal bewertet wird, falls der p-Wert zumindest 0,05 ist.
  7. Das Verfahren gemäß Anspruch 1, desweiteren umfassend die Operation des Empfangens von Resultaten-Dateien, erzeugt aus einem Quantifizierungs-Prozess und das Analysieren der resultierenden Dateien, um Eingabedaten zu extrahieren, welche notwendig sind, in den Operationen des Analysierens des Unterschiedes in den Varianzen sowie beim Verifizieren der Mittelwerte.
  8. Das Verfahren gemäß Anspruch 7, wobei die Eingabedaten einen ersten Mittelwert und eine erste Standardabweichung der Hintergrund-Intensität einschließen, die Anzahl der Pixel in dem Hintergrund, einen zweiten Mittelwert und eine zweite Standardabweichung der Vordergrund-Intensität sowie die Anzahl der Pixel in dem Vordergrund.
  9. Ein System zum Nachweis eines fehlerhaften Signals umfassend: einen Varianz-Analyse-Teil zum Analysieren eines Unterschiedes in den Varianzen für eine Hintergrund-Intensität und eine Vordergrund-Intensität für jedes Signal in einem DNA-Chip; einen Mittelwert verifizierenden Teil zum Verifizieren, ob ein Mittelwert der Hintergrund-Intensität und ein Mittelwert der Vordergrund-Intensität signifikant voneinander unterschiedlich sind, basierend auf dem Unterschied in den Varianzen; und einen das fehlerhafte Signal beurteilenden Teil zum Auswerten eines fehlerhaften Signals basierend auf den Ergebnissen der verifizierenden Operation.
  10. Das System gemäß Anspruch 9, desweiteren umfassend einen Daten-Eingabe-Teil zum Entgegennehmen von resultierenden Dateien, erzeugt aus einem Quantifizierungs-Prozess und Analysieren der resultierenden Dateien, um Eingabedaten zu extrahieren, welche notwendig sind, in den Operationen des Analysierens des Unterschiedes in den Varianzen und des Verifizierens der Mittelwerte.
  11. Das System gemäß Anspruch 10, wobei die Eingabedaten einen ersten Mittelwert und eine erste Standardabweichung der Hintergrund-Intensität einschließen, die Anzahl der Pixel in dem Hintergrund, einen zweiten Mittelwert und eine zweite Standardabweichung der Vordergrund-Intensität und die Anzahl der Pixel in dem Vordergrund.
  12. Das System gemäß Anspruch 9, wobei der Varianz-Analyse-Teil den Unterschied in den Varianzen analysiert durch Durchführen eines f-Tests, basierend auf jeder Standardabweichung der Hintergrund-Intensität und der Vordergrund-Intensität.
  13. Das System gemäß Anspruch 9, wobei der Mittelwert verifizierende Teil den signifikanten Unterschied der Mittelwerte verifiziert durch Durchführen eines gepoolten t-Tests oder eines nicht gepoolten t-Tests, basierend auf den Unterschieden in Varianzen.
  14. Das System gemäß Anspruch 9, wobei der das fehlerhafte Signal beurteilende Teil das fehlerhafte Signal beurteilt, basierend auf einem p-Wert, berechnet aus den Ergebnissen in dem Mittelwert verifizierenden Teil.
  15. Ein computerlesbares Aufzeichnungsmedium, welches darauf aufgezeichnet ein Computerprogramm aufweist zum Durchführen eines Verfahrens des Nachweisens eines fehlerhaften Signals in einem Computer, wobei das Verfahren die folgenden Operationen umfasst: Analysieren eines Unterschieds in den Varianzen für eine Hintergrund-Intensität und eine Vordergrund-Intensität für jedes Signal in einem DNA-Chip; Verifizieren, ob ein Mittelwert der Hintergrund-Intensität und ein Mittelwert der Vordergrund-Intensität signifikant voneinander unterschiedlich sind, basierend auf dem Unterschied in den Varianzen; und Beurteilen eines fehlerhaften Signals, basierend auf den Ergebnissen der verifizierenden Operation.
DE602005000834T 2004-02-21 2005-02-18 Verfahren zur Feststellung von falschen Signalen in einem DNA-Chip sowie System zur Verwendung derselben Active DE602005000834T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020040011654A KR100590542B1 (ko) 2004-02-21 2004-02-21 Dna 칩의 오류 스팟 검출 방법 및 그 시스템
KR2004011654 2004-02-21

Publications (2)

Publication Number Publication Date
DE602005000834D1 DE602005000834D1 (de) 2007-05-24
DE602005000834T2 true DE602005000834T2 (de) 2007-08-16

Family

ID=34747931

Family Applications (1)

Application Number Title Priority Date Filing Date
DE602005000834T Active DE602005000834T2 (de) 2004-02-21 2005-02-18 Verfahren zur Feststellung von falschen Signalen in einem DNA-Chip sowie System zur Verwendung derselben

Country Status (5)

Country Link
US (1) US20050186670A1 (de)
EP (1) EP1569155B1 (de)
JP (1) JP4113189B2 (de)
KR (1) KR100590542B1 (de)
DE (1) DE602005000834T2 (de)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101324419B1 (ko) * 2006-02-09 2013-11-01 케이엘에이-텐코 코포레이션 웨이퍼의 특성을 결정하기 위한 방법 및 시스템
WO2007137261A2 (en) * 2006-05-22 2007-11-29 Kla-Tencor Technologies Corporation Methods and systems for detecting pinholes in a film formed on a wafer or for monitoring a thermal process tool
WO2008001922A1 (fr) * 2006-06-27 2008-01-03 Nec Corporation Procédé, système et programme d'analyse d'enroulement de carte ou de composant électronique
US7912658B2 (en) * 2008-05-28 2011-03-22 Kla-Tencor Corp. Systems and methods for determining two or more characteristics of a wafer
US8494802B2 (en) * 2008-06-19 2013-07-23 Kla-Tencor Corp. Computer-implemented methods, computer-readable media, and systems for determining one or more characteristics of a wafer
US8269960B2 (en) * 2008-07-24 2012-09-18 Kla-Tencor Corp. Computer-implemented methods for inspecting and/or classifying a wafer
WO2014172345A2 (en) * 2013-04-15 2014-10-23 Massachusetts Institute Of Technology Fully automated system and method for image segmentation and quality control of protein microarrays

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5784162A (en) * 1993-08-18 1998-07-21 Applied Spectral Imaging Ltd. Spectral bio-imaging methods for biological research, medical diagnostics and therapy
US6044179A (en) * 1997-11-26 2000-03-28 Eastman Kodak Company Document image thresholding using foreground and background clustering
US6245517B1 (en) * 1998-09-29 2001-06-12 The United States Of America As Represented By The Department Of Health And Human Services Ratio-based decisions and the quantitative analysis of cDNA micro-array images
US6633659B1 (en) * 1999-09-30 2003-10-14 Biodiscovery, Inc. System and method for automatically analyzing gene expression spots in a microarray
AU2001296266A1 (en) * 2000-09-19 2002-04-02 The Regents Of The University Of California Method for determining measurement error for gene expression microarrays
WO2004068136A1 (en) * 2003-01-22 2004-08-12 Rosetta Inpharmatics Llc Improved anova method for data analysis
US7996155B2 (en) * 2003-01-22 2011-08-09 Microsoft Corporation ANOVA method for data analysis

Also Published As

Publication number Publication date
JP4113189B2 (ja) 2008-07-09
US20050186670A1 (en) 2005-08-25
DE602005000834D1 (de) 2007-05-24
EP1569155B1 (de) 2007-04-11
KR100590542B1 (ko) 2006-06-19
EP1569155A1 (de) 2005-08-31
JP2005249782A (ja) 2005-09-15
KR20050083245A (ko) 2005-08-26

Similar Documents

Publication Publication Date Title
DE602005000834T2 (de) Verfahren zur Feststellung von falschen Signalen in einem DNA-Chip sowie System zur Verwendung derselben
JP4610196B2 (ja) リアルタイムpcrのための自動閾値設定およびベースライン決定
US7089120B2 (en) Process for evaluating chemical and biological assays
US7136517B2 (en) Image analysis process for measuring the signal on biochips
US20030087289A1 (en) Image analysis of high-density synthetic DNA microarrays
EP1415279B1 (de) Bildmessungen in der statistischen analyse von dna microarrays- daten
US6876929B2 (en) Process for removing systematic error and outlier data and for estimating random error in chemical and biological assays
WO2006030822A1 (ja) 遺伝子発現データの処理方法、および、処理プログラム
US20050117790A1 (en) Image metrics in the statistical analysis of DNA microarray data
JP2007017282A (ja) 生体情報処理装置および生体情報処理方法、学習装置および学習制御方法、プログラム並びに記録媒体
US10733707B2 (en) Method for determining the positions of a plurality of objects in a digital image
KR102610794B1 (ko) 마이크로어레이 스팟 분석 방법 및 장치
US20040019433A1 (en) Method for locating areas of interest of a substrate
KR102228852B1 (ko) 무세포 dna 무결성 평가 방법
Rueda Image Processing of Affymetrix Microarrays
US20030023403A1 (en) Process for estimating random error in chemical and biological assays when random error differs across assays
CN113721042A (zh) 确定疲劳辉纹的特征和疲劳损伤存在的方法,系统和载体
DE102017116882A1 (de) Druckinspektionsvorrichtung zur optischen Inspektion eines Druckbildes eines Druckobjekts
Coombes et al. Monitoring the quality of microarray experiments
WO2023006175A1 (de) Verfahren zur klassifizierung mindestens einer nukleinsäuresequenz sowie vorrichtung, computerprogramm, computerlesbares speichermedium und digitales abbild
Havilio Signal deconvolution based expression-detection and background adjustment for microarray data
Yu-Ping et al. Automated segmentation of microarray spots using fuzzy clustering approaches
Jangamashetti et al. Automatically Locating Spots in DNAMicroarray Image Using Genetic Algorithm without Gridding
JP5147073B2 (ja) Dnaマイクロアレイデータの処理方法、処理装置及び処理プログラム
Podila et al. 24 Microarray Data Collection

Legal Events

Date Code Title Description
8364 No opposition during term of opposition