DE112020002936T5 - Systeme und verfahren zur auswertung von abfragestörungen - Google Patents

Systeme und verfahren zur auswertung von abfragestörungen Download PDF

Info

Publication number
DE112020002936T5
DE112020002936T5 DE112020002936.0T DE112020002936T DE112020002936T5 DE 112020002936 T5 DE112020002936 T5 DE 112020002936T5 DE 112020002936 T DE112020002936 T DE 112020002936T DE 112020002936 T5 DE112020002936 T5 DE 112020002936T5
Authority
DE
Germany
Prior art keywords
test
control
vector
adherent
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE112020002936.0T
Other languages
English (en)
Inventor
Mason Victors
Berton Earnshaw
Renat Khaliullin
Blake Borgeson
Peter McLean
Nathan Lazar
Katie-Rose Skelly
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Recursion Pharmaceuticals Inc
Original Assignee
Recursion Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Recursion Pharmaceuticals Inc filed Critical Recursion Pharmaceuticals Inc
Publication of DE112020002936T5 publication Critical patent/DE112020002936T5/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/30Dynamic-time models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Physiology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)

Abstract

Es werden Verfahren und Systeme zur Bewertung einer Abfrage-Störung in einem zellbasierten Assay, der einen Testzustand darstellt, bereitgestellt. Es werden Kontrolldatenpunkte mit Dimensionen erhalten, die Messungen verschiedener Merkmale in Aliquots von Kontrollzellen darstellen. Es werden Testdatenpunkte mit Dimensionen erhalten, die Messungen verschiedener Merkmale in Aliquots von Testzellen darstellen. Ein zusammengesetzter Testvektor wird zwischen den Maßen der zentralen Tendenz über die Kontrolldatenpunkte und den Maßen der zentralen Tendenz über die Testdatenpunkte errechnet. Abfrage-Störungsdatenpunkte mit Dimensionen, die Messungen verschiedener Merkmale über Aliquots von Störungszellen hinweg darstellen, werden erhalten. Ein zusammengesetzter Abfrage-Störungsvektor wird zwischen den Maßen der zentralen Tendenz über die Kontrolldatenpunkte und den Maßen der zentralen Tendenz über die Vielzahl der Abfrage-Störungsdatenpunkte berechnet.

Description

  • TECHNISCHES GEBIET
  • Die vorliegende Offenlegung bezieht sich allgemein auf Systeme und Methoden für das Screening von Substanzbibliotheken mit hohem Durchsatz.
  • QUERVERWEIS AUF VERWANDTE ANWENDUNGEN
  • Diese Anmeldung beansprucht die Priorität für die vorläufige Patentanmeldung, Seriennummer 62/863,414, mit dem Titel „SYSTEMS AND METHODS FOR EVALUATING QUERY PERTURBATIONS“ von Mason Victors et al. mit Anmeldetag 19. Juni 2019, die hierin durch Bezugnahme in vollem Umfang enthalten ist.
  • Diese Anmeldung beansprucht auch die Priorität der vorläufigen Patentanmeldung, Seriennummer 62/863,696, mit dem Titel „METHODS AND SYSTEMS FOR PREDICTING COMPOUND LIABILITIES“ von Berton Earnshaw, mit Anmeldetag 19. Juni 2019, die hier durch Bezugnahme in vollem Umfang enthalten ist.
  • Diese Anmeldung beansprucht auch die Priorität der vorläufigen Patentanmeldung, Seriennummer 62/863,700, mit dem Titel „SYSTEMS AND METHODS FOR COMBINING MULTIDIMENSIONAL PHENOMIC DATA WITH OTHER SOURCES OF BIOLOGICAL DATA FOR DRUG DISCOVERY“, von Berton Earnshaw, mit Anmeldetag 19. Juni 2019, die hierin durch Bezugnahme in vollem Umfang enthalten ist.
  • Diese Anmeldung beansprucht auch die Priorität der vorläufigen Patentanmeldung, Seriennummer 62/863,711, mit dem Titel „SYSTEMS AND METHODS FOR IDENTIFYING MECHANISM OF ACTION AND POLYPHARMACOLOGY“ von Berton Earnshaw, mit Anmeldetag 19. Juni 2019, die hier durch Bezugnahme in vollem Umfang enthalten ist.
  • Diese Anmeldung bezieht sich auf die am 2. März 2018 eingereichte US-Patentanmeldung Nr. 15/910,822 mit dem Titel „Systems and Methods for Evaluating Whether Perturbations Discriminate on Target Effect“ von Mason Victors et al. und ist dem Rechtsnachfolger der vorliegenden Anmeldung zugeordnet.
  • Diese Anmeldung bezieht sich auf die am 27. Februar 2019 eingereichte PCT-Patentanmeldung Nr. PCT/US2019/019846 mit dem Titel „Systems and Methods for Discriminating Effects on Targets“ von Mason Victors et al. und ist dem Rechtsnachfolger der vorliegenden Anmeldung zugeordnet.
  • Diese Anmeldung ist verwandt mit der am 11. März 2020 eingereichten PCT-Patentanmeldung Nr. PCT/US2020/022048 mit dem Titel „Process Control in Cell Based Assays“ von Mason Victors et al. mit der Attomey Docket No. R2018-5005-PCT, die dem Rechtsnachfolger der vorliegenden Anmeldung zugewiesen wurde.
  • HINTERGRUND
  • High-Throughput-Screening (HTS) ist ein Verfahren, das in der pharmazeutischen Wirkstoffforschung eingesetzt wird, um große Substanzbibliotheken mit Tausenden bis Millionen von Verbindungen auf verschiedene biologische Wirkungen zu testen. Beim HTS wird in der Regel Robotik eingesetzt, z. B. Liquid-Handler und automatisierte Bildgebungsgeräte, um biochemische, genetische und/oder phänotypische Tests an großen Substanzbibliotheken in Multiwell-Platten (auch als Mikrotiterplatten bezeichnet) durchzuführen, z. B. in 96-Well-, 384-Well-, 1536-Well- oder 3456-Well-Platten. Auf diese Weise können vielversprechende Verbindungen, die eine gewünschte biochemische, genetische oder phänotypische Wirkung haben, schnell aus den großen Substanzbibliotheken identifiziert werden, um sie weiter zu testen und zu entwickeln mit dem Ziel, einen neuen pharmazeutischen Wirkstoff für die Behandlung von Krankheiten zu finden. Eine Übersicht über grundlegende HTS-Methoden findet sich beispielsweise in Wildey et al., 2017, „Chapter Five - High-Throughput Screening“, Annual Reports in Medicinal Chemistry, Academic Press, 50:149-95, auf die hiermit verwiesen wird.
  • Herkömmliche HTS-Methoden beruhen auf krankheitsspezifischen biologischen Tests, bei denen die Auswirkungen von Wirkstoffkandidaten auf bestimmte biologische Ziele gemessen werden. Dies erfordert ein umfassendes Verständnis der Krankheit und der entsprechenden Ätiologie, bevor eine Strategie zur Entdeckung von Arzneimitteln für eine bestimmte Krankheit entwickelt und umgesetzt werden kann. Swinney und Xia, 2014, Future Med. Chem. 6(9):987-1002. Daher ist es schwierig, wirksame Screening-Methoden für Krankheiten zu entwickeln, deren Ätiologie nur unzureichend bekannt ist. Doch selbst wenn die Ätiologie einer Krankheit gut verstanden wird, ist ein auf der Grundlage dieses Verständnisses entwickelter zielspezifischer Assay nicht in der Lage, komplexe polypharmakologische Wirkungen zu erfassen (siehe Reddy und Zhang, 2014, „Polypharmacology: drug discovery for the future“, Expert Rev. Clin. Pharmacol. 6(1): doi:10.1586/ecp.12.74, der hiermit durch Verweis einbezogen wird) oder Wirkungen, die durch ein unbekanntes Ziel vermittelt werden. Darüber hinaus ist die Entwicklung eines Assays, der für ein bestimmtes molekulares Ziel spezifisch ist, mit erheblichen Kosten in Form von Kapital, Arbeit und Zeit verbunden.
  • Da herkömmliche HTS-Methoden zielgruppenspezifisch sind, ist es schwierig festzustellen, ob ein therapeutischer Wirkstoffkandidat - der möglicherweise eine gewünschte Wirkung auf das zuvor identifizierte Ziel hat - auch unerwünschte Off-Target-Effekte im Screening-Assay hervorruft. Daher sind in der Regel weitere Tests erforderlich, um das Vorhandensein solcher Off-Target-Effekte zu prüfen, nachdem ein therapeutischer Wirkstoffkandidat im ersten Hochdurchsatz-Screening identifiziert wurde.
  • ZUSAMMENFASSUNG
  • Vor diesem Hintergrund sind Methoden und Systeme für das Screening von Substanzbibliotheken in einer zielgerichteten Art und Weise in Fachkreisen erforderlich. Solche Methoden und Systeme würden es überflüssig machen, für jede Krankheit einen anderen zielbasierten bzw. Target-basierten Assay zu entwickeln, was die Geschwindigkeit der Arzneimittelentdeckung erhöhen und die Kosten senken würde. Solche Methoden und Systeme würden auch die Screening-Methoden verbessern, indem sie die Identifizierung von Therapeutika-Kandidaten mit Wirkungen erleichtern, die durch ein beliebiges molekulares Ziel vermittelt werden, einschließlich bisher nicht identifizierter Ziele. Außerdem werden Methoden und Systeme benötigt, die die Identifizierung polypharmakologischer Wirkungen in einer Hochdurchsatz-Screening-Umgebung ermöglichen. Solche Methoden und Systeme würden die Screening-Methoden verbessern, indem sie die Identifizierung von Therapeutika-Kandidaten mit Wirkungen erleichtern, die durch mehrere molekulare Targets vermittelt werden und die durch die Verwendung einer beliebigen Anzahl von Target-spezifischen Assays nicht identifiziert werden könnten. Schließlich werden auch Methoden und Systeme zur Identifizierung von On-Target- und Off-Target-Effekten in einem einzigen Hochdurchsatz-Screening-Assay benötigt. Solche Methoden und Systeme würden das Erfordernis überflüssig machen, getrennte Screens für On-Target- und Off-Target-Effekte durchzuführen, was die Geschwindigkeit der Arzneimittelentdeckung erhöhen und die Kosten senken würde.
  • Die vorliegende Offenlegung befasst sich unter anderem mit dem Bedarf an Systemen und Methoden, die ein intelligentes Screening von Substanzbibliotheken ohne ein molekulares Verständnis der Krankheit und der entsprechenden Ätiologie ermöglichen. Darüber hinaus erleichtern die hierin beschriebenen Systeme und Methoden die Identifizierung von Verbindungen, die den zellulären Krankheitsphänotyp retten, ohne ein hohes Maß an Off-Target-Effekten zu verursachen. Die hier beschriebenen Methoden und Systeme sind auch nützlich, um therapeutische Konzentrationsfenster für solche Verbindungen zu identifizieren, in denen die On-Target-Wirkungen hoch und die Off-Target-Wirkungen niedrig sind. Auf diese Weise beschleunigen und reduzieren die hier beschriebenen Methoden und Systeme zum Screening von Verbindungen in einer Substanzbibliothek die Kosten der pharmazeutischen Wirkstoffforschung.
  • Die hier offengelegten Methoden und Systeme nutzen die automatisierte Biologie und das maschinelle Lernen. In einigen Ausführungsformen nutzen die Methoden und Systeme die Mikroskopie, um eine große Anzahl von Veränderungen (z. B. subzelluläre und Zellpopulationsveränderungen) zu messen, die durch Störungen verursacht werden, und die Anwendung von maschinellem Lernen, um hochdimensionale Phänotypen über viele Krankheitsmodelle hinweg zu entdecken. Hochdurchsatz-Wirkstoffscreenings nach diesen und anderen hier beschriebenen Methoden können vielversprechende Wirkstoffkandidaten aufdecken, die komplexe Krankheitssignaturen retten. Dieser einzigartige Ansatz ermöglicht die schnelle Modellierung und das Screening potenzieller Behandlungen für Hunderte von traditionell refraktären Krankheiten und ist damit ideal geeignet, um dringende ungedeckte medizinische Bedürfnisse zu erfüllen, z. B. die Behandlung von Patienten mit schlecht verstandenen, polypharmakologisch schwierigen und/oder seltenen Krankheiten.
  • So gibt es etwa 6.000 seltene Krankheiten, von denen schätzungsweise 25 Millionen Menschen in den Vereinigten Staaten betroffen sind. Seltene Krankheiten betreffen überproportional häufig Kinder, und viele Kinder mit seltenen genetischen Krankheiten erleben nicht einmal ihren fünften Geburtstag. Die Entwicklung von Therapeutika für diese Krankheiten verläuft schleppend, und für weniger als 5 % der seltenen Krankheiten gibt es eine von der FDA zugelassene Behandlung. Dies ist zum Teil auf die herkömmliche Anforderung des HTS zurückzuführen, dass die Ätiologie der Krankheit gut verstanden sein muss, um einen zielspezifischen Assay für das Screening zu entwickeln. Die offengelegten Methoden und Systeme überwinden diese Anforderung und erleichtern das Screening von Therapien für Krankheiten, wie z. B. seltene Krankheiten, deren Ätiologie nicht genau bekannt ist.
  • Die vorliegende Offenlegung ist jedoch nicht auf Methoden und Systeme für das Screening von Therapeutika für seltene Krankheiten oder sogar Krankheiten, deren Ätiologie nur unzureichend verstanden ist, beschränkt. Wie oben beschrieben, verbessern die hier offengelegten Methoden und Systeme herkömmliche Screening-Methoden, indem sie beispielsweise die Identifizierung von Therapiekandidaten mit Wirkungen über nicht identifizierte molekulare Targets und/oder mit polypharmakologischen Wirkungen erleichtern und die Bewertung von On-Target- und Off-Target-Effekten mit einem einzigen Assay ermöglichen.
  • In einem Aspekt stellt die Offenbarung Methoden, Systeme und computerlesbare Medien zum Screening einer Reihe von Verbindungen bereit, indem On-Target- und Off-Target-Effekte der Verbindungen berücksichtigt werden. In einigen Ausführungsformen umfasst das Screening das Erhalten von Ergebnissen aus einem zellbasierten Assay, der in einer oder mehreren Multiwell-Platten durchgeführt wird. Die Ergebnisse umfassen Merkmalsmessungen aus einer Vielzahl von Kontrollzuständen, die Wildtyp-Phänotypen darstellen, einer Vielzahl von Testzuständen, die Krankheits-Phänotypen darstellen, und einer Vielzahl von Abfragezuständen, in denen die Wirkungen von Verbindungen auf die Krankheits-Phänotypen getestet werden. Es werden Kontrolldatenpunkte erhalten, die jeweils eine Vielzahl von Dimensionen enthalten, wobei jede Dimension entweder (i) ein Maß der zentralen Tendenz einer Messung eines anderen Merkmals über eine Vielzahl von Kontrollinstanzen eines Zellkontexts oder (ii) ein Maß der zentralen Tendenz einer anderen Dimensionsreduktionskomponente darstellt, die unter Verwendung von Messungen der Merkmale über die Vielzahl von Kontrollinstanzen des Zellkontexts bestimmt wird. Testdatenpunkte werden erhalten, die jeweils eine Vielzahl von Dimensionen enthalten, wobei jede Dimension entweder (i) ein Maß der zentralen Tendenz einer Messung eines anderen Merkmals über eine Vielzahl von Testinstanzen eines gestörten Zellkontexts oder (ii) ein Maß der zentralen Tendenz einer anderen Dimensionsreduktionskomponente darstellt, die unter Verwendung von Messungen der Merkmale über die Vielzahl von Testinstanzen des gestörten Zellkontexts bestimmt wird. Es werden Abfragedatenpunkte erhalten, die jeweils eine Vielzahl von Dimensionen enthalten, wobei jede Dimension entweder (i) ein Maß der zentralen Tendenz einer Messung eines anderen Merkmals über eine Vielzahl von Abfrageinstanzen eines gestörten Zellkontexts, der einer Verbindung ausgesetzt ist, oder (ii) ein Maß der zentralen Tendenz einer anderen Dimensionsreduktionskomponente darstellt, die unter Verwendung von Messungen der Merkmale über die Vielzahl von Abfrageinstanzen des gestörten Zellkontexts, der der Verbindung ausgesetzt ist, bestimmt wird. Ein zusammengesetzter Testvektor wird berechnet zwischen (i) einem ersten Punkt, der durch ein entsprechendes Maß der zentralen Tendenz über die Vielzahl der Kontrolldatenpunkte für jede Dimension definiert ist, und (ii) einem zweiten Punkt, der durch ein entsprechendes Maß der zentralen Tendenz über die Vielzahl der Testdatenpunkte für jede Dimension definiert ist. Ein zusammengesetzter Abfragetestvektor wird zwischen (i) dem ersten Punkt und (ii) einem entsprechenden Maß der zentralen Tendenz über die Vielzahl der Abfragestörungsdatenpunkte für jede Dimension berechnet. Ein On-Target-Wert wird für den gestörten Zellkontext, der einer Verbindung ausgesetzt ist, als Projektion des Abfrage-Störungsvektors auf den zusammengesetzten Testvektor berechnet, und ein Off-Target-Wert wird für den gestörten Zellkontext, der der Verbindung ausgesetzt ist, als Ablehnung des Abfrage-Störungsvektors gegenüber dem zusammengesetzten Testvektor errechnet. Der On-Target-Wert und/oder Off-Target-Wert für den gestörten Zellkontext, der der Verbindung ausgesetzt ist, wird dann ausgewertet. In einigen Ausführungsformen werden On-Target- und Off-Target-Werte von gestörten Zellkontexten, die mehreren Verbindungen und/oder mehreren Konzentrationen einer Verbindung ausgesetzt sind, bewertet, indem die Werte in einem Koordinatensystem aufgetragen werden, das zum Teil durch die Merkmalsmessungen der Kontrollzellkontexte definiert ist.
  • Figurenliste
  • Die beigefügten Zeichnungen, die Bestandteil dieser Anmeldung sind, veranschaulichen Ausführungsformen des Gegenstandes und dienen zusammen mit der Beschreibung der Ausführungsformen zur Erläuterung der Grundsätze des Gegenstandes. Sofern nicht anders angegeben, sind die Zeichnungen, auf die in dieser Kurzbeschreibung der Zeichnungen Bezug genommen wird, als nicht maßstabsgetreu zu verstehen.
    • 1 zeigt einen beispielhaften Arbeitsablauf für das Screening einer oder mehrerer Verbindungen auf der Grundlage von On-Target- und Off-Target-Effekten, wenn sie einem oder mehreren gestörten Zellkontexten ausgesetzt werden, in Übereinstimmung mit verschiedenen Ausführungsformen der vorliegenden Offenbarung.
    • Die 2A, 2B, 2C und 2D zeigen zusammen ein Beispielsystem/eine Beispielvorrichtung für das Screening einer oder mehrerer Verbindungen auf der Grundlage von On-Target- und Off-Target-Effekten, wenn sie einem oder mehreren gestörten Zellkontexten ausgesetzt werden, in Übereinstimmung mit verschiedenen Ausführungsformen der vorliegenden Offenbarung.
    • 3 zeigt einen beispielhaften Arbeitsablauf zur Erfassung von Messungen verschiedener Merkmale für das Screening einer oder mehrerer Verbindungen auf der Grundlage von On-Target- und Off-Target-Effekten, wenn sie einem oder mehreren gestörten Zellkontexten ausgesetzt werden, in Übereinstimmung mit verschiedenen Ausführungsformen der vorliegenden Offenbarung.
    • Die 4A, 4B, 4C, 4D, 4E, 4F, 4G, 4H, 4I, 4J, 4K, 4L, 4M, 4N, 4O, 4P, 4Q, 4R, 4S, 4T, 4U, 4V, 4W, 4X, 4Y, 4Z, 4AA, 4AB, 4AC, und 4AD stellen gemeinsam ein Flussdiagramm von Verfahren und Merkmalen für das Screening einer oder mehrerer Verbindungen auf der Grundlage von On-Target- und Off-Target-Effekten bei Exposition gegenüber einem oder mehreren gestörten Zellkontexten dar, in dem optionale Schritte durch gestrichelte Kästen und/oder Verbindungslinien gekennzeichnet sind, in Übereinstimmung mit verschiedenen Ausführungsformen der vorliegenden Offenbarung.
    • 5 veranschaulicht die Bestimmung von Off-Target- und On-Target-Werten auf der Grundlage der Beziehung zwischen einem zusammengesetzten Testvektor und einem zusammengesetzten Abfragevektor, der aus Merkmalsmessungen eines Zellkontextes, einer Störung des Zellkontextes und der Störung des Zellkontextes, der einer Verbindung ausgesetzt ist, berechnet wird, in Übereinstimmung mit verschiedenen Ausführungsformen der vorliegenden Offenbarung.
    • 6 zeigt ein Beispiel für ein Diagramm von On-Target-Werten als Funktion von Off-Target-Werten für verschiedene Kontrollzellkontexte, gestörte Zellkontexte und gestörte Zellkontexte, die verschiedenen Verbindungen in verschiedenen Konzentrationen ausgesetzt sind, in Übereinstimmung mit verschiedenen Ausführungsformen der vorliegenden Offenbarung.
    • Die 7A und 7B zeigen Beispiele von Dosis-Wirkungs-Kurven von Off-Target-Werten als Funktion von On-Target-Werten für verschiedene nicht erkrankte/nicht gestörte Zellkontexte (z. B. „gesunde“ Zellkontexte), gestörte Zellkontexte (z. B. „Test“-Zellkontexte) und gestörte Zellkontexte, die unterschiedlichen Konzentrationen verschiedener Verbindungen ausgesetzt sind (z. B. gescreente Testzellkontexte), in Übereinstimmung mit verschiedenen Ausführungsformen der vorliegenden Offenbarung.
    • 7C zeigt ein Beispiel für eine Dosis-Wirkungs-Kurve von Off-Target-Werten als Funktion von On-Target-Werten für verschiedene Konzentrationen eines Störungsmittels sowie für nicht gestörte Zellkontexte (z. B. „gesunde“ Zellkontexte) und gestörte Zellkontexte (z. B. „Test“-Zellkontexte) gemäß verschiedenen Ausführungsformen der vorliegenden Offenbarung.
    • Die 8A, 8B, 8C, 8D, 8E, 8F und 8G veranschaulichen beispielhafte Reaktionsbewertungsdiagramme, die unabhängig voneinander Dosis-Wirkungs-On-Target-Werte und Dosis-Wirkungs-Off-Target-Werte für einen gestörten Zellkontext, der einer Verbindung ausgesetzt ist, an eine sigmoide Kurve anpassen, in Übereinstimmung mit verschiedenen Ausführungsformen der vorliegenden Offenbarung.
    • Die 9A, 9B, 9C und 9D zeigen Beispielergebnisse von Screens zur Identifizierung von Arzneimittelkandidaten für A-T aus einer Bibliothek zahlreicher kleiner Moleküle in Übereinstimmung mit verschiedenen Ausführungsformen der vorliegenden Offenbarung.
    • Die 10A, 10B, 10C und 10D zeigen Beispiele für die De-novo-Identifizierung von Verbindungen, die einen hochdimensionalen Phänotyp retten, der mit einem SMA-Mangel verbunden ist, in Übereinstimmung mit verschiedenen Ausführungsformen der vorliegenden Offenbarung.
    • Die 11A, 11B und 11C zeigen Beispiele für Inhibitoren von mTOR, VEGF und EGFR/Her2, die einen hochdimensionalen Phänotyp retten, der mit NF2-Mangel assoziiert ist, in Übereinstimmung mit verschiedenen Ausführungsformen der vorliegenden Offenbarung.
    • Die 12A, 12B, 12C, 12D und 12E zeigen Beispielergebnisse aus Screens von VEGFR-Inhibitoren zur Identifizierung von Arzneimittelkandidaten für die Behandlung von HHT unter Verwendung eines ACVRL1-Knockdown-Modells gemäß verschiedenen Ausführungsformen der vorliegenden Offenbarung.
  • Gleiche Ziffern beziehen sich auf die entsprechenden Teile in den verschiedenen Ansichten der Zeichnungen.
  • AUSFÜHRLICHE BESCHREIBUNG
  • Es wird nun im Detail auf verschiedene Ausführungsformen des Gegenstands verwiesen, von denen Beispiele in den beigefügten Zeichnungen dargestellt sind. Während verschiedene Ausführungsformen hier erörtert werden, ist es zu verstehen, dass sie nicht beabsichtigt sind, auf diese Ausführungsformen zu beschränken. Im Gegenteil, die vorgestellten Ausführungsformen sollen Alternativen, Modifikationen und Äquivalente abdecken, die im Sinne und Umfang der verschiedenen Ausführungsformen, wie sie in den beigefügten Ansprüchen definiert sind, enthalten sein können. Darüber hinaus werden in dieser Beschreibung der Ausführungsformen zahlreiche spezifische Details dargelegt, um ein umfassendes Verständnis der Ausführungsformen des vorliegenden Gegenstands zu ermöglichen. Die Ausführungsformen können jedoch auch ohne diese spezifischen Details ausgeführt werden. In anderen Fällen wurden bekannte Methoden, Verfahren, Komponenten und Schaltungen nicht im Detail beschrieben, um Aspekte der beschriebenen Ausführungsformen nicht unnötig zu verschleiern.
  • Überblick über die Diskussion
  • Herkömmliche Hochdurchsatz-Screening-Methoden sind ineffizient, da sie nicht in der Lage sind, Arzneimittelkandidaten zu identifizieren, die über ein unbekanntes molekulares Ziel wirken und/oder komplexe pharmakologische Eigenschaften haben. Infolgedessen ist die Entdeckung wirksamer therapeutischer Mittel zur Behandlung von Krankheiten unnötig langsam, teuer und ineffizient. Dies gilt insbesondere für Krankheiten mit schlecht verstandener Ätiologie, für die zielgerichtete Tests entweder nur begrenzt wirksam sind oder überhaupt nicht entwickelt werden können. So stellen wirksame Behandlungen für viele Krankheiten einen dringenden Bereich mit großem ungedeckten medizinischen Bedarf dar, während Therapien für andere Krankheiten aufgrund der übermäßigen Kosten für die Arzneimittelentdeckung, sowohl in Bezug auf Kapital als auch auf Arbeit, unnötig teuer sind. Die vorliegende Offenlegung geht auf diese Bedürfnisse ein, indem sie Screening-Plattformen für die Arzneimittelentdeckung bereitstellt, die schnell für das Screening von Substanzbibliotheken gegen nahezu jeden Krankheitszustand angepasst werden können, unabhängig davon, ob ein zielspezifischer Assay entwickelt wurde. Darüber hinaus sind die hier beschriebenen Plattformen zur Entdeckung von Arzneimitteln ohne weiteres in der Lage, polypharmakologische Effekte zu messen und therapeutische Kandidaten zu identifizieren, die über unbekannte molekulare Ziele wirken. Die hier beschriebene Screening-Plattform nutzt das Design hochdimensionaler struktureller Phänotypen für Hunderte von Krankheitsmodellen in massiv parallelen Hochdurchsatz-Wirkstoffscreens.
  • Wie in den Beispielen beschrieben, zeigt die Analyse von Studien, bei denen diese Plattform zur Identifizierung von Wirkstoffkandidaten für die Behandlung von A-T, SMA und NF2 eingesetzt wurde, das Potenzial der offengelegten Screening-Plattform, schnell hochgradig umsetzbare Wirkstoffkandidaten in einem Bruchteil der Zeit und Kosten eines herkömmlichen Wirkstoffscreenings zu finden. Die hier beschriebenen Methoden erleichtern das Screening von Arzneimitteln ohne eine vorher festgelegte Zielhypothese. Dies ist besonders wertvoll für die Suche nach Arzneimitteln, die auf neuartige Targets einwirken oder durch komplexe Polypharmakologie wirken. Zum Beispiel wurde, wie in Beispiel 1 berichtet, ein starker, den Krankheitsphänotyp verbessernder Klasseneffekt von Glukokortikoiden für die Behandlung von A-T identifiziert, ebenso wie ihre zuvor nicht berichtete dichotome Gruppierung in Bezug auf phänotypische Nebenwirkungsprofile. Die Screening-Plattform identifizierte insbesondere Betamethason und Dexamethason als Treffer, die beide unabhängig voneinander in Humanstudien validiert worden sind. Die Screening-Methode deckte jedoch auch die Fähigkeit von Mometason auf, das ein attraktiveres Nebenwirkungsprofil als Betamethason und Dexamethason aufwies, den ATM-Mangel in einem orthogonalen krankheitsrelevanten Assay besser zu beheben.
  • Wie in Beispiel 2 beschrieben, identifizierte die hier beschriebene Screening-Plattform schnell HDAC-Inhibitoren unter anderen Medikamentenklassen als potenzielle Behandlungsmethoden für SMA, einschließlich eines spezifischen HDAC-Inhibitors, der bereits in klinische Studien für die Krankheit aufgenommen wurde.
  • Wie in Beispiel 3 beschrieben, identifizierte die hier beschriebene Screening-Plattform die drei wichtigsten Medikamentenklassen (mTOR-, VEGF- und EGFR/Her2-Inhibitoren), deren Wirksamkeit für die Behandlung von Krebssyndromen aufgrund von NF2-Mangel bekannt ist. Bemerkenswert ist, dass die Screening-Plattform speziell die therapeutischen Wirkungen von AZD2014 und Sunitinib identifiziert hat, die beide in fortgeschrittenen klinischen Studien für NF2-assoziierte Pathologien untersucht werden. Zusammengenommen zeigen diese Daten die Fähigkeit des einzigartigen Ansatzes der offengelegten Screening-Plattform, schnell und mit bemerkenswerter Sensitivität hochgradig umsetzbare Arzneimittelkandidaten zu entdecken und zu differenzieren.
  • Dementsprechend stellt die vorliegende Offenlegung in einigen Ausführungsformen ein Verfahren zum Screening einer oder mehrerer Verbindungen auf der Grundlage von On-Target- und Off-Target-Effekten bei Exposition gegenüber einem oder mehreren gestörten Zellkontexten bereit. Das Screening-Verfahren basiert auf Korrelationen zwischen Merkmalen, die aus charakteristischen Messungen (i) eines Zellkontextes, (ii) einer Störung des Zellkontextes und (iii) der Störung des Zellkontextes, der einer oder mehreren Verbindungen ausgesetzt ist, bestimmt werden, z. B. bei Anwendung in einer Verbindungsbibliothek, wie unten im Detail beschrieben. Bei den verschiedenen Merkmalen, die in diesen Analysen verwendet werden, kann es sich entweder um eine Messung (z. B. Durchschnittsmessungen) eines bestimmten Merkmals eines gegebenen Zustands oder um eine algebraische Kombination von Messungen einer Vielzahl von Merkmalen des gegebenen Zustands handeln, wie sie z. B. durch Deep-Learning-Analyse identifiziert werden. Aus diesen Merkmalen konstruierte mehrdimensionale Vektoren werden verwendet, um On-Target-Werte und Off-Target-Werte für jede untersuchte Verbindung zu berechnen. In einigen Ausführungsformen basieren die On-Target-Werte auf der Projektion eines ersten mehrdimensionalen Vektors, der aus Merkmalen konstruiert wurde, die aus Instanzen einer Störung eines Zellkontextes bestimmt wurden, der einer Verbindung ausgesetzt ist, auf einen zweiten mehrdimensionalen Vektor, der aus Merkmalen konstruiert wurde, die aus Instanzen der Störung des Zellkontextes bestimmt wurden, wenn dieser nicht der Verbindung ausgesetzt ist, z. B. relativ zu einem Zentrum eines mehrdimensionalen Raums, der während des Screening-Prozesses definiert wurde. In einigen Ausführungsformen basieren die Off-Target-Werte auf der Zurückweisung bzw. Ablehnung des ersten mehrdimensionalen Vektors, der aus Merkmalen konstruiert wurde, die aus Fällen der Störung des Zellkontextes bestimmt wurden, die der Verbindung ausgesetzt waren, auf den zweiten mehrdimensionalen Vektor, der aus Merkmalen konstruiert wurde, die aus Fällen der Störung des Zellkontextes bestimmt wurden, wenn er der Verbindung nicht ausgesetzt war, z. B. relativ zu einem Zentrum eines mehrdimensionalen Raumes, der während des Screening-Prozesses definiert wurde.
  • Notation und Nomenklatur
  • Einige Teile der folgenden detaillierten Beschreibungen werden in Form von Prozeduren, Logikblöcken, Prozessen, Modulen und anderen symbolischen Darstellungen von Operationen an Datenbits in einem Computerspeicher dargestellt. Diese Beschreibungen und Darstellungen sind die Mittel, die von Fachleuten der Datenverarbeitung verwendet werden, um anderen Fachleuten den Inhalt ihrer Arbeit am wirksamsten zu vermitteln. In der vorliegenden Anwendung wird eine Prozedur, ein Logikblock, ein Prozess, ein Modul oder ähnliches als eine oder mehrere in sich konsistente Prozeduren oder Anweisungen verstanden, die zu einem gewünschten Ergebnis führen. Bei den Prozeduren handelt es sich um solche, die physikalische Manipulationen von physikalischen Größen erfordern. Normalerweise, wenn auch nicht notwendigerweise, haben diese Größen die Form von elektrischen oder magnetischen Signalen, die in einem elektronischen Gerät/einer elektronischen Komponente gespeichert, übertragen, kombiniert, verglichen und anderweitig manipuliert werden können.
  • Es sollte jedoch bedacht werden, dass alle diese und ähnliche Begriffe mit den entsprechenden physikalischen Größen in Verbindung gebracht werden müssen und lediglich praktische Bezeichnungen für diese Größen sind. Sofern nicht ausdrücklich anders angegeben und aus den folgenden Ausführungen ersichtlich, beziehen sich in der gesamten Beschreibung der Ausführungsformen Begriffe wie „zugreifen“, „addieren“, „berechnen“, „färben“, „ableiten“, „bestimmen“, „darstellen“, „eliminieren“, „einbetten“, „auswerten“, „belichten“, „ausdrücken“, „filtern“, „finden“, „anpassen“, „graphisch darstellen“, „abbilden“, „messen“, „eine zentrale Tendenz messen“, „normalisieren“, „erhalten“, „ausgeben“, „plotten“, „bereitstellen“, „quantifizieren“, „reduzieren“, „entfernen“, „darstellen“, „schattieren“, „skalieren“, „sortieren“, „verwenden“ oder ähnliches auf die Aktionen und Prozesse eines elektronischen Geräts oder einer elektronischen Komponente wie z. B.: ein Prozessor, ein Controller, ein Computersystem, ein Speicher oder ähnliches oder eine Kombination davon. Die elektronische(n) Vorrichtung(en) oder Komponente(n) manipuliert/umwandelt Daten, die als physikalische (elektronische und/oder magnetische) Größen in den Registern und Speichern dargestellt werden, in andere Daten, die in ähnlicher Weise als physikalische Größen in Speichern oder Registern oder anderen Komponenten zur Speicherung, Übertragung, Verarbeitung oder Anzeige von Informationen dargestellt werden.
  • Die hier beschriebenen Ausführungsformen können im allgemeinen Kontext von computer- bzw. prozessorausführbaren Anweisungen erörtert werden, die sich auf einer Art nichttransitorischem computer- bzw. prozessorlesbarem Speichermedium befinden, wie z. B. Programmmodule oder Logik, die von einem oder mehreren Computern, Prozessoren oder anderen Geräten ausgeführt werden. Zu den Programmmodulen gehören im Allgemeinen Routinen, Programme, Objekte, Komponenten, Datenstrukturen usw., die bestimmte Aufgaben ausführen oder bestimmte abstrakte Datentypen implementieren. Die Funktionalität der Programmmodule kann in verschiedenen Ausführungsformen beliebig kombiniert oder verteilt werden.
  • In den Figuren kann ein einzelner Block beschrieben werden, der eine oder mehrere Funktionen ausführt; in der Praxis kann die Funktion bzw. können die Funktionen, die von diesem Block ausgeführt werden, jedoch in einer einzelnen Komponente oder in mehreren Komponenten ausgeführt werden und/oder mit Hilfe von Hardware, Software oder einer Kombination aus Hardware und Software ausgeführt werden. Um diese Austauschbarkeit von Hardware und Software zu verdeutlichen, wurden verschiedene Komponenten, Blöcke, Module, Schaltkreise und Schritte allgemein im Hinblick auf ihre Funktionalität beschrieben. Ob eine solche Funktionalität als Hardware oder Software implementiert wird, hängt von der jeweiligen Anwendung und den dem Gesamtsystem auferlegten Designvorgaben ab. Fachleute können die beschriebene Funktionalität für jede bestimmte Anwendung auf unterschiedliche Weise implementieren, aber solche Implementierungsentscheidungen sollten nicht als Abweichung vom Anwendungsbereich der vorliegenden Offenbarung interpretiert werden. Die hier beschriebene Beispielhardware kann auch andere als die gezeigten Komponenten enthalten, einschließlich bekannter Komponenten.
  • Die hier beschriebenen Techniken können in Hardware oder in einer Kombination von Hardware mit Firmware und/oder Software implementiert werden, sofern nicht ausdrücklich eine bestimmte Art der Implementierung beschrieben wird. Alle Merkmale, die als Module oder Komponenten beschrieben werden, können auch zusammen in einer integrierten Logikeinheit oder separat als diskrete, aber interoperable Logikeinheiten implementiert werden. Wenn die Techniken in Software implementiert sind, können sie zumindest teilweise durch ein nichttransitorisches computer-/prozessorlesbares Speichermedium realisiert werden, das computer-/prozessorlesbare Anweisungen enthält, die, wenn sie ausgeführt werden, einen Prozessor und/oder andere Komponenten eines Computers oder elektronischen Geräts veranlassen, eines oder mehrere der hier beschriebenen Verfahren durchzuführen. Das nicht-transitorische computer-/prozessorlesbare Speichermedium kann Teil eines Computerprogrammprodukts sein, das Verpackungsmaterialien enthalten kann.
  • Das nichttransitorische, prozessorlesbare Speichermedium (auch als nichttransitorisches, computerlesbares Speichermedium bezeichnet) kann einen Speicher mit wahlfreiem Zugriff (RAM) wie z. B. einen synchronen dynamischen Speicher mit wahlfreiem Zugriff (SDRAM), einen Festwertspeicher (ROM), einen nichtflüchtigen Speicher mit wahlfreiem Zugriff (NVRAM), einen elektrisch löschbaren, programmierbaren Festwertspeicher (EEPROM), einen FLASH-Speicher, Compact Discs, Digital Versatile Discs, optische Speichermedien, magnetische Speichermedien, Festplattenlaufwerke, andere bekannte Speichermedien und dergleichen umfassen. Die Techniken können zusätzlich oder alternativ zumindest teilweise durch ein prozessorlesbares Kommunikationsmedium realisiert werden, das Code in Form von Befehlen oder Datenstrukturen trägt oder überträgt und auf das ein Computer oder ein anderer Prozessor zugreifen, es lesen und/oder ausführen kann.
  • Die verschiedenen logischen Blöcke, Module, Schaltungen und Befehle, die im Zusammenhang mit den hierin beschriebenen Ausführungsformen beschrieben werden, können von einem oder mehreren Prozessoren ausgeführt werden, z. B. von Host-Prozessoren oder deren Kernen, digitalen Signalprozessoren (DSPs), Allzweck-Mikroprozessoren, anwendungsspezifischen integrierten Schaltungen (ASICs), anwendungsspezifischen Befehlssatzprozessoren (ASIPs), feldprogrammierbaren Gate-Arrays (FPGAs), Grafikverarbeitungseinheiten (GPUs), Mikrocontrollern oder anderen gleichwertigen integrierten oder diskreten Logikschaltungen. Der hier verwendete Begriff „Prozessor“ oder „Controller“ kann sich auf jede der vorgenannten Strukturen oder jede andere Struktur beziehen, die sich für die Umsetzung der hier beschriebenen Techniken eignet. Darüber hinaus kann die hier beschriebene Funktionalität in einigen Aspekten in speziellen Softwaremodulen oder Hardwaremodulen bereitgestellt werden, die wie hier beschrieben konfiguriert sind. Auch können die Techniken oder Aspekte davon vollständig in einer oder mehreren Schaltungen oder Logikelementen implementiert werden. Ein Universalprozessor kann ein Mikroprozessor sein, alternativ kann der Prozessor aber auch ein beliebiger konventioneller Prozessor, Controller, Mikrocontroller oder eine Zustandsmaschine sein. Ein Prozessor kann auch als eine Kombination von Recheneinheiten implementiert sein, z. B. eine Vielzahl von Mikroprozessoren, ein oder mehrere Mikroprozessoren in Verbindung mit einem ASIC oder DSP oder jede andere derartige Konfiguration oder geeignete Kombination von Prozessoren.
  • Definitionen
  • Es versteht sich auch von selbst, dass, obwohl die Begriffe „erstes“, „zweites“ usw. hier zur Beschreibung verschiedener Elemente verwendet werden können, diese Elemente nicht durch diese Begriffe eingeschränkt werden sollten. Diese Begriffe werden nur verwendet, um ein Element von einem anderen zu unterscheiden. So kann beispielsweise ein erster Zellkontext als zweiter Zellkontext bezeichnet werden, und ein zweiter Zellkontext kann als erster Zellkontext bezeichnet werden, ohne dass dies vom Anwendungsbereich der vorliegenden Offenbarung abweicht. Der erste Zellkontext und der zweite Zellkontext sind beide Zellkontexte, aber sie sind nicht derselbe Zellkontext.
  • Die in der vorliegenden Offenbarung verwendete Terminologie dient lediglich der Beschreibung bestimmter Ausführungsformen und ist nicht als Einschränkung des Beschriebenen zu verstehen. Die in der detaillierten Beschreibung und den beigefügten Ansprüchen verwendeten Singularformen „ein/eine“, und „der/die/das“ schließen auch die Pluralformen ein, sofern aus dem Kontext nicht eindeutig etwas anderes hervorgeht. Es versteht sich auch, dass der Begriff „und/oder“, wie er hier verwendet wird, sich auf alle möglichen Kombinationen von einem oder mehreren der aufgeführten Elemente bezieht und diese umfasst. Es versteht sich ferner, dass die Begriffe „umfasst“ und/oder „umfassend“, wenn sie in dieser Beschreibung verwendet werden, das Vorhandensein der angegebenen Merkmale, ganzen Zahlen, Schritte, Operationen, Elemente und/oder Komponenten spezifizieren, aber nicht das Vorhandensein oder Hinzufügen eines oder mehrerer anderer Merkmale, ganzer Zahlen, Schritte, Operationen, Elemente, Komponenten und/oder Gruppen davon ausschließen.
  • Wie hier verwendet, kann der Begriff „wenn“ je nach Kontext als „wenn“ oder „bei“ oder „als Reaktion auf die Feststellung“ oder „als Reaktion auf die Erkennung“ verstanden werden. Ebenso kann die Formulierung „wenn festgestellt wird“ oder „wenn [ein bestimmter Zustand oder ein bestimmtes Ereignis] festgestellt wird“ je nach Kontext als „bei der Feststellung“ oder „als Reaktion auf die Feststellung“ oder „bei der Feststellung [des bestimmten Zustands oder Ereignisses]“ oder „als Reaktion auf die Feststellung [des bestimmten Zustands oder Ereignisses]“ verstanden werden.
  • Wie hierin verwendet, bezieht sich der Begriff „Zellkontext“ oder „zellulärer Kontext“ auf eine Versuchsbedingung, die ein Aliquot von Zellen eines oder mehrerer Zelltypen und eine chemische Umgebung, ein Kulturmedium und gegebenenfalls eine Teststörung umfasst, mit Ausnahme einer Abfragestörung, die z. B. keine zu untersuchende Verbindung enthält. Das heißt, Kontrollzustände und Testzustände stellen Zellkontexte dar, während Abfrage-Störungszustände Zellkontexte darstellen, die einer Abfrage-Störung ausgesetzt sind. In einigen Ausführungsformen umfasst ein Zellkontext eine genetische oder epigenetische Modifikation, z. B. eine genetische Modifikation, die durch ortsspezifische Mittel wie Crispr eingeführt wird, oder eine epigenetische Modifikation, wie die Einführung einer Kontroll-siRNA.
  • Der hier verwendete Begriff „Kontrollstörung“ bezieht sich auf eine Veränderung in einem Zellkontext, die keinen zellulären Phänotyp hervorruft, der für einen kranken Zellphänotyp repräsentativ ist. In einigen Ausführungsformen wird eine Kontrollstörung verwendet, um Hintergrundrauschen und/oder unbeabsichtigte Auswirkungen einer Teststörung zu kontrollieren. Wenn beispielsweise eine oder mehrere siRNAs, die die Expression eines Zielgens unterdrücken, als Teststörung verwendet werden, können eine oder mehrere siRNAs, die die Expression des Zielgens nicht unterdrücken, als Kontrollstörung verwendet werden, z. B. um alle nicht zielgerichteten Effekte der Verwendung der siRNA als Teststörung zu berücksichtigen.
  • Wie hier verwendet, bezieht sich der Begriff „Kontrollinstanz“, „Kontrollzustand“ oder einfach „Kontrolle“ auf einen Versuchszustand, der nicht gestört ist, um einen Krankheitszustand zu simulieren, und dem eine Abfrage-Störung fehlt (z. B. der nicht mit einem therapeutischen Wirkstoffkandidaten und/oder einer physikalischen Behandlung behandelt wird), deren therapeutische Wirkungen untersucht werden. Das heißt, ein Kontrollzustand ist jeder Zustand, der für einen biologischen Zustand repräsentativ ist, der erreicht wird, wenn eine Verbindung einen entsprechenden gestörten Zellkontext rettet. In einigen Ausführungsformen bezieht sich ein Kontrollzustand auf ein Aliquot von Zellen eines oder mehrerer Zelltypen in einer bestimmten chemischen Umgebung (z. B. Kulturmedium), z. B. einen einzelnen „gesunden“ Zellkontext. In einigen Ausführungsformen bezieht sich ein Kontrollzustand auf durchschnittliche Merkmale eines Aliquots von Zellen eines oder mehrerer Zelltypen in einer Vielzahl von chemischen Umgebungen (z. B. Kulturmedien), z. B. ein Durchschnitt einer Vielzahl von „gesunden“ Zellkontexten, von denen jeder separat in seinen eigenen Vertiefungen getestet wird. In einigen Ausführungsformen wird der „Kontroll“-Zustand durch einen beliebigen Kontext ermittelt, der als „gute Kontrolle“ gilt - d. h. ein Kontext, der möglichst viele oder alle technischen und biologischen Effekte und Verzerrungen beinhaltet, ohne die Wirkung der beabsichtigten biologischen Störung zu verdecken. Bei einigen Experimenten bedeutet dies, dass ein bestimmter Satz von Reagenzien verwendet wird, aus dem Zufallsstichproben gezogen werden, um unspezifische, zufällige biologische Artefakte des experimentellen Ansatzes zu imitieren. Beispielsweise kann in einem Fall, in dem der gestörte Zellkontext die Exposition der Zellen gegenüber einer siRNA einschließt, die die Expression eines bestimmten Gens unterdrückt, ein Kontrollzustand einen oder mehrere Zellkontexte einschließen, in denen die Zellen siRNAs ausgesetzt werden, die die Expression des bestimmten Gens nicht unterdrücken, z. B. siRNAs mit einer oder mehreren Nukleotidänderungen im Vergleich zu der siRNA, die die Expression des bestimmten Gens unterdrücken kann. In anderen Ausführungsformen umfasst ein Kontrollzustand naive, unbehandelte Zellen (die z. B. nicht mit einer störenden siRNA oder einer Kontroll-siRNA behandelt werden), als Kontrolle für die technischen und biologischen Effekte und Verzerrungen des experimentellen Ansatzes. In einigen Ausführungsformen besteht die Schnittmenge all dieser verschiedenen Arten von „gesunden“ Kontrollkontexten darin, dass eine Population von Replikaten und/oder verschiedenen Teststörungen abgetastet wird, um eine Verteilung von Vektoren zu erstellen, die den Zustand der Zellen im Experiment ohne die Abfrage-Störung beschreibt.
  • Wie hier verwendet, bezieht sich der Begriff „Teststörung“ auf eine Veränderung in einem Zellkontext, die einen gestörten zellulären Phänotyp verursacht, z. B. repräsentativ für eine kranke Zelle. In einigen Ausführungsformen umfasst eine Teststörung ein Reagens, das einem Aliquot von Zellen ausgesetzt wird und auf diese einwirkt, z. B. eine siRNA- oder CRISPR-Behandlung, die die Expression eines Gens in der Zelle ausschaltet, eine Verbindung, die einen zellulären Prozess stört (z. B., einen zellulären Signalweg hemmt, einen Stoffwechselweg hemmt, einen zellulären Kontrollpunkt hemmt usw.), ein Toxin, ein CRISPR-Reagenz, ein Signalmolekül, ein Krankheitserreger, ein Signalmolekül oder ein biologisches Präparat (z. B. ein Antikörper oder Enzym). In einigen Ausführungsformen umfasst eine Teststörung eine physikalische Änderung des Zellkontexts, z. B. eine Temperaturänderung und/oder eine Änderung der umgebenden chemischen Umgebung (z. B. eine Änderung der Nährstoffzusammensetzung eines Zellkulturmediums, in dem ein Zellkontext wächst).
  • Der hier verwendete Begriff „gestörter Zellkontext“, „Teststörungszustand“ oder einfach „Testzustand“ bezieht sich auf eine Versuchsbedingung (z. B. Zellkontext), die gestört ist, um einen Krankheitszustand zu simulieren, und in der eine Verbindung, deren therapeutische Wirkungen untersucht werden, fehlt oder deutlich fehlt. In einigen Ausführungsformen unterscheidet sich die Zusammensetzung eines Testzustands von der Zusammensetzung eines entsprechenden Kontrollzustands nur durch die Einbeziehung einer Teststörung. In anderen Ausführungsformen, in denen ein entsprechender Kontrollzustand eine Kontrollstörung enthält, unterscheidet sich die Zusammensetzung eines Testzustands von der Zusammensetzung des Kontrollzustands auf der Grundlage der gezielten Wirkungen der Teststörung, die nicht durch die Kontrollstörung verursacht werden.
  • Wie hier verwendet, bezieht sich der Begriff „Abfragestörung“ auf einen Therapiekandidaten, der auf seine Wirksamkeit gegenüber einer Teststörung untersucht wird. In einigen Ausführungsformen umfasst eine Abfragestörung eine Verbindung oder eine Kombination von Verbindungen, z. B. ein oder mehrere mögliche therapeutische Mittel. Wie hier verwendet, umfasst der Begriff „Verbindung“ sowohl chemische Verbindungen mit kleinen Molekülen als auch biologische Therapeutika. In einigen Ausführungsformen umfasst eine Abfragestörung eine physikalische Behandlung, z. B. eine Temperaturbehandlung, eine Strahlenbehandlung und/oder eine Änderung der umgebenden chemischen Umgebung (z. B. eine Änderung der Nährstoffzusammensetzung eines Zellkulturmediums, in dem ein Zellkontext wächst). Nicht einschränkende Beispiele für Abfragestörungen sind siRNA, Gentherapien, Hitzeschock, eine chemische Verbindung, ein Biologikum, Zelltherapien und Kombinationen davon. In einigen Ausführungsformen umfasst eine Abfragestörung sowohl eine Verbindung (z. B. ein kleines Molekül oder ein biologisches Mittel) oder eine Kombination von Verbindungen als auch eine physikalische Behandlung.
  • Der hier verwendete Begriff „Abfrage-Störungszustand“ bezieht sich auf einen Versuchszustand, der gestört ist, um einen Krankheitszustand zu simulieren, und der einer Abfrage-Störung ausgesetzt ist. Im Allgemeinen unterscheidet sich die Zusammensetzung eines Abfrage-Störungszustands von einem entsprechenden Testzustand nur durch die Exposition gegenüber der Abfrage-Störung, z. B. durch die Zugabe eines Arzneimittelkandidaten. Dementsprechend bezieht sich ein Abfrage-Störungs-Aliquot von Zellen, das eine entsprechende Teststörung repräsentiert, auf eine physische Probe des Teststörungszustands, die der Abfrage-Störung ausgesetzt wird. In einigen Ausführungsformen unterscheidet sich der Abfrage-Störungszustand von einem entsprechenden Testzustand auch durch den Einschluss einer Substanz, die zur Bereitstellung der Abfrage-Störung erforderlich ist, z. B. ein Lösungsmittel wie DMSO. In einigen Ausführungsformen ist jedoch jede derartige Substanz, die für die Übermittlung der Abfragestörung erforderlich ist, auch im Testzustand enthalten, z. B. wenn DMSO als Lösungsmittel für einen Arzneimittelkandidaten verwendet wird, wird DMSO (in Abwesenheit des Arzneimittelkandidaten) auch dem Testzustand hinzugefügt.
  • Methoden und Systeme für das Screening von Verbindungen
  • Im Folgenden wird im Detail auf Ausführungsformen Bezug genommen, von denen Beispiele in den beigefügten Zeichnungen dargestellt sind. In der folgenden detaillierten Beschreibung werden zahlreiche spezifische Details dargelegt, um ein umfassendes Verständnis der vorliegenden Offenbarung zu ermöglichen. Einem Fachmann wird es jedoch klar sein, dass die vorliegende Offenbarung auch ohne diese spezifischen Details durchgeführt werden kann. In anderen Fällen wurden bekannte Methoden, Verfahren, Komponenten, Schaltungen und Netzwerke nicht im Detail beschrieben, um Aspekte der Ausführungsformen nicht unnötig zu verschleiern.
  • Unter Bezugnahme auf 1 stellt die vorliegende Offenlegung ein Verfahren 100 zum Screening einer oder mehrerer Therapien (hier auch als Abfragestörungen bezeichnet), z. B. chemischer Verbindungen, auf der Grundlage der On-Target- und Off-Target-Effekte bereit, wenn ein oder mehrere gestörte Zellkontexte den Abfragestörungen ausgesetzt werden. In einigen Ausführungsformen umfasst das Verfahren 100 die Gewinnung (108) von Kontrollmerkmalsvektoren (z. B. Kontrolldatenpunkte 274 aus 2C) für Kontrollzustände, z. B. für Zellkontexte, die für einen „gesunden“ Phänotyp repräsentativ sind. Der Kontrollmerkmalsvektor wird aus Merkmalen konstruiert, die aus Messungen von Merkmalen des Kontrollzustands abgeleitet sind, wobei die Merkmale des Vektors z. B. eine direkte Messung eines bestimmten Merkmals des Kontrollzustands, eine dimensionsreduzierte Komponente solcher Messungen und/oder ein komplexes Merkmal (z. B. eine algorithmische Kombination mehrerer Messungen) umfassen, das durch Deep Learning bestimmt wird. In einigen Ausführungsformen stellt jede Dimension des Vektors ein Maß für die zentrale Tendenz eines anderen Merkmals dar, das von Merkmalen abgeleitet ist, die über eine Vielzahl von Instanzen des Kontrollzustands (z. B. Replikate und/oder Instanzen verwandter Kontrollzellkontexte) gemessen wurden. In einigen Ausführungsformen umfasst das Verfahren auch die Messung (102) der Merkmale einer Vielzahl von Kontrollinstanzen (z. B. Replikate oder separate Instanzen verwandter Kontrollzellenkontexte) eines oder mehrerer Kontrollzustände, um Kontrollstörungsdaten 224 zu erzeugen, die zur Konstruktion des Kontrollmerkmalsvektors 276 verwendet werden.
  • Verfahren 100 umfasst auch die Gewinnung (110) von Testmerkmalsvektoren (z. B. Testdatenpunkte 278) für Teststörungszustände, z. B. gestörte Zellkontexte, die für einen „kranken Phänotyp“ repräsentativ sind. Der Testmerkmalvektor wird aus Merkmalen konstruiert, die aus Messungen von Merkmalen des Testzustands abgeleitet werden (z. B. dem gestörten Zellkontext in Abwesenheit einer Abfrage-Störung). In einigen Ausführungsformen stellt jede Dimension des Vektors ein Maß für die zentrale Tendenz eines anderen Merkmals dar, das von Merkmalen abgeleitet ist, die über eine Vielzahl von Instanzen des Testzustands (z. B. Replikate und/oder Instanzen verwandter gestörter Zellkontexte) gemessen wurden. In einigen Ausführungsformen umfasst das Verfahren auch die Messung (104) der Merkmale einer Vielzahl von Testinstanzen (z. B. Replikate oder separate Instanzen verwandter Testzellkontexte) eines oder mehrerer Testzustände, um Teststörungsdaten 228 zu erzeugen, die zur Konstruktion des Testmerkmalsvektors 280 verwendet werden.
  • Verfahren 100 umfasst auch die Gewinnung (112) von Abfragemerkmalsvektoren (z. B. Abfragedatenpunkte 282) für Abfrage-Störungszustände, z. B. gestörte Zellkontexte, die einer möglichen Therapie, z. B. einer chemischen Verbindung, ausgesetzt sind. Der Abfrage-Merkmalsvektor wird aus Merkmalen konstruiert, die aus Messungen von Merkmalen des Abfragezustands abgeleitet sind (z. B. der gestörte Zellkontext, der einer Abfrage-Störung ausgesetzt wurde). In einigen Ausführungsformen stellt jede Dimension des Vektors ein Maß für die zentrale Tendenz eines anderen Merkmals dar, das von Merkmalen abgeleitet ist, die über eine Vielzahl von Instanzen des Abfragezustands (z. B. Replikate und/oder Instanzen verwandter gestörter Zellkontexte, die einer Abfrage-Störung ausgesetzt waren) gemessen wurden. In einigen Ausführungsformen umfasst das Verfahren auch die Messung (106) der Merkmale einer Vielzahl von Abfrageinstanzen (z. B. Replikate oder separate Instanzen verwandter Testzellkontexte, die einer Abfragestörung ausgesetzt sind) eines oder mehrerer Testzustände, um Abfragestörungsdaten 232 zu erzeugen, die zur Konstruktion des Abfragemerkmalsvektors 284 verwendet werden.
  • Das Verfahren 100 umfasst dann die Bildung (114) eines zusammengesetzten Testvektors (z. B. zusammengesetzter Testvektor 292 in 2D; Vektor 510 zwischen den Punkten 502 und 504, wie in 5 dargestellt) für jede Störung in jedem Zellkontext, basierend auf den Unterschieden zwischen dem Wert jeder Dimension des Kontrollmerkmalsvektors 276 und dem Wert jeder Dimension des Testmerkmalsvektors 280 für entsprechende Kontrollzustände und Testzustände. Das Verfahren umfasst auch die Bildung (116) eines zusammengesetzten Abfragevektors (z. B. zusammengesetzter Abfragevektor 296 in 2D; Vektor 512 zwischen den Punkten 502 und 506, wie in 5 dargestellt) für jede Verbindung, die jedem gestörten Zellkontext ausgesetzt ist, basierend auf den Unterschieden zwischen dem Wert jeder Dimension des Kontrollmerkmalsvektors 276 und dem Wert jeder Dimension des Abfragemerkmalsvektors 284 für entsprechende Kontrollzustände und Abfragezustände. Andere Vektoren, wie der Vektor 514 zwischen den Punkten 502 und 508, können ebenfalls aus den Vektordaten berechnet werden.
  • Das Verfahren 100 umfasst dann die Berechnung (118) eines On-Target-Werts für jede Verbindung, die jedem Abfragezustand ausgesetzt ist, z. B. durch die Projektion des zusammengesetzten Abfragevektors 284 auf den zusammengesetzten Testvektor 280 (z. B. Projektion 516 in 5). Das Verfahren umfasst auch die Berechnung (120) eines Off-Target-Werts für jede Verbindung, die jedem Abfragezustand ausgesetzt ist, z. B. durch die Ablehnung des zusammengesetzten Abfragevektors 284 auf dem zusammengesetzten Testvektor 280 (z. B. Ablehnung 518 in 5). In einigen Ausführungsformen werden unterschiedliche On-Target- und/oder Off-Target-Werte für eine bestimmte Abfragestörung erzeugt, indem ein zusammengesetzter Abfragevektor mit verschiedenen Testvektoren verglichen (z. B. projiziert und/oder zurückgewiesen) wird, die z. B. für einen Teilkrankheitskontext oder für eine bekannte Wirksamkeit und/oder Nebenwirkung erzeugt wurden. Durch Projektion eines zusammengesetzten Abfragevektors, der für eine untersuchte Störung konstruiert wurde, auf einen zusammengesetzten Abfragevektor, der für eine Verbindung mit einer bekannten klinischen Wirkung konstruiert wurde, und/oder umgekehrt, kann beispielsweise eine Vorhersage über die klinische Wirkung der untersuchten Störung getroffen werden. Wenn beispielsweise die Projektion des zusammengesetzten Abfragevektors, der für eine untersuchte Störung konstruiert wurde, gleich der Größe des zusammengesetzten Abfragevektors ist, der für eine Verbindung mit einer bekannten klinischen Wirkung konstruiert wurde, kann vorhergesagt werden, dass die untersuchte Störung eine mindestens ebenso wirksame Wirkung auf den Krankheitszustand haben wird wie die Verbindung mit der bekannten klinischen Wirkung. In ähnlicher Weise kann durch Zurückweisen eines zusammengesetzten Abfragevektors, der für eine zu überprüfende Störung konstruiert wurde, auf einen zusammengesetzten Abfragevektor, der für eine Verbindung mit einer bekannten Nebenwirkung konstruiert wurde, und/oder umgekehrt, eine Vorhersage über die klinischen Off-Target-Effekte der zu überprüfenden Störung gemacht werden. Wenn beispielsweise die Größe der resultierenden Ablehnung gering ist, kann vorhergesagt werden, dass die untersuchte Störung ein ähnliches klinisches Off-Target-Profil wie die bekannte Verbindung aufweist. Wird die Größe der resultierenden Ablehnung hingegen größer, kann vorhergesagt werden, dass sich das klinische Off-Target-Profil der untersuchten Störung deutlich von dem der bekannten Verbindung unterscheidet, z. B. in der Größe der Wirkung und/oder der Art der Wirkung. Eine Zusammenfassung der Vektormathematik, einschließlich Projektionen und Verwerfungen von mehrdimensionalen Vektoren, findet sich in Vector Analysis, Louis Brand, Dover Publications, Inc. (2006), dessen Inhalt hier ausdrücklich und für alle Zwecke in vollem Umfang berücksichtigt wird.
  • Verfahren 100 umfasst dann die Auswertung (122) des On-Target-Werts und des Off-Target-Werts für jede Verbindung, die jeder Abfrage-Störung ausgesetzt ist. In einigen Ausführungsformen umfasst die Auswertung das Auftragen (124) des On-Target-Werts und des Off-Target-Werts für jede Verbindung im Kontext des Krankheitsmodells als (x,y)-Koordinate (z.B. dargestellt als Dreiecke in 6 und 7A. In einigen Ausführungsformen umfasst die Auswertung auch das Auftragen (126) von On-Target- und Off-Target-Werten für jeden Kontrollzustand (z. B. repräsentativ für einen „gesunden Zustand“) für jede Instanz eines Kontrollzustands als (x,y)-Koordinate (z. B. wie als Quadrate in 6 und 7A-7C dargestellt). In einigen Ausführungsformen umfasst die Auswertung auch das Auftragen (128) von On-Target- und Off-Target-Werten für jeden Testzustand (z. B. repräsentativ für einen „kranken Zustand“) oder jede Instanz eines Testzustands als (x,y)-Koordinate (z. B. wie als Kreise in den 6 und 7A-7C dargestellt).
  • Auf diese Weise wird die Fähigkeit einer Therapie (z. B. eines Wirkstoffs), einen Krankheitsphänotyp zu behandeln, als die Nähe eines Punktes, der die On-Target- und Off-Target-Effekte des Wirkstoffs darstellt, zu Punkten, die Kontrollzustände und Punkte, die Krankheitszustände darstellen, visualisiert. Das heißt, je näher der Punkt, der den Abfragezustand repräsentiert, an den Punkten liegt, die für den Kontrollzustand stehen, desto größer ist die Wirkung, die der Wirkstoff auf den erkrankten Phänotyp hatte, und umgekehrt. In ähnlicher Weise werden die Off-Target-Effekte, die der Wirkstoff auf die Zellkontexte hatte, als Höhe (y-Wert) des Punktes im Verhältnis zur Höhe der Punkte, die die Kontrollzustände darstellen, dargestellt. Das heißt, je höher der Punkt auf der y-Achse ist, desto größer ist die Auswirkung der Abfrage-Störung auf die Phänotypen der Zellen, die nicht mit den Krankheitsphänotypen zusammenhängen, z. B. Nebenwirkungen.
  • In einigen Ausführungsformen umfasst die Auswertung die Vorhersage (130) eines therapeutischen Fensters für eine Verbindung, zum Beispiel durch Auftragen der On-Target- und Off-Target-Werten für gestörte Zellkontexte, die steigenden Konzentrationen einer Verbindung ausgesetzt sind (d. h. Abfragezustände mit erhöhten Konzentrationen einer Verbindung). Wie in den 8B und 8C dargestellt, können beispielsweise Dosis-Wirkungs-Kurven verwendet werden, um therapeutische Fenster zu finden, in denen ein Wirkstoff einen großen On-Target-Effekt (z. B. Verschiebung von Punkten weg von Krankheitsphänotypen und hin zu gesunden Phänotypen) mit einem relativ kleinen Off-Target-Effekt (z. B. Vermeidung von Konzentrationen, bei denen der Off-Target-Effekt den Punkt von den gesunden Phänotypen wegschiebt) bietet. In ähnlicher Weise können, wie in 8 gezeigt, On-Target- und Off-Target-Werte getrennt aufgetragen und Regionen identifiziert werden, die On-Target-Effekte maximieren und Off-Target-Effekte minimieren. In einigen Ausführungsformen ist die bewertete Region beispielsweise ein Bereich, der durch die oberen Grenzen des On-Target-Werts („Krankheit“) und des Off-Target-Werts („Nebenwirkung“) definiert ist, z. B. der Bereich 809, wie in 8B dargestellt. In einigen Ausführungsformen ist der bewertete Bereich eine Differenz zwischen dem On-Target-Wert („Krankheit“) und dem Off-Target-Wert („Nebenwirkung“) an einem einzigen Punkt, z. B. die Differenz 815 zwischen den Punkten 811 und 813, wie in 8B dargestellt. In anderen Ausführungsformen ist der bewertete Bereich eine algebraische Kombination aus verschiedenen Bereichen, die aus den Differenzen zwischen dem On-Target-Wert („Krankheit“) und dem Off-Target-Wert („Nebenwirkung“) gebildet werden.
  • In einigen Ausführungsformen umfasst die Auswertung die Vorhersage (132) einer Rettungsqualität, z. B. wie unten in Bezug auf die Schritte 4120 und 4122 des Verfahrens 4000 beschrieben. In einigen Ausführungsformen umfasst die Auswertung die Bewertung (134) der Assay-Qualität, z. B. wie unten in Bezug auf die Schritte 4124 und andere des Verfahrens 4000 beschrieben.
  • In einigen Fällen können die Bildgebungsdaten mit Bioassay-Datensätzen kombiniert werden, um die Bewertung von Arzneimittelkandidaten weiter zu verbessern. Zum Beispiel können in einigen Ausführungsformen Bioassay-Toxizitätsdaten verwendet werden, um Arzneimittelkandidaten zu identifizieren, die möglicherweise toxische Off-Target-Effekte haben. Ebenso können in einigen Ausführungsformen Daten zur Absorption, Verteilung, zum Stoffwechsel und zur Ausscheidung (ADME) verwendet werden, um die potenzielle Bioverfügbarkeit von Arzneimittelkandidaten zu bewerten. In einigen Fällen können Daten zum Zellschicksal verwendet werden, um die Wirkung eines Arzneimittelkandidaten auf das Wachstum einer Zielzelle zu ermitteln. In einigen Ausführungsformen können Pfad- und/oder mechanistische Daten verwendet werden, um den Wirkmechanismus eines Wirkstoffkandidaten zu bewerten. Nicht einschränkende Beispiele für Bioassays, die sich für die Erhebung dieser Arten von Daten eignen, sind in Tabelle 1 aufgeführt. Tabelle 1 - Beispiel-Assays für die Erstellung von Bioassay-Daten zur Ergänzung von phänomischen Bildgebungsdaten.
    Art des Assays Beispiel-Assay
    Toxizitätsassays
    Mitochondriale Toxizität Glu/Gal-Assay
    Genomische Toxizität DNA-Schädigung yH2AX-Assay
    AMES-II-Assay
    Mikro-Nuklearitätsassay
    Medikamenteninduzierte Leberschäden 3D-Sphäroid-Assay
    Assay zur Lebensfähigkeit von Hepatozyten
    Kardiale Toxizität hERG-Assay
    3D-Kardiomyozyten-Modell
    COX-Assay
    Neurotoxizität 3D-Neuro-Modell
    Nierentoxizität 3D-Nieren-Modell
    Art des Assays Beispiel-Assay
    ADME-Assays
    Wechselwirkungen zwischen Drogen und Medikamenten Assay zur Hemmung und Induktion von Cyp450
    Biodistribution Assay der Blut-Hirn-Schranke (BBB)
    Assay auf Epithelpermeabilität
    Wechselwirkungen zwischen Transportern PGP-Assay
    PSAP-Assay
    Wechselwirkungen zwischen Plasmaproteinen Serumverschiebungsassay
    Zellschicksal-Assays
    Zellzyklus-Assay (G1, S, G2)
    Quieszenz (G0) Assays
    Mitose-Index
    Multinuklearität
    Apoptose Assay auf gespaltene Caspase 3
    Morphologie des Zellkerns
    Lebensfähigkeit der Zellen Anzahl der Zellen
    CellTiter-Glo
    WST-8-Assay
    Pathway / Mechanistische Assays
    Immunofluoreszenz / Pathway Markierungen
    Transkriptomik
    Synthetische Interaktionsassays
  • Eine detaillierte Beschreibung eines Systems 250 zum Screening einer oder mehrerer Verbindungen auf der Grundlage von On-Target- und Off-Target-Effekten bei Exposition gegenüber einem oder mehreren gestörten Zellkontexten wird in Verbindung mit den 2A, 2B, 2C und 2D beschrieben. Die 2A, 2B, 2C und 2D veranschaulichen gemeinsam die Topologie eines Systems gemäß einer Ausführungsform der vorliegenden Offenbarung. In der Topologie gibt es Module für das Screening von Verbindungen auf On-Target-Effekte und Off-Target-Effekte, die für die Identifizierung von therapeutischen Kandidatenverbindungen und vorteilhaften therapeutischen Bereichen und spezifischen Konzentrationen für die Verwendung dieser Verbindungen nützlich sind, z. B. auf der Grundlage der Beziehungen zwischen mehrdimensionalen Vektoren, die aus einer Vielzahl von Merkmalen von Kontrollzuständen, Testzuständen und Abfragezuständen gebildet werden. Die Erzeugung der verschiedenen mehrdimensionalen Vektoren, der Vergleich der geometrischen Eigenschaften der mehrdimensionalen Vektoren und die Identifizierung von Wirkstoffkandidaten auf der Grundlage der geometrischen Beziehungen wird, wie weiter unten beschrieben, vom System 250 der 2A durchgeführt.
  • Wie in 2A dargestellt, umfasst das System 250 in typischen Ausführungsformen einen oder mehrere Computer. Zur Veranschaulichung in 2A wird das System 250 als ein einzelner Computer dargestellt, der die gesamte Funktionalität für das Screening einer oder mehrerer Verbindungen auf der Grundlage von On-Target- und Off-Target-Effekten bei Exposition gegenüber einem oder mehreren gestörten Zellkontexten umfasst. Die Offenbarung ist jedoch nicht so begrenzt. In einigen Ausführungsformen ist die Funktionalität für das Screening einer oder mehrerer Verbindungen auf der Grundlage von On-Target- und Off-Target-Effekten bei Exposition gegenüber einem oder mehreren gestörten Zellkontexten über eine beliebige Anzahl von vernetzten Computern verteilt und/oder befindet sich auf jedem von mehreren vernetzten Computern und/oder wird auf einer oder mehreren virtuellen Maschinen an einem entfernten Standort gehostet, der über das Kommunikationsnetz 252 zugänglich ist. Der Fachmann wird verstehen, dass für die Anwendung eine Vielzahl unterschiedlicher Computertopologien verwendet werden kann, und dass alle diese Topologien in den Anwendungsbereich der vorliegenden Offenbarung fallen.
  • Vor diesem Hintergrund umfasst ein Beispielsystem 250 zum Screening einer oder mehrerer Verbindungen auf der Grundlage von On-Target- und Off-Target-Effekten, wenn sie einer oder mehreren gestörten Zellkontexten ausgesetzt werden, eine oder mehrere Verarbeitungseinheiten (CPUs) 253, eine Netzwerk- oder andere Kommunikationsschnittstelle 244, einen Speicher 254 (z.B.. Speicher mit wahlfreiem Zugriff), eine oder mehrere Magnetplattenspeicher- und/oder dauerhafte Vorrichtungen 251, auf die optional von einem oder mehreren Controllern 258 zugegriffen wird, einen oder mehrere Kommunikationsbusse 213 zur Verbindung der vorgenannten Komponenten, eine Benutzerschnittstelle 248, wobei die Benutzerschnittstelle 248 umfasst: eine Anzeige 242 und eine Eingabe 240 (z.B., Tastatur, Keypad, Touchscreen), und eine Stromversorgung 246 zur Versorgung der genannten Komponenten. Die Anzeige 242 oder eine andere ähnliche Anzeige kann zum Plotten von Ergebnissen und/oder zur Anzeige von geplotteten Informationen als interaktive grafische Benutzeroberfläche verwendet werden. In einigen Ausführungsformen werden die Daten im Speicher 254 nahtlos mit dem nichtflüchtigen Speicher 251 gemeinsam genutzt, wobei bekannte Rechentechniken wie Caching zum Einsatz kommen. In einigen Ausführungsformen umfasst der Speicher 254 und/oder der Speicher 251 einen Massenspeicher, der sich in Bezug auf die zentrale(n) Verarbeitungseinheit(en) 253 an einem anderen Ort befindet. Mit anderen Worten, einige Daten, die im Speicher 254 und/oder im Speicher 251 gespeichert sind, können tatsächlich auf Computern gehostet werden, die sich außerhalb des Systems 250 befinden, auf die das System 250 jedoch über ein Internet, Intranet oder eine andere Form von Netzwerk oder elektronischem Kabel (in 2A als Element 252 dargestellt) unter Verwendung der Netzwerkschnittstelle 244 elektronisch zugreifen kann.
  • In einigen Ausführungsformen speichert der Speicher 254 des Systems 250 zum Screening einer oder mehrerer Verbindungen auf der Grundlage von On-Target- und Off-Target-Effekten, wenn sie einem oder mehreren gestörten Zellkontexten ausgesetzt werden:
    • • ein Betriebssystem 202, das Verfahren zur Handhabung verschiedener grundlegender Systemdienste enthält;
    • • ein Störungsvektor-Konstruktionsmodul 204, z.B. zum Erzeugen von KontrollMerkmalsvektoren/Kontrolldatenpunkten (108; 4002), TestMerkmalsvektoren/Testdatenpunkten (110; 4034) und AbfrageMerkmalsvektoren/Abfrage-Störungsdatenpunkten (112; 4050) und/oder Berechnen eines zusammengesetzten Testvektors (114; 4048, z.B, Vektor 510 in 5) und eines zusammengesetzten Abfragevektors (116; 4060, z. B. Vektor 512 in 5) und/oder Berechnung eines Kontrollvektors (4070; 4076) und/oder Berechnung eines Testvektors (4082; 4088 (4J));
    • • ein Störungsbewertungsmodul 206 zur Berechnung von z. B. On-Target-Werte für eine Abfrage-Störung (118; 4062, z. B. On-Target-Wert 516 in 5), Off-Target-Werte für eine Abfrage-Störung (120; 4064, z. B., Off-Target-Wert 518 in 5), On-Target-Wert für einen Kontrollvektor oder eine Kontrollstörung (4072; 4078), Off-Target-Werte für einen Kontrollvektor oder eine Kontrollstörung (4074; 4080), On-Target-Werte für einen Testvektor oder eine Teststörung (4084; 4090 (4J)), Off-Target-Werte für einen Kontrollvektor oder eine Kontrollstörung (4086; 4092 (4J))
    • • ein Modul 208 zur Darstellung von Störungswerten, zur Auftragung von On-Target-Werten und Off-Target-Werten als (x,y)-Koordinaten, z.B. von Abfragestörungen (124; 4068, z.B. dargestellt als Dreiecke in 6, 7A und 7B), Kontrollstörungen (4074; 4080, z.B. dargestellt als Quadrate in den 6, 7A und 7B) und Teststörungen (4086; 4093, z.B., dargestellt als Kreise in den 6, 7A und 7B) und/oder getrennt als Funktion der Konzentration der Abfrageverbindung (4112, z. B. dargestellt als On-Target-Dosis-Wirkungs-Kurven 802, 806, 810, 814, 818 und 822 und Off-Target-Dosis-Wirkungs-Kurven 804, 808, 812, 816, 820 und 824 in den 8A, 8B, 8C, 8D, 8E, 8F bzw. 8G);
    • • ein Modul 210 zur Vorhersage des therapeutischen Fensters, z. B. zur Quantifizierung eines therapeutischen Fensters für eine abgefragte Verbindung (4P; 4114; 4116; und 4118);
    • • ein Rescue-Bewertungsmodul 212, z. B. zur Quantifizierung der Rescue-Qualität für eine Abfrageverbindung (4120; 4122);
    • • ein Assay-Qualitätsbewertungsmodul 214, z. B. zur Berechnung einer normalisierten Dichtheit von Testzustandsdatenpunkten (4142; 4182) und/oder zur Berechnung einer Gesamtqualität des Assays (4184);
    • • eine Merkmalsmessungsdatenbank 220 (in 2B detaillierter dargestellt), z.B. zum Speichern von zusammengesetzten Störungsdatensätzen 222, einschließlich Kontrollkennwertmessungen 226 für Kontrollstörungsdatensätze 224, Testkennwertmessungen 230 für Teststörungsdatensätze 228 und Abfragecharakterisierungsmessungen 234 für Abfragestörungsdatensätze 232;
    • • eine Abfrage-Störungsdatenpunkt-Datenbank 270 (in 2C detaillierter dargestellt), z. B. zum Speichern von Datenpunkten (z. B. als mehrdimensionale Vektoren) 272 für Abfrageverbindungen, einschließlich Kontrolldatenpunkten 274, Testdatenpunkten 278 und Abfragedatenpunkten 282 (alle aus 2C); und
    • • eine zusammengesetzte Vektordatenbank 286 (ausführlicher in 2D dargestellt), z. B. zum Speichern von zusammengesetzten Abfrage-Störungsvektoren 288, einschließlich zusammengesetzter Testvektoren 290 und zusammengesetzter Abfragevektoren 294 (alle in 2D); und
    • • eine Datenbank für Störungsergebnisse und Reaktionsdiagramme 260, z. B. zum Speichern von On-Target- und Off-Target-Ergebnissen und Diagrammen von On-Target- und Off-Target-Ergebnissen.
  • In einigen Ausführungsformen sind die Module 204, 206, 208, 210, 212 und/oder 214 über jeden Browser (Telefon, Tablet, Laptop/Desktop) zugänglich. In einigen Ausführungsformen laufen die Module 204, 206, 208, 210, 212 und/oder 214 auf nativen Geräte-Frameworks und sind zum Herunterladen auf das System 250 verfügbar, auf dem ein Betriebssystem 202 wie Android oder iOS läuft.
  • In einigen Ausführungsformen werden eines oder mehrere der oben identifizierten Datenelemente oder Module des Systems 250 zum Screening einer oder mehrerer Verbindungen auf der Grundlage von On-Target- und Off-Target-Effekten, wenn sie einem oder mehreren gestörten Zellkontexten ausgesetzt werden, in einem oder mehreren der zuvor beschriebenen Speichergeräte gespeichert und entsprechen einem Satz von Anweisungen zur Durchführung einer oben beschriebenen Funktion. Die oben genannten Daten, Module oder Programme (z. B. Sätze von Anweisungen) müssen nicht als separate Softwareprogramme, Prozeduren oder Module implementiert werden, und daher können verschiedene Teilmengen dieser Module in verschiedenen Implementierungen kombiniert oder anderweitig neu angeordnet werden. In einigen Ausführungsformen speichert der Speicher 254 und/oder 251 optional eine Teilmenge der oben genannten Module und Datenstrukturen. Darüber hinaus speichert der Speicher 254 und/oder 251 in einigen Ausführungsformen zusätzliche, oben nicht beschriebene Module und Datenstrukturen.
  • In einigen Ausführungsformen ist das System 250 zum Screening einer oder mehrerer Verbindungen auf der Grundlage von On-Target- und Off-Target-Effekten, wenn es einem oder mehreren gestörten Zellkontexten ausgesetzt wird, ein Smartphone (z. B. ein iPHONE), ein Laptop, ein Tablet-Computer, ein Desktop-Computer oder eine andere Form eines elektronischen Geräts. In einigen Ausführungsformen ist das System 250 nicht mobil. In einigen Ausführungsformen ist das System 250 ein mobiles Gerät, das von Menschen getragen werden kann (z. B. von einem Menschen getragen, in der Hand gehalten, in einer Tasche der Kleidung eines Menschen transportiert, von einem Menschen in einem Rucksack getragen usw.).
  • 3 zeigt einen beispielhaften Arbeitsablauf 300 zur Erfassung von Messungen verschiedener Merkmale für das Screening einer oder mehrerer Verbindungen auf der Grundlage von On-Target- und Off-Target-Effekten, wenn sie einem oder mehreren gestörten Zellkontexten ausgesetzt werden, in Übereinstimmung mit verschiedenen Ausführungsformen der vorliegenden Offenbarung. In einigen Ausführungsformen stützt sich die vorliegende Offenbarung auf die Erfassung eines Datensatzes 222, der Messungen einer Vielzahl von Merkmalen 308 (z. B. Messungen von Kontrollmerkmalen 226, Messungen von Testmerkmalen 230 und Messungen von Abfragemerkmalen 234) für Kontrollzustände (z. B. „normale“ Zellkontexte), Teststörungszustände (z. B, „Krankheits“-Zellkontexte, die keinem therapeutischen Wirkstoffkandidaten ausgesetzt sind) und Abfrage-Störungszustände (z. B. „Krankheits“-Zellkontexte, die einem therapeutischen Wirkstoffkandidaten ausgesetzt sind) für einen oder mehrere therapeutische Wirkstoffkandidaten in einer oder mehreren Wiederholungen, in einem oder mehreren Zellkontexten und in einer oder mehreren Konzentrationen. Beispielsweise wird jede Kandidatenverbindung i aus einer Vielzahl von M Verbindungen in Vertiefungen einer Multiwell-Platte 302 (z. B. 302-1 ... 302-P) in jeder von k Konzentrationen für jeden von l gestörten Zellkontexten in j Instanzen eingebracht (wenn die Abfrage-Störung durch einen einzelnen Zellkontext repräsentiert wird, der in einer einzigen Weise gestört wurde, ist eine Instanz dasselbe wie eine Wiederholung; wenn die Abfrage-Störung durch einen oder mehrere Zellkontexte repräsentiert wird, die in verwandten Weisen gestört wurden (z. B., jede davon kann in Wiederholungen durchgeführt werden), stellt eine Instanz eine einzelne Versuchsbedingung innerhalb eines Satzes verschiedener Versuchsbedingungen dar, die zusammen den Abfragezustand repräsentieren), was zu X Vertiefungen führt, die Verbindung i enthalten, wobei X=(j)*(k)*(l). Es werden dann N Merkmale aus jeder Vertiefung {1 ... Q} einer jeden Multiwell-Platte {1 ... P} gemessen, so dass sich N*M*X* Abfragekennwerte für die Kandidatenverbindungen ergeben. Zusätzlich werden C = (m)*(n) Messungen von Kontrollmerkmalen und T= (o)*(l) Messungen von Testmerkmalen durchgeführt, wobei m Instanzen ohne Verbindung in n Kontrollzuständen und o Instanzen ohne Verbindung in den / gestörten Zellkontexten gemessen werden, wobei zu beachten ist, dass jede Instanz eine Wiederholung oder eine einzelne Versuchsbedingung in einer Vielzahl von Versuchsbedingungen darstellen kann, die zusammen den Kontrollzustand oder den Testzustand darstellen. Es kann eine Vielzahl von Multiwell-Platten 302 verwendet werden. Die charakteristischen Messungen werden dann verwendet, um die Merkmale zu erzeugen, aus denen die mehrdimensionalen Datenpunkte bestehen.
  • Wie hier im Einzelnen beschrieben, entsprechen Kontrollzustände in einigen Ausführungsformen ungestörten Zellkontexten, z. B. denselben Zellkontexten, die für die Abfragecharakterisierungsmessungen und Testabfragemessungen ohne die Störung verwendet werden (z. B. nicht einer siRNA ausgesetzt, die die Genexpression in den Test- und Abfrageassays unterdrückt). In anderen Ausführungsformen entsprechen die Kontrollzustände anderen Kontexten, die für einen „gesunden“ Phänotyp repräsentativ sind, aber einer oder mehreren Kontrollstörungen (z. B. Substanzen, Mutationen oder physikalischen Bedingungen) ausgesetzt werden können, z. B. einem Off-Target-siRNA-Molekül, um beispielsweise Hintergrundvariabilität oder Rauschen zu berücksichtigen. In einigen Ausführungsformen werden charakteristische Messungen eines Kontrollzustands, die den Test- und Abfragezuständen entsprechen, aus einer Vielzahl verschiedener Kontrollkontexte entnommen, z. B. um Variabilität und/oder Hintergrundrauschen zu berücksichtigen. Beispielsweise wird in einigen Ausführungsformen ein Kontrollkontext aus mehreren Instanzen von Zellkontexten erstellt, die verschiedenen Off-Target-siRNA-Molekülen ausgesetzt wurden.
  • In einigen Ausführungsformen (siehe 3) werden diese charakteristischen Messungen durch Aufnahme von Bildern 306 (z. B. 306-1 ... 306-P) der Multiwell-Platten 302 unter Verwendung von z. B. Epifluoreszenzmikroskopie 304 erfasst. Die Bilder 306 werden dann als Grundlage für den Erhalt der Messungen der N verschiedenen charakteristischen Messungen von jeder der Vertiefungen in den Multiwell-Platten verwendet, wodurch ein Datensatz 310 (z. B. Datensatz 222) gebildet wird. Der Datensatz 310 wird dann verwendet, um Merkmale und wiederum mehrdimensionale Kontrolldatenpunkte, Testdatenpunkte und Abfragedatenpunkte zu erzeugen, die anschließend zur Erzeugung zusammengesetzter Testvektoren, Abfrage-Störungsvektoren usw. verwendet werden.
  • Nachdem nun Einzelheiten eines Systems 250 zum Screening einer oder mehrerer Verbindungen auf der Grundlage von On-Target- und Off-Target-Effekten bei Exposition gegenüber einem oder mehreren gestörten Zellkontexten offengelegt worden sind, werden Einzelheiten zu einem Flussdiagramm von Prozessen und Merkmalen des Systems gemäß einer Ausführungsform der vorliegenden Offenbarung unter Bezugnahme auf die 4A bis 4AD offengelegt. In einigen Ausführungsformen werden solche Prozesse und Merkmale des Systems durch das Störungsvektor-Konstruktionsmodul 204, das Störungsbewertungsmodul 206, das Störungsbewertungsplotmodul 208, das Modul für die Vorhersage des therapeutischen Fensters 210, das Rettungsbewertungsmodul 212 und/oder das Testqualitätsbewertungsmodul 214 ausgeführt, wie in 2A dargestellt.
  • Unter Bezugnahme auf Verfahren 4000 und die 4A-4AD enthalten die hier beschriebenen Systeme (z.B. System 250) Anweisungen zur Durchführung eines Verfahrens (z.B. Verfahren 100 und/oder 4000 und/oder Teile davon) zum Screening einer oder mehrerer Verbindungen auf der Grundlage von On-Target- und Off-Target-Effekten, wenn sie einem oder mehreren gestörten Zellkontexten ausgesetzt werden, z.B. Auswertung von Abfrage-Störungen in einem zellbasierten Assay, der einen Testzustand darstellt. In einigen Ausführungsformen werden die zellbasierten Assays in einer Vielzahl von Vertiefungen in einer oder mehreren Multiwell-Platten durchgeführt.
  • Bezug nehmend auf die 1, 2A-2D und 4A-4AD bestehen alle oder Teile der hier beschriebenen Ausführungsformen aus computerlesbaren und computerausführbaren Anweisungen, die sich beispielsweise in computerverwendbaren/computerlesbaren Speichermedien eines Computersystems befinden. Das heißt, die 2A-2D illustrieren ein Beispiel für einen Computertyp (Computersystem 250), der in Übereinstimmung mit verschiedenen hier erörterten Ausführungsformen oder zu deren Umsetzung verwendet werden kann. Es ist klar, dass das Computersystem 250 der 2A nur ein Beispiel ist und dass die hier beschriebenen Ausführungsformen auf oder in einer Reihe verschiedener Computersysteme funktionieren können, einschließlich, aber nicht beschränkt auf Allzweck-Computersysteme, vernetzte Computersysteme, eingebettete Computersysteme, Servergeräte, Client-Geräte, verschiedene Zwischengeräte/Knoten, eigenständige Computersysteme, Medienzentren, Handheld-Computersysteme, Multimedia-Geräte, tragbare Computer/Geräte und dergleichen. Das Computersystem 250 der 2A ist gut geeignet, native oder periphere materielle computerlesbare Speichermedien zu verwenden, wie z. B. Speicher/Speicher 251 und/oder 254).
  • Im Folgenden wird die Funktionsweise einiger beispielhafter Verfahren von Ausführungsformen im Detail erläutert. Unter Bezugnahme auf die 1 und 4A-4AD veranschaulichen die Flussdiagramme 100 und 4000 jeweils Beispielverfahren, die von verschiedenen Ausführungsformen verwendet werden können. Die Flussdiagramme 100 und 4000 enthalten einige Prozeduren, die in verschiedenen Ausführungsformen von einem Prozessor (z. B. CPU 253) unter der Kontrolle von computerlesbaren und computerausführbaren Anweisungen ausgeführt werden. Auf diese Weise werden oder können die hier und in Verbindung mit dem Flussdiagramm 100 und/oder 4000 beschriebenen Verfahren in verschiedenen Ausführungsformen mit Hilfe eines Computers implementiert werden. Die computerlesbaren und computerausführbaren Anweisungen können sich in beliebigen computerlesbaren Speichermedien befinden, wie zum Beispiel in Datenspeicherelementen wie dem Speicher/Speicher 251 und/oder 254 (von 2A) oder dergleichen. Die computerlesbaren und computerausführbaren Anweisungen, die sich auf computerlesbaren Speichermedien befinden, werden verwendet, um beispielsweise einen oder eine Kombination von Prozessoren (z. B. CPU 253) oder andere ähnliche Prozessoren zu steuern oder in Verbindung mit ihnen zu arbeiten. Obwohl in den Flussdiagrammen 100 und/oder 4000 spezifische Verfahren offengelegt sind, handelt es sich bei diesen Verfahren um Beispiele. Das heißt, die Ausführungsformen sind gut geeignet, um verschiedene andere Verfahren oder Variationen der in den Flussdiagrammen 100 und/oder 4000 beschriebenen Verfahren durchzuführen. Ebenso können in einigen Ausführungsformen die Verfahren in den Flussdiagrammen 100 und/oder 4000 in einer anderen als der dargestellten Reihenfolge durchgeführt werden und/oder es können nicht alle der in einem oder mehreren dieser Flussdiagramme beschriebenen Verfahren durchgeführt werden. Die in den Flussdiagrammen 100 und/oder 4000 beschriebenen Abläufe können in Hardware, einer Kombination aus Hardware und Firmware oder einer Kombination aus Hardware implementiert werden.
  • Kontrollzustände
  • Zu 4A: Das Verfahren 4000 umfasst das Erhalten (4002) eines entsprechenden Kontrolldatenpunktes für jede entsprechende Kontrollstörung in einem Satz von Kontrollstörungen, wodurch eine Vielzahl von Kontrolldatenpunkten erhalten wird, wobei jeder entsprechende Kontrolldatenpunkt eine Vielzahl von Dimensionen umfasst (z.B. umfasst der Kontrolldatenpunkt 276 eine Vielzahl von Dimensionen, die auf Kontrollstörungsmessungen 226 basieren). In einigen Ausführungsformen stellt jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz eines anderen Merkmals dar, das aus der Messung eines oder mehrerer Merkmale in der Vielzahl von Merkmalen über eine entsprechende Vielzahl von Kontrollaliquoten von Zellen in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen abgeleitet wird, die die jeweilige Kontrollstörung darstellen, z. B. wenn die entsprechende Vielzahl von Kontrollzustandsaliquoten der Zellen einer jeweiligen Kontrollstörung oder überhaupt keiner Störung ausgesetzt wird. Beispielsweise entspricht jede von T Dimensionen des Datenpunkts 276-1-1-1 einem Maß der zentralen Tendenz eines anderen Merkmals, das aus Merkmalsmessungen 226-1-1-1-i-j abgeleitet wurde, wobei i = 1-N Merkmale und j =1-O Instanzen der Kontrollstörung 1 im Kontext 1. In einigen Ausführungsformen umfasst jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz einer jeweiligen Dimensionsreduktionskomponente, die unter Verwendung der Vielzahl von Merkmalen über die entsprechende Vielzahl von Kontrollaliquots der Zellen bestimmt wurde. Zum Beispiel entspricht jede von U Dimensionen des Datenpunkts 276-1-1-1 einem Maß der zentralen Tendenz einer anderen Dimensionsreduktionskomponente, die auf der Grundlage der Vielzahl von Merkmalen berechnet wird, die von Messungen 226-1-1-1-i-j abgeleitet sind, wobei i = 1-N Merkmale und j =1-O Instanzen der Kontrollstörung 1 in Kontext 1.
  • In einigen Ausführungsformen werden die zugrundeliegenden Daten (z. B. zuvor gesammelte charakteristische Kontrollmessungen) erhalten und Kontrolldatenpunkte (z. B. Vektoren von Kontrollmerkmalen) daraus konstruiert, z. B. durch Kombination der für einzelne charakteristische Messungen erhaltenen Daten. In einigen Ausführungsformen werden charakteristische Messungen direkt vom System (z. B. System 250) erfasst, z. B. enthält das System Anweisungen zur Verarbeitung von Bildern, die von Mikrotiter-/Multiwellplatten aufgenommen wurden. In einigen Ausführungsformen werden die Vektoren und/oder die den Vektoren zugrundeliegenden Daten von einer entfernten Quelle bezogen, z. B. über das Netzwerk 252 über die Netzwerkschnittstelle 244.
  • Im Allgemeinen wird der „Kontroll“-Zustand durch alles erfasst, was als „gute Kontrolle“ angesehen wird, z. B. Bedingungen, die ebenso viele oder alle technischen und biologischen Effekte und Verzerrungen wie ein Test- oder Abfragezustand aufweisen, ohne die Wirkung der beabsichtigten biologischen Störung zu verdecken. Bei einigen Experimenten bedeutet dies, dass ein bestimmter Satz von Reagenzien verwendet wird, aus dem Zufallsstichproben gezogen werden, um unspezifische, zufällige biologische Artefakte des experimentellen Ansatzes zu imitieren. In anderen Experimenten werden naive, unbehandelte Zellen verwendet, weil sich so die technischen und biologischen Effekte und Verzerrungen des experimentellen Ansatzes am besten kontrollieren lassen. In wieder anderen Fällen wird eine elterliche Zelllinie oder mit einem bestimmten Puffer behandelte Zellen usw. verwendet. Im Schnittpunkt all dieser verschiedenen Arten von „gesund“ steht die Vorstellung, dass eine Population von Wiederholungen und/oder Störungen wiederholt abgetastet wird, um eine Verteilung von Vektoren zu erstellen, die den Zustand der Zellen im Experiment ohne die abgefragte Störung beschreibt.
  • In einigen Ausführungsformen umfasst der Satz von Kontrollstörungen (z. B. die in den 2A, 2B und 2C dargestellten Kontrollstörungen 1 bis S) eine Vielzahl von Kontroll-siRNA (4004), die die Expression eines mit dem Testzustand verbundenen Gens nicht direkt beeinflussen. In einigen Ausführungsformen stört beispielsweise eine getestete Störung teilweise die Expression eines Gens oder einer Funktion eines Genprodukts, und eine entsprechende Kontrollstörung umfasst eine oder mehrere siRNA, die die Expression des Gens nicht stört. In einer besonderen Ausführungsform umfasst eine getestete Störung die siRNA-vermittelte Unterdrückung der Expression eines Zielgens in einem Hintergrundzellkontext, z. B. mit einer oder mehreren siRNA mit einer Sequenz, die auf das Gen abzielt, und ein entsprechender Kontrollzustand umfasst den Hintergrundzellkontext, der einer oder mehreren siRNA ausgesetzt wird, die nicht auf das Gen abzielt, z. B. eine oder mehrere „Kontroll“-siRNA, die eine oder mehrere Nukleotidänderungen im Vergleich zu der siRNA aufweist, die auf das für die Test- und/oder Abfrage-Störung verwendete Gen abzielt. Auf diese Weise wird eine Kontroll-siRNA zur Kontrolle von Hintergrundeffekten verwendet, z. B. von Effekten, die nicht auf den beabsichtigten Knockdown der Genexpression zurückzuführen sind, sondern auf die Einbeziehung einer Ziel-siRNA, die zur Erzeugung einer Test- und/oder Abfrage-Störung verwendet wird.
  • In einigen Ausführungsformen zielt eine Kontroll-siRNA nicht nur nicht auf das bei der Test- und/oder Abfrage-Störung anvisierte Gen, sondern auch auf kein anderes Gen im Genom des Organismus. In einigen Ausführungsformen, z. B. wenn die bei der Test- und/oder Abfrage-Störung verwendete siRNA teilweise auf ein zweites Gen (z. B. unbeabsichtigt) im Genom des Organismus abzielt (z. B. mit geringerer Affinität oder Sequenzidentität als das Zielgen), ist eine Kontroll-siRNA so konzipiert, dass sie das teilweise Abzielen auf das zweite Gen im Genom aufrechterhält, aber nicht auf das Gen, auf das die getestete Störung abzielt. In einigen Ausführungsformen zielt eine Kontroll-siRNA auf ein Gen im Genom des Organismus ab, das sich von dem Gen unterscheidet, auf das bei der Test- und/oder Abfrage-Störung abgezielt wird, z. B. ein Gen, das nicht mit einem interessierenden Krankheitsphänotyp in Verbindung steht.
  • In einigen Ausführungsformen enthält jede Instanz des Kontrollzustands eine einzige Kontroll-siRNA und es wird nur eine Kontroll-siRNA für alle Instanzen des entsprechenden Kontrollzustands verwendet. In einigen Ausführungsformen enthält jede Instanz des Kontrollzustands eine einzige Kontroll-siRNA, aber verschiedene Kontroll-siRNA werden in den Instanzen des entsprechenden Kontrollzustands verwendet, z. B. so, dass der Kontrollzustand verschiedene Instanzen einer einzigen Kontroll-siRNA abtastet. In einigen Ausführungsformen enthält jede Instanz des Kontrollzustands eine Vielzahl von Kontroll-siRNA. In einigen Ausführungsformen enthalten beispielsweise alle Instanzen eines Kontrollzustands dieselbe Vielzahl von Kontroll-siRNA. In anderen Ausführungsformen enthalten verschiedene Instanzen eines Kontrollzustands unterschiedliche Anzahlen von Kontroll-siRNA.
  • In einigen Ausführungsformen umfasst die Vielzahl von Kontroll-siRNA mindestens 10 verschiedene Kontroll-siRNA, die z. B. zusammen in Instanzen einer Kontrollstörung enthalten sind, in verschiedenen Kombinationen über einen Satz von Instanzen einer Kontrollstörung enthalten sind oder einzeln in separaten Instanzen einer Kontrollstörung enthalten sind. In einigen Ausführungsformen umfasst die Vielzahl von Kontroll-siRNA mindestens 3, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 250 oder mehr Kontroll-siRNA. In einer Ausführungsform umfasst die Vielzahl von Kontroll-siRNA 10 bis 100 verschiedene Kontroll-siRNA. In einer Ausführungsform umfasst die Vielzahl von Kontroll-siRNA (4006) 10 bis 50 Kontroll-siRNA.
  • In einigen Ausführungsformen ist das Maß der zentralen Tendenz des unterschiedlichen Merkmals, das aus Merkmalen abgeleitet wird, die über die entsprechende Vielzahl von Kontrollaliquots der Zellen, die die jeweilige Kontrollstörung repräsentieren, gemessen wurden, ein arithmetisches Mittel, ein gewichtetes Mittel, ein mittlerer Bereich, ein Midhinge, ein Trimean, ein geometrisches Mittel, ein geometrischer Median, ein winsorisiertes Mittel, ein Median oder ein Modus des Wertes für die unterschiedlichen Merkmale, die für jedes der Vielzahl von Kontrollaliquots der Zellen, die die jeweilige Kontrollstörung repräsentieren, bestimmt wurden. In einigen Ausführungsformen ist das Maß der zentralen Tendenz des unterschiedlichen Merkmals über die entsprechende Vielzahl von Kontrollaliquots der Zellen, die die jeweilige Kontrollstörung repräsentieren, ein arithmetisches Mittel, ein gewichtetes Mittel, ein mittlerer Bereich, ein Midhinge, ein Trimean, ein geometrisches Mittel, ein geometrischer Median, ein winsorisiertes Mittel, ein Median oder ein Modus des Wertes für das unterschiedliche Merkmal, der für zwischen zwei und zwanzig Kontrollaliquots der Zellen, die die jeweilige Kontrollstörung repräsentieren, in zwischen zwei und zwanzig entsprechenden Vertiefungen in der Vielzahl von Vertiefungen (4008) bestimmt wurde.
  • In einigen Ausführungsformen wird jedes Merkmal aus einer Kombination von messbaren Merkmalen abgeleitet, die aus einer Farbe, Textur und Größe des Zellkontexts oder eines aufgezählten Teils des Zellkontexts (4010) ausgewählt werden. In einigen Ausführungsformen umfasst das Erhalten des entsprechenden Kontrolldatenpunkts das Abbilden einer entsprechenden Vertiefung in der Vielzahl von Vertiefungen, um ein entsprechendes zweidimensionales gepixeltes Bild mit einer entsprechenden Vielzahl von nativen Pixelwerten zu bilden, wobei ein anderes Merkmal in der Vielzahl von Merkmalen als Ergebnis einer Faltung oder einer Reihe von Faltungen und Pooling-Operatoren entsteht, die gegen native Pixelwerte in der entsprechenden Vielzahl von nativen Pixelwerten des entsprechenden zweidimensionalen gepixelten Bildes (4012) ausgeführt werden. Das heißt, in einigen Ausführungsformen umfasst die Vielzahl von Merkmalen latente Merkmale eines Bildes der jeweiligen Vertiefung in der Multiwellplatte.
  • In einigen Ausführungsformen wird jedes Merkmal in der Vielzahl von Merkmalen von einem Merkmal abgeleitet, das optisch gemessen wird (4020). In einigen Ausführungsformen wird eine erste Teilmenge der Vielzahl von Merkmalen von optisch gemessenen Merkmalen abgeleitet, und eine zweite Teilmenge der Vielzahl von Merkmalen wird von nicht optisch gemessenen Merkmalen abgeleitet (4022). In einigen Ausführungsformen wird jedes Merkmal der Vielzahl von Merkmalen von einem Merkmal abgeleitet, das nicht optisch gemessen wird (4024). Dem Fachmann sind andere Merkmalsmessungen bekannt, die sich beispielsweise für die Verwendung in den vorliegenden Verfahren eignen, wie im Folgenden ausführlich beschrieben.
  • In einigen Ausführungsformen wird die jeweilige Vielzahl von Kontrollaliquoten der Zellen mindestens eine Stunde lang der jeweiligen Kontrollstörung ausgesetzt, bevor die Messung jedes Merkmals, das zur Ableitung der Vielzahl von Merkmalen über die Vielzahl von Kontrollaliquoten (4014) verwendet wird, durchgeführt wird. In einigen Ausführungsformen umfasst ein Kontrollzustand beispielsweise ein Aliquot eines zellulären Kontexts (z. B. eine bestimmte Wildtyp- oder Mutanten-Zelllinie oder eine Mischung von Wildtyp- oder Mutanten-Zelllinien), das einer Kontrollstörung ausgesetzt wird, z. B. einer Kontroll-siRNA und/oder einem Puffer, die zur Kontrolle von Hintergrundeffekten verwendet werden. In einigen Ausführungsformen werden die Kontrollaliquots der Zellen einer Kontrollstörung für mindestens 15 Minuten, 30 Minuten, eine Stunde, zwei Stunden, drei Stunden, vier Stunden, sechs Stunden, zwölf Stunden, einen Tag, zwei Tage oder länger ausgesetzt, bevor die Messungen der einzelnen Merkmale durchgeführt werden.
  • Wie in 4B dargestellt, umfasst die Vielzahl der Dimensionen (z. B. repräsentativ für die Anzahl der verschiedenen Merkmale, die aus den charakteristischen Messungen ermittelt wurden) in einigen Ausführungsformen zwischen 5 Dimensionen und 100.000 Dimensionen (4016). In einigen Ausführungsformen umfasst die Vielzahl von Dimensionen mindestens 5, 10, 25, 50, 100, 250, 500, 1000, 2500, 5000, 10.000, 25.000, 50.000, 100.000, 250.000, 500.000, 1.000.000 oder mehr Dimensionen.
  • In einigen Ausführungsformen ist jedes Merkmal in der Vielzahl von Merkmalen eine Dimensionsreduktionskomponente, die eine durch Hauptkomponentenanalyse (4018) abgeleitete Hauptkomponente ist. In einigen Ausführungsformen wird jede Dimensionsreduktionskomponente durch eine Teilmengenauswahlmethode oder eine diskrete Methode (4026) abgeleitet. Dem Fachmann sind verschiedene Dimensionsreduktionstechniken bekannt, die sich für die Verringerung der Anzahl der Dimensionen in einem Kontrolldatenpunkt (z. B. einem Kontrollmerkmalsvektor) eignen, wie im Folgenden näher beschrieben.
  • In einigen Ausführungsformen handelt es sich bei einer Kontrollstörung im Satz von Kontrollstörungen um eine vorbestimmte naive Zelllinie, eine Zelllinie, die einer nicht wirkenden siRNA ausgesetzt wurde, eine Zelllinie, der ein modifizierendes Mittel zugesetzt wurde, um sicherzustellen, dass sie sich in einem vorbestimmten Zustand befindet, oder um Zellen, die vor dem Ausplattieren mit einer Sortiertechnologie nach einem oder mehreren vorbestimmten Biomarkern gefiltert wurden (4028). In einigen Ausführungsformen umfasst der Satz von Kontrollstörungen ein Toxin, ein CRISPR-Reagenz, ein Signalmolekül, ein Zytokin, ein vorbestimmtes Medikament, eine siRNA, eine sgRNA, eine Zellkulturbedingung oder eine genetische Veränderung (4032). Nicht einschränkende Beispiele für Kontrollzellkontexte, die sich für die Verwendung in den hier vorgesehenen Verfahren eignen, werden im Folgenden ausführlich beschrieben. In einigen Ausführungsformen umfasst der Satz von Kontrollstörungen mindestens zehn Kontrollstörungen (4030). In anderen Ausführungsformen besteht der Satz von Kontrollstörungen aus mindestens 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50 oder mehr Kontrollstörungen.
  • Testzustände
  • Mit Bezug auf 4C umfasst das Verfahren 4000 in einigen Ausführungsformen auch das Erhalten (4034) eines entsprechenden Testdatenpunkts für jede jeweilige Teststörung in einem Satz von einer oder mehreren Teststörungen, wodurch eine Vielzahl von Testdatenpunkten erhalten wird, wobei jeder entsprechende Testdatenpunkt die Vielzahl von Dimensionen umfasst (z.B. umfasst der Testdatenpunkt 280 eine Vielzahl von Dimensionen (z.B. die gleiche Anzahl von Dimensionen wie der Kontrolldatenpunkt 226), basierend auf Teststörungsmessungen 230). In einigen Ausführungsformen umfasst jede Dimension in der Vielzahl von Dimensionen eine Messung der zentralen Tendenz eines anderen Merkmals in der Vielzahl von Merkmalen über eine entsprechende Vielzahl von Testaliquoten der Zellen, die die jeweilige Teststörung in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen repräsentieren, z. B. nach Aussetzen der entsprechenden Vielzahl von Testaliquoten der Zellen der jeweiligen Teststörung. Beispielsweise entspricht jede der T Dimensionen des Datenpunkts 280-1-1-1 einem Maß der zentralen Tendenz eines anderen Merkmals, das aus charakteristischen Messungen 230-1-1-1-i-j abgeleitet wurde, wobei i = 1-N Merkmale und j = 1-Q Instanzen der Teststörung 1 im Kontext 1. In einigen Ausführungsformen umfasst jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz einer jeweiligen Dimensionsreduktionskomponente, die unter Verwendung der Vielzahl von Merkmalen über die entsprechende Vielzahl von Testaliquots der Zellen bestimmt wurde, z. B., nachdem die entsprechende Vielzahl von Testaliquots der Zellen der jeweiligen Teststörung ausgesetzt wurde. Beispielsweise entspricht jede von U Dimensionen des Datenpunkts 280-1-1-1 einem Maß der zentralen Tendenz einer anderen Dimensionsreduktionskomponente, die auf der Grundlage der Vielzahl von Merkmalen berechnet wird, die aus Messungen 230-1-1-1-i-j abgeleitet werden, wobei i = 1-N Merkmale und j = 1-Q Instanzen der Teststörung 1 im Kontext 1.
  • In einigen Ausführungsformen werden die zugrundeliegenden Daten (z. B. zuvor gesammelte Messungen von Testmerkmalen) erhalten und Testdatenpunkte (z. B. Störungstestvektoren) daraus konstruiert, z. B. durch Kombination der für einzelne Merkmalsmessungen erhaltenen Daten. In einigen Ausführungsformen werden charakteristische Messungen direkt durch das System (z. B. System 250) erfasst, z. B. enthält das System Anweisungen zur Verarbeitung von Bildern, die von Mikrotiterplatten aufgenommen wurden. In einigen Ausführungsformen werden die Vektoren und/oder die den Vektoren zugrundeliegenden Daten von einer entfernten Quelle bezogen, z. B. über das Netzwerk 252 über die Netzwerkschnittstelle 244.
  • In einigen Ausführungsformen besteht der Satz von Teststörungen aus einer Vielzahl von Ziel-siRNA, die die Expression eines mit dem Testzustand (4036) verbundenen Gens direkt beeinflussen (z. B. unterdrücken). In einigen Ausführungsformen unterbricht beispielsweise eine getestete Störung teilweise die Expression eines Gens oder einer Funktion eines Genprodukts, und der Satz von Teststörungen umfasst verschiedene siRNA, die die Expression des Gens unterdrücken (z. B. durch Ausrichtung auf verschiedene Sequenzen des Gens).
  • In einigen Ausführungsformen umfasst der Satz von Teststörungen eine Vielzahl von Ziel-siRNA, die jeweils direkt die Expression eines einer Vielzahl von Genen beeinflussen, die Proteinen in demselben Stoffwechselweg entsprechen, der mit dem Testzustand assoziiert ist, z. B. ein Stoffwechsel- oder Signalweg, der mit einer Krankheit von Interesse zusammenhängt. In einigen Ausführungsformen unterbricht beispielsweise eine getestete Störung teilweise die Funktion eines Stoffwechselwegs, und der Satz von Teststörungen umfasst verschiedene siRNA, die auf Gene abzielen, die für verschiedene an dem Stoffwechselweg beteiligte Proteine kodieren. In einigen Ausführungsformen werden mehrere siRNA verwendet, um auf eines der an dem Stoffwechselweg beteiligten Gene abzuzielen (z. B. durch Abzielen auf verschiedene Sequenzen des Gens).
  • In einigen Ausführungsformen umfasst der Satz von Teststörungen eine Vielzahl von Ziel-siRNA, die direkt die Expression eines einer Vielzahl von Genen beeinflussen, die Proteinen in verschiedenen, mit dem Testzustand verbundenen Signalwegen entsprechen, z. B. Stoffwechsel- oder Signalwege, die mit einer Krankheit von Interesse zusammenhängen. In einigen Ausführungsformen unterbricht beispielsweise eine zu testende Störung teilweise die Funktion mehrerer Stoffwechselwege, und der Satz von Teststörungen umfasst verschiedene siRNA, die auf Gene abzielen, die für verschiedene Proteine kodieren, die an den verschiedenen Stoffwechselwegen beteiligt sind. In einigen Ausführungsformen werden mehrere siRNA verwendet, um auf eines der an den Stoffwechselwegen beteiligten Gene abzuzielen (z. B. durch Abzielen auf verschiedene Sequenzen des Gens).
  • In einigen Ausführungsformen besteht die Vielzahl von Ziel-siRNA aus zwischen 4 und 12 verschiedenen Ziel-siRNA (4038). In einigen Ausführungsformen umfasst die Vielzahl von Test-siRNA mindestens 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 250 oder mehr Test-siRNA.
  • In einigen Ausführungsformen umfasst der Satz von Teststörungen eine Störung, die eine Überexpression eines Gens bewirkt, das für ein Protein in einem mit dem Testzustand assoziierten Stoffwechselweg kodiert, z. B. einem Stoffwechsel- oder Signalweg, der mit einer Krankheit von Interesse zusammenhängt. In einigen Ausführungsformen umfasst die Störung beispielsweise ein Transgen, das für das interessierende Protein kodiert und in den Zellkontext eingeführt wird, z. B. durch transiente Transfektion, über ein rekombinantes Virus usw. In einigen Ausführungsformen umfasst das Transgen einen konstitutiven Promotor, der die Expression des interessierenden Proteins antreibt. In einigen Ausführungsformen umfasst das Transgen einen induzierbaren Promotor, dessen Expression durch die Bedingungen des in den Vertiefungen verwendeten Kulturmediums gesteuert werden kann. In einigen Ausführungsformen umfasst der Satz von Teststörungen ein Transgen, das die Überexpression eines Proteins von Interesse in unterschiedlichen Mengen bei verschiedenen Teststörungen bewirkt, z. B. über ein dosisabhängiges induzierbares Promotorelement. In einigen Ausführungsformen umfasst der Satz von Teststörungen eine Vielzahl von Störungen, die jeweils eine Überexpression einer Vielzahl von Proteinen in demselben Pfad verursachen, der mit dem Testzustand verbunden ist, z. B. ein Stoffwechsel- oder Signalweg, der mit einer Krankheit von Interesse in Verbindung steht. In einigen Ausführungsformen umfasst der Satz von Teststörungen eine Vielzahl von Störungen, die jeweils eine Überexpression einer Vielzahl von Proteinen in verschiedenen, mit dem Testzustand assoziierten Signalwegen verursachen, z. B. in einem Stoffwechsel- oder Signalweg, der mit einer Krankheit von Interesse in Zusammenhang steht.
  • In einigen Ausführungsformen ist das Maß der zentralen Tendenz des unterschiedlichen Merkmals, das aus Merkmalen abgeleitet wird, die über die entsprechende Vielzahl von Testaliquots der Zellen gemessen wurden, die die jeweilige Teststörung repräsentieren, ein arithmetisches Mittel, ein gewichtetes Mittel, ein mittlerer Bereich, ein Midhinge, ein Trimean, ein geometrisches Mittel, ein geometrischer Median, ein winsorisiertes Mittel, ein Median oder ein Modus des Wertes für das unterschiedliche Merkmal, der für jedes der Vielzahl von Kontrollaliquots bestimmt wurde. In einigen Ausführungsformen ist das Maß der zentralen Tendenz des unterschiedlichen Merkmals, das aus Merkmalen abgeleitet wird, die über die entsprechende Vielzahl von Testaliquots der Zellen, die die jeweilige Teststörung darstellen, gemessen wurden, ein arithmetisches Mittel, ein gewichtetes Mittel, ein mittlerer Bereich, ein Midhinge, ein Trimean, ein geometrisches Mittel, ein geometrischer Median, ein winsorisiertes Mittel, ein Median oder ein Modus des Wertes für das unterschiedliche Merkmal, der für zwei bis zwanzig entsprechende Vertiefungen in der Vielzahl von Vertiefungen (4040) bestimmt wurde.
  • In einigen Ausführungsformen wird die Vielzahl von Testaliquoten der Zellen der jeweiligen Teststörung für mindestens eine Stunde, zwei Stunden, drei Stunden, einen Tag, zwei Tage, drei Tage, vier Tage oder fünf Tage ausgesetzt, bevor die Messung jedes Merkmals, das zur Ableitung der Vielzahl von Merkmalen über die Vielzahl von Testaliquoten (4042) verwendet wird, erhalten wird.
  • In einigen Ausführungsformen umfasst der Satz von Teststörungen mindestens zehn Teststörungen (4044). In einigen Ausführungsformen umfasst der Satz von Teststörungen mindestens 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 250 oder mehr Teststörungen.
  • In einigen Ausführungsformen umfasst der Satz von Teststörungen ein Toxin, ein CRISPR-Reagenz, ein Signalmolekül, ein Zytokin, ein vorbestimmtes Medikament, eine siRNA, eine sgRNA, eine Zellkulturbedingung oder eine genetische Modifikation, die sich von einer Kontrollstörung (4046) unterscheidet.
  • In einigen Ausführungsformen werden ein oder mehrere Gene oder Produkte eines in Tabelle 2 aufgeführten Gens in den Zellen des Testzustands gestört. In einigen Ausführungsformen umfasst die Teststörung beispielsweise ein oder mehrere Toxine, CRISPR-Reagenzien, Signalmoleküle, Zytokine, vorbestimmte Arzneimittel, siRNA, sgRNA, Zellkulturbedingungen oder genetische Veränderungen, die eines oder mehrere der Gene oder Proteine beeinflussen, die von einem in Tabelle 2 aufgeführten Gen kodiert werden. In einigen Ausführungsformen umfasst ein Satz von Teststörungen eine Vielzahl von Störungen, die gegen ein Gen oder ein Produkt eines in Tabelle 2 aufgeführten Gens gerichtet sind. In einigen Ausführungsformen umfasst ein Satz von Teststörungen eine Vielzahl von Störungen, die gegen zwei oder mehr Gene oder Produkte von zwei oder mehr in Tabelle 2 aufgeführten Genen gerichtet sind. Tabelle 2 - Beispiele für Zielgene, die in einigen Ausführungsformen gestört werden können.
    Gene
    RAD21 PRPF4 GMNN IRAK3 ZAP70 RPGRIP1L ZMYND10 PEX13
    USP7 TXNL4A ARID2 PDP1 PLEKHMI BUBI CFAP53 CASQ2
    ATP2A2 RAD51 APC SMAD3 NEK1 CCDC88C SFXN4 PLA2G6
    CUL3 PABPNI TGFBR1 TSEN54 TTC 19 DNAJB2 FRAS1 RAB28
    UBA1 NRF1 SCOl ANKRD11 CACNA1F RAI1 PRKAR1A SLC9A6
    PRPF31 PRPF3 COL4A1 BBS4 POMT1 ETFDH PDCD10 OBSL1
    PSAP BRAF AHI1 DDX11 HNF4A DRAM2 LRBA CRELD1
    KDM6A MAX EXT2 CDK5RAP2 NNT ESCO2 STIM1 VEGFA
    PRPF8 SACS NEB PIKFYVE AGL SC5D NDRG1 TPM1
    EFTUD2 BRCA2 TSC2 KMT2D SCNN1A RNASEL OPTN IGSF1
    OPA1 DNA2 GPR143 SLC26A4 THRB ISPD GATM NFKB2
    RPS7 TRIP 11 PDSS2 MYO5B LRPAP1 ATP7B AASS EPM2A
    CDC73 USP9X SMARCA4 CTNS RPS6KA3 GJA5 GFM1 TTN
    PRPF6 SALL1 BRCA1 CYLD KDM1A EFHC1 MSX2 AP3B1
    RPS10 SLC25A38 LCA5 CNNM4 ADA VLDLR HFE PIGT
    SF3B4 MPDZ EVC2 BAP1 RASA1 NAA10 OAT SMS
    RPL11 MCCC2 DLG3 FUCA1 ACOX1 BCKDHB TBX19 ANTXR1
    KIF11 NGLY1 LYST ITGB2 PEX1 MYL2 DNAH11 XIAP
    RPS17 STIL GK GAN RNF168 LRRC6 AGPAT2 AMER1
    TSPAN7 ABHD5 NSD2 NF1 DPY19L2 TAZ LAMP2 CFI
    ALG 11 TNPO3 LIPA DST C1GALT1C1 PHGDH PIGL PCBD1
    CTNNB1 SMAD4 CHD2 FAT4 DIAPH1 TBC1D7 NRL DSP
    BBS7 SPAST IFNGR1 NF2 MLH3 CEP63 ANO10 XPC
    NUS1 GNPTAB SMC1A CEP135 MFSD8 TPRN ZMYND12 SMARCA2
    POLR3B FASTKD2 SRP72 GYSI GNPTG CEP290 MTR PEX2
    RBBP8 CEP 152 SLC 17A5 NDUFB3 ASNS HOXA2 BIN 1 MMADHC
    SMC3 PMM2 CTSA TMCO1 MCM8 EXOSC3 ARFGEF2 GCSH
    DYRK1A MESP2 SMN1 DDOST ALDH5A1 ASAH1 IKBKB EIF2B 1
    RPS26 ARIDIA TCTN1 AAAS ATP2C1 HFM1 DYSF IQCB1
    KANSL1 YAP1 PEX6 ARID1B NEU1 C5orf42 PINK1 SRCAP
    MFN2 SLC6A8 KLK4 SGSH PHF6 HSD3B7 FANCG RPGRIP1
    RPS 19 IARS2 ADAM 17 DGKE FGFR1 F8 CABP4 SLC25A1
    VPS13B PAFAH1B1 AVP GLDC HPS4 CRYBB2 MTM1 KRIT1
    RBM8A FAM83H ASPM PKD1 RAB3GAP2 UROS VPS13A ADAMTS2
    TJP2 FLNB HCCS UBE2A RAB27A PYGM MIDI TGIFI
    PTEN DNAAF3 FBN1 PCCA VCL FAS SDHA PLCE1
    NIPBL EIF2AK3 KIAA1109 ADAM10 NCF1 ARMC4 SLC35A3 ANTXR2
    MED23 COG8 AIMP1 RAB3GAP1 PARK7 NID1 GPC3 DOCK6
    RPL26 PCDH15 ATP13A2 NOTCH3 FKTN C19orf12 ADCY1 TCOF1
    RB1 GARS EPG5 CHD8 FERMT1 TSHR IGLL1 SPRED1
    RPS24 MUT QDPR SOX9 CKAP2L INPP5E ATP2A1 NBEAL2
    CDKN2A EXT1 CREBBP XPA SMCHD1 ACAD9 ERCC6 CDKNIC
    EP300 TARDBP MTMR2 FUS ZEB2 SETD5 NHEJ1 CLN8
    SMARCE1 STK11 GALC PSEN2 STX11 SLC4A11 CDH1 CNGB3
    MYO6 GATA6 HAMP MNX1 AP5Z1 CDH3 MSH6 WDR19
    MYH9 WNK1 AHDC1 BCHE SDCCAG8 SETX PSAT1 SLC13A5
    MSH2 ATRX TK2 SLC25A20 WDPCP CCNO SYNE1 NFIX
    LMNA MTFMT MIB1 XK FOXP2 CHD7 HADH
    LAMA4 CD55 OTOGL NDUFA11 SEK63 TRAPPC9 HNF1B
    ATM MSH3 COG4 SCN9A TOPORS TSC1 MYCN
    TP53 GNAL CEP 164 LDLR SPR EFR3B FGD1
    HNF1A EHMT1 OTX2 FBN2 CCDC39 SIL1 ABCA4
  • Unter Bezugnahme auf 4D umfasst das Verfahren 4000 in einigen Ausführungsformen auch das Berechnen (4048) eines zusammengesetzten Testvektors (z.B. zusammengesetzter Testvektor 292), wobei der zusammengesetzte Testvektor zwischen (i) einem ersten Punkt, der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Kontrolldatenpunkten (z.B., Kontrolldatenpunkten 276) für jede Dimension in der Vielzahl von Dimensionen definiert ist, und (ii) einem zweiten Punkt, der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Testdatenpunkten (z.B. Testdatenpunkte 280) für jede Dimension in der Vielzahl von Dimensionen definiert ist, liegt.
  • 7C zeigt eine Dosis-Wirkungs-Kurve der Off-Target-Werte als Funktion der On-Target-Werte für verschiedene Konzentrationen eines Störungsmittels (Dreiecke) sowie für nicht gestörte Zellkontexte (z. B. „gesunde“ Zellkontexte; Quadrate) und gestörte Zellkontexte (z. B. „Test“-Zellkontexte; Kreise).
  • In einigen Ausführungsformen wird ein Testzustand bewertet, indem eine Reihe von Experimenten durchgeführt wird, bei denen die Konzentration des Störungsmittels (z. B. ein löslicher Faktor oder siRNA) über eine Vielzahl von Konzentrationen titriert wird. Das erwartete Verhalten für ein solches Experiment ist, dass der resultierende Wert über die Vertiefungen, von der niedrigsten Konzentration bis zur höchsten Konzentration des Störungsmittels, einen Trend von der „gesunden“ Cloud zur „kranken“ Cloud bildet. Wie in 7C dargestellt, stellt beispielsweise Punkt 750 einen Zustand dar, der die niedrigste Konzentration eines Störungsmittels in der Titration enthält und sich in der Nähe der „gesunden“ Cloud 754 befindet. Im Gegensatz dazu stellt der Punkt 752 einen Zustand dar, der die höchste Konzentration des Störungsmittels in der Titration enthält und sich in der Nähe der „kranken“ Cloud 756 befindet. Diese Titration kann verwendet werden, um die erwartete Rettung des Phänotyps durch das Störmedium zu modellieren.
  • Abfrage-Zustände
  • Verfahren 4000 umfasst auch das Erhalten (4050) eines entsprechenden Abfragestörungsdatenpunkts für jede entsprechende Abfragestörung in einer Vielzahl von Abfragestörungen, wobei jeder entsprechende Abfragestörungsdatenpunkt die Vielzahl von Dimensionen umfasst (z. B. umfasst der Abfragedatenpunkt 284 eine Vielzahl von Dimensionen auf der Grundlage von Abfragestörungsmessungen 234). In einigen Ausführungsformen umfasst jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz einer Messung eines anderen Merkmals, das aus der Messung eines oder mehrerer Merkmale in der Vielzahl von Merkmalen über eine Vielzahl von Instanzen von Abfrage-Störungs-Aliquots der Zellen abgeleitet ist, die eine jeweilige Teststörung in der Vielzahl von Teststörungen und eine erste Menge der Abfrage-Störung (z. B. ein therapeutisches Kandidatenmolekül) in einer entsprechenden Teilmenge der Vielzahl von Vertiefungen darstellen (z. B. gemeinsam ausgesetzt sind). Zum Beispiel entspricht jede der T Dimensionen des Datenpunkts 284-1-1-1 einem Maß der zentralen Tendenz eines anderen Merkmals, das aus Merkmalsmessungen 234-1-1-1-i-j abgeleitet ist, wobei i = 1-N Merkmale und j = 1-V Instanzen der Abfragestörung 1 im Kontext 1. In einigen Ausführungsformen enthält jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz einer jeweiligen Dimensionsreduktionskomponente, die unter Verwendung der Vielzahl von Merkmalen über die entsprechende Vielzahl von Instanzen von Abfrage-Störungs-Aliquots der Zellen (z. B. gemeinsam der jeweiligen Teststörung und der Abfrage-Störung ausgesetzt) bestimmt wird, die die jeweilige Teststörung und die Abfrage-Störung darstellen. Beispielsweise entspricht jede von U Dimensionen des Datenpunkts 284-1-1-1 einem Maß der zentralen Tendenz einer anderen Dimensionsreduktionskomponente, die auf der Grundlage der Vielzahl von Merkmalen berechnet wird, die aus Messungen 234-1-1-1-i-j abgeleitet werden, wobei i = 1-N Merkmale und j = 1-V Instanzen der Abfragestörung 1 im Kontext 1.
  • In einigen Ausführungsformen werden die zugrundeliegenden Daten (z. B. zuvor gesammelte charakteristische Abfragemessungen) erhalten und Abfragedatenpunkte (z. B. Störungsabfragevektoren) daraus konstruiert, z. B. durch Kombination der für einzelne charakteristische Messungen erhaltenen Daten. In einigen Ausführungsformen werden charakteristische Messungen direkt vom System (z. B. System 250) erfasst, z. B. enthält das System Anweisungen zur Verarbeitung von Bildern, die von Mikrotiter-/Multiwellplatten aufgenommen wurden. In einigen Ausführungsformen werden die Vektoren und/oder die den Vektoren zugrundeliegenden Daten von einer entfernten Quelle bezogen, z. B. über das Netzwerk 252 über die Netzwerkschnittstelle 244.
  • In einigen Ausführungsformen ist das Maß der zentralen Tendenz des unterschiedlichen Merkmals, das aus Merkmalen abgeleitet wird, die über die entsprechende Vielzahl von Abfrage-Störungs-Aliquots der Zellen gemessen werden, die gemeinsam die jeweilige Abfrage-Störung repräsentieren, ein arithmetisches Mittel, ein gewichtetes Mittel, ein mittlerer Bereich, ein Midhinge, ein Trimean, ein geometrisches Mittel, ein geometrischer Median, ein winsorisiertes Mittel, ein Median oder ein Modus des Wertes für unterschiedliche Merkmale, die für jedes der Vielzahl von Abfrage- Aliquots der Zellen bestimmt werden, die die jeweilige Kontroll-Störung repräsentieren. In einigen Ausführungsformen ist das Maß der zentralen Tendenz des unterschiedlichen Merkmals, das aus Merkmalen abgeleitet wird, die über die entsprechende Vielzahl von Abfragealiquots der Zellen, die gemeinsam die jeweilige Abfragestörung repräsentieren, gemessen werden, ein arithmetisches Mittel, ein gewichtetes Mittel, ein mittlerer Bereich, ein Midhinge, Trimean, geometrischer Mittelwert, geometrischer Median, ein winsorisiertes Mittel, Median oder Modus des Wertes für verschiedene Merkmale, die für zwei bis zwanzig Abfragealiquots der Zellen, die die jeweilige Abfragestörung darstellen, in zwei bis zwanzig entsprechenden Vertiefungen in der Vielzahl von Vertiefungen (4052) bestimmt wurden.
  • In einigen Ausführungsformen ist das Maß der zentralen Tendenz des unterschiedlichen Merkmals über die entsprechende Vielzahl von Abfragestörungsaliquots der Zellen, die gemeinsam die jeweilige Teststörung und die Abfragestörung darstellen, ein arithmetisches Mittel, ein gewichteter Mittelwert, ein mittlerer Bereich, ein Midhinge, Trimean, ein winsorisiertes Mittel, Median oder Modus des unterschiedlichen Merkmals über zwei bis zwanzig Abfrage-Störungs-Aliquots der Zellen, die gemeinsam die jeweilige Teststörung und die Abfrage-Störung in zwei bis zwanzig entsprechenden Vertiefungen in der Vielzahl von Vertiefungen (4054) darstellen.
  • In einigen Ausführungsformen wird die entsprechende Vielzahl von Abfrage-Störungs-Aliquots der Zellen gemeinsam der jeweiligen Teststörung und der Abfrage-Störung für mindestens eine Stunde, zwei Stunden, drei Stunden, einen Tag, zwei Tage, drei Tage, vier Tage oder fünf Tage vor der Messung der Vielzahl von Merkmalen ausgesetzt, die zur Ableitung der Vielzahl von Merkmalen bei der Gewinnung (4056) verwendet werden.
  • In einigen Ausführungsformen umfasst die Vielzahl von Abfragestörungen mindestens 1000 Abfragestörungen (4058). In einigen Ausführungsformen umfasst die Vielzahl von Abfragestörungen mindestens 10, 25, 50, 75, 100, 150, 200, 250, 300, 400, 500, 750, 1000, 1500, 2000, 3000, 4000, 5000 oder mehr Abfragestörungen.
  • Unter Bezugnahme auf 4E umfasst das Verfahren 4000 in einigen Ausführungsformen auch die Berechnung (4060) eines Abfrage-Störungsvektors (z.B. zusammengesetzter Abfragevektor 296) zwischen (i) dem ersten Punkt (z.B. definiert durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Kontrolldatenpunkten (z.B., Kontrolldatenpunkte 276) für jede Dimension in der Vielzahl von Dimensionen) und (ii) einem jeweiligen Maß der zentralen Tendenz über die Vielzahl von Abfragestörungsdatenpunkten (z.B. Abfragedatenpunkte 284) für jede Dimension in der Vielzahl von Dimensionen. In einigen Ausführungsformen können der Abfragestörungsvektor, der zusammengesetzte Testvektor und/oder die Datenpunkte grafisch dargestellt, geplottet, auf einem Computerbildschirm angezeigt oder anderweitig vom Computersystem (z. B. in einem für den Menschen sichtbaren Format) an einen Menschen zur Ansicht, Überprüfung, Bewertung und/oder Entscheidungsfindung ausgegeben oder bereitgestellt werden.
  • On-Target- und Off-Target-Werte
  • Unter fortgesetzter Bezugnahme auf 4E umfasst das Verfahren 4000 in einigen Ausführungsformen auch die Berechnung (4062) eines On-Target-Werts für die Abfrage-Störung als Projektion des Abfrage-Störungsvektors (z. B. zusammengesetzter Abfragevektor 296 oder 512) auf den zusammengesetzten Testvektor (z. B. zusammengesetzter Testvektor 292 oder 510), wie beispielsweise als Projektion 516 in 5 dargestellt. In einigen Ausführungsformen wird der On-Target-Wert normalisiert, z. B. durch einen Mittelwert/Mittelwert des Testwerts einer einzelnen entsprechenden Störung (z. B. siRNA) oder durch die Standardabweichung des Kontrollzustands. In einigen Ausführungsformen kann der On-Target-Wert grafisch dargestellt, aufgezeichnet, auf einem Computerbildschirm angezeigt oder anderweitig vom Computersystem (z. B. in einem für den Menschen sichtbaren Format) an einen Menschen zur Ansicht, Überprüfung, Bewertung und/oder Entscheidungsfindung ausgegeben oder bereitgestellt werden.
  • Das Verfahren 4000 umfasst auch die Berechnung (4064) eines Off-Target-Werts für die Abfrage-Störung als Ablehnung des Abfrage-Störungsvektors (z. B. zusammengesetzter Abfragevektor 296 oder 512) gegenüber dem zusammengesetzten Testvektor (z. B. zusammengesetzter Testvektor 292 oder 510), wie beispielsweise als Ablehnung 518 in 5 dargestellt. In einigen Ausführungsformen wird der Off-Target-Wert normalisiert, z. B. unter Verwendung der folgenden nicht einschränkenden Beispielgleichung: y _ neu = ( y uudy ) / ( max ( uudy + 5 uuuhy , uuhy + 3 uuuhy ) uudy )
    Figure DE112020002936T5_0001

    wo:
    • y ist der nicht normierte Off-Target-Wert;
    • uudy ist der mittlere Off-Target-Wert der Teststörungen;
    • uuhy ist der mittlere Off-Target-Wert der Kontrollstörungen;
    • uuudy ist die Standardabweichung des Off-Target-Werts der Teststörungen; und
    • uuuhy ist die Standardabweichung des Off-Target-Werts der Kontrollstörungen.
  • Alternativ dazu wird in einigen Ausführungsformen der Off-Target-Wert normalisiert, z. B. unter Verwendung der folgenden nicht einschränkenden Beispielgleichung: y _ neu = ( y uudy ) / 2 /uuudy
    Figure DE112020002936T5_0002

    wo:
    • y ist die nicht normierte Off-Target-Wert;
    • uudy ist der mittlere Off-Target-Wert der Teststörungen; und
    • uuudy ist die Standardabweichung des Off-Target-Werts bei den Teststörungen.
  • Alternativ dazu wird in einigen Ausführungsformen der Off-Target-Wert durch eine Logarithmentransformation normalisiert. In einigen Ausführungsformen kann der Off-Target-Wert grafisch dargestellt, aufgezeichnet, auf einem Computerbildschirm angezeigt oder anderweitig vom Computersystem (z. B. in einem für den Menschen sichtbaren Format) an einen Menschen zur Ansicht, Überprüfung, Bewertung und/oder Entscheidungsfindung ausgegeben oder bereitgestellt werden.
  • Das Verfahren 4000 umfasst die Auswertung (4066) des On-Target- und Off-Target-Werts für die Abfrage-Störung, wodurch die Abfrage-Störung ausgewertet wird, wie unten im Detail beschrieben. Die Auswertung wird von einem Computersystem (z.B. 250) durchgeführt, und die Ergebnisse der Auswertung können grafisch dargestellt, aufgezeichnet, auf einem Computerbildschirm angezeigt oder von dem Computersystem (z.B. in einem für den Menschen sichtbaren Format) an einen Menschen zur Ansicht, Überprüfung, Auswertung und/oder Entscheidungsfindung ausgegeben oder bereitgestellt werden. In einigen Ausführungsformen können die Ergebnisse der Auswertung eine therapeutische Verbindung zur Verwendung bei der Behandlung eines bestimmten Zustands oder einer bestimmten Krankheit des Menschen beschreiben und eine oder mehrere therapeutische Konzentrationen (Dosen) beschreiben, bei denen die therapeutische Verbindung wirksam zu sein scheint. In einigen Ausführungsformen können die Ergebnisse eine Rettungsqualität einer getesteten Verbindung charakterisieren oder quantifizieren.
  • Nachdem oben das Verfahren zur Auswertung einer einzelnen Abfragestörung beschrieben wurde (z.B. Screening einer möglichen therapeutischen Verbindung bei einer einzelnen Konzentration), wird das Verfahren in einigen Ausführungsformen für eine Vielzahl von Abfragestörungen wiederholt, z.B. um eine Vielzahl möglicher therapeutischer Verbindungen zu screenen, und/oder bei einer Vielzahl von Konzentrationen, z.B. um eine oder mehrere mögliche therapeutische Verbindungen dosisabhängig zu screenen. Zum Beispiel, mit Bezug auf 4F, beinhaltet das Verfahren 4000 in einigen Ausführungsformen die Wiederholung (4068) des Erhaltens (4050), Berechnens (4060), Berechnens (4062) und Berechnens (4064) für jede Abfrage-Störung in einer Vielzahl von Abfrage-Störungen. In einigen Ausführungsformen umfasst das Auswerten (4066) das Auftragen jeder jeweiligen Abfragestörung in der Vielzahl von Abfragestörungen auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für die jeweilige Abfragestörung als eine Koordinate in einer ersten Dimension des zweidimensionalen Diagramms und des Off-Target-Werts für die jeweilige Abfragestörung als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms (z.B. wie für eine Vielzahl von Abfragestörungen dargestellt, die als Dreiecke in 6 gezeigt sind). Die Auswertungen werden von einem Computersystem (z.B. 250) durchgeführt, und die Ergebnisse der Auswertungen können grafisch dargestellt, geplottet, auf einem Computerbildschirm angezeigt oder anderweitig vom Computersystem (z.B. in einem für den Menschen sichtbaren Format) an einen Menschen zur Ansicht, Überprüfung, Auswertung und/oder Entscheidungsfindung ausgegeben oder bereitgestellt werden. In einigen Ausführungsformen können die aufgezeichneten Ergebnisse (z. B. ähnlich denen in den 6, 7A-7C und anderen hierin enthaltenen Diagrammen und Grafiken) auch als interaktive Schnittstelle oder grafische Benutzerschnittstelle fungieren, indem die zugrunde liegenden Informationen als Reaktion auf die Auswahl eines aufgezeichneten Punktes durch einen Benutzer (z. B. mit einem Cursor) angezeigt werden, der auf einer Anzeige eines Computersystems dargestellt wird. In einigen Ausführungsformen können die Ergebnisse der Bewertungen eine oder mehrere therapeutische Verbindungen zur Verwendung bei der Behandlung eines bestimmten Zustands oder einer bestimmten Krankheit des Menschen beschreiben und eine oder mehrere therapeutische Konzentrationen (Dosen) angeben, bei denen die eine oder mehrere therapeutische Verbindungen wirksam zu wirken scheinen. In einigen Ausführungsformen können die Ergebnisse eine Rettungsqualität einer oder mehrerer getesteter Verbindungen charakterisieren oder quantifizieren.
  • In einigen Ausführungsformen, z. B. um den aufgezeichneten Werten für die Abfragestörungen zusätzlichen Kontext zu verleihen, werden die Projektion und die Ablehnung von Kontrollstörungen (z. B. On-Target- und Off-Target-Effekte, die in den Kontrolltests beobachtet werden) auf den zusammengesetzten Testvektor, z. B. repräsentativ für „gesunde“ Zellphänotypen, neben den Abfragestörungen aufgezeichnet. Dementsprechend umfasst das Verfahren 4000 in einigen Ausführungsformen unter Bezugnahme auf 4G die Berechnung (4070) eines entsprechenden Kontrollvektors zwischen (i) dem ersten Punkt, z.B., wie er verwendet wird, um den zusammengesetzten Testvektor und den AbfrageStörungsvektor zu berechnen, und der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Kontrolldatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, und (ii) einem zweiten Punkt, der durch ein Maß der zentralen Tendenz über die Kontrolldatenpunkte definiert ist, die mit der jeweiligen Kontrollstörung verbunden sind, für jede Dimension in der Vielzahl von Dimensionen, wodurch eine Vielzahl von Kontrollvektoren berechnet wird. Das Verfahren kann auch das Berechnen (4072) eines On-Target-Werts für jede Kontrollstörung als eine Projektion des entsprechenden Kontrollvektors in der Vielzahl von Kontrollvektoren auf den zusammengesetzten Testvektor umfassen. Das Verfahren kann auch die Berechnung (4074) eines Off-Target-Werts für jede Kontrollstörung als eine Ablehnung des entsprechenden Kontrollvektors gegenüber dem zusammengesetzten Testvektor beinhalten. Die Auswertung (4066) kann beinhalten, dass jede Kontrollstörung in der Vielzahl von Kontrollstörungen auf dem zweidimensionalen Plot aufgetragen wird, wobei der On-Target-Wert für die jeweilige Kontrollstörung als eine Koordinate in der ersten Dimension und der Off-Target-Wert für die jeweilige Kontrollstörung als eine Koordinate in der zweiten Dimension des zweidimensionalen Plots verwendet wird (z. B. wie für eine Vielzahl von Kontrollstörungen, die in 6 als Quadrate dargestellt sind). In einigen Ausführungsformen werden die Projektion und die Ablehnung anderer Referenzpunkte, z. B. wirklich naive/gesunde Zellen (die z. B. keiner Kontrollstörung ausgesetzt sind), verschiedene „Referenz“-individuelle nicht-zielgerichtete siRNA, verschiedene zielgerichtete siRNA (um die Wirkung der Auswahl verschiedener siRNAs zu sehen) usw. dem Diagramm hinzugefügt, um den Screening-Bedingungen einen zusätzlichen Kontext zu verleihen.
  • Wiederum unter Bezugnahme auf 4E berechnet (4062) das Verfahren 4000 in einigen Ausführungsformen einen On-Target-Wert für die Abfrage-Störung als Projektion des Abfrage-Störungsvektors (z. B. zusammengesetzter Abfragevektor 296 oder 512) auf den zusammengesetzten Testvektor (z. B. zusammengesetzter Testvektor 292 oder 510), wie beispielsweise als Projektion 516 in 5 gezeigt. In einigen Ausführungsformen wird der On-Target-Wert normalisiert, z. B. durch einen Mittelwert/Medianwert des Testwerts einer einzelnen entsprechenden Störung (z. B. siRNA) oder durch die Standardabweichung des Kontrollzustands.
  • Vorteilhafterweise zeigen die aufgezeichneten Werte für die Kontrollstörungen effektiv einen „gesunden“ Phänotyp auf dem Diagramm. Zum Beispiel werden, wie in 6 dargestellt, die Ergebnisse einer Vielzahl von Kontrollstörungen als Quadrate aufgetragen, wie das Quadrat 601. Die Quadrate können alle eine bestimmte Farbe haben, z. B. grün, in einigen Ausführungsformen. In 6 bilden die aufgezeichneten Quadrate eine Cloud „gesunder“ Phänotypen um einen Mittelpunkt 602, der im Wesentlichen einen Basiswert für den On-Target-Effekt und einen Basiswert für den Off-Target-Effekt definiert, die für einen gesunden Phänotyp repräsentativ sind. Dementsprechend ist der Abstand zwischen einem Punkt, der einer entsprechenden Abfragestörung entspricht, und der Cloud von Punkten, die für die Kontrollstörungen steht, ein Indikator dafür, wie wirksam die in der Abfragestörung untersuchte Verbindung den „Krankheits“-Phänotyp der Störung behandelt. In 6 sind die Abfragestörungen als Dreiecke dargestellt, z. B. als Dreieck 604. Die Dreiecke können alle eine bestimmte Farbe haben, wie z. B. Blau in einigen Ausführungsformen. Das als Punkt 604 dargestellte Dreieck, das eine erste Abfragestörung repräsentiert, befindet sich beispielsweise innerhalb der „Krankheits“-Cloud (ungefähr dargestellt durch die Region 605), was darauf hinweist, dass der Wirkstoffkandidat in der Abfragestörung den Krankheitsphänotyp nicht rettet. Das als Punkt 606 dargestellte Dreieck, das eine zweite Abfragestörung repräsentiert, ist relativ zur „Krankheits“-Cloud nach links verschoben und hat eine Abszisse, die fast dem Mittelpunkt 602 der „Gesunden“-Cloud entspricht (ungefähr durch den Bereich 603 dargestellt), was darauf hinweist, dass der Wirkstoffkandidat in der Abfragestörung den Krankheits-Phänotyp rettet. Die Ordinate des Punktes 606 ist jedoch doppelt so hoch wie die Ordinate des Mittelpunkts 602 der „gesunden“ Cloud, was darauf hindeutet, dass der Wirkstoffkandidat auch erhebliche Off-Target-Effekte verursacht. Im Gegensatz dazu befindet sich das als Punkt 608 dargestellte kleine Dreieck, das eine dritte Abfrage-Störung repräsentiert, in der Nähe der „gesunden“ Cloud, was darauf hindeutet, dass der Wirkstoffkandidat in der Abfrage-Störung den Krankheitsphänotyp rettet, ohne signifikante Off-Target-Effekte zu verursachen. Somit ist das Medikament in der dritten Abfrage-Störung ein vielversprechenderer Kandidat für die Krankheitstherapie als die Medikamente in der ersten und zweiten Abfrage-Störung.
  • In einigen Ausführungsformen werden On-Target- und Off-Target-Werte für jede Vertiefung einer Kontrollstörung (z. B. jede Instanz eines Experiments, das einer Kontrollstörung entspricht) aufgezeichnet, um zusätzlichen Kontext zu den aufgezeichneten Werten für die Abfrage-Störungen zu liefern. Dementsprechend, unter Bezugnahme auf 4H, umfasst das Verfahren 4000 in einigen Ausführungsformen das Berechnen (4076) für jede jeweilige Vertiefung in der Vielzahl von Vertiefungen, die eine Kontrollstörung in der Vielzahl von Kontrollstörungen darstellen, eines entsprechenden Kontrollvektors zwischen (i) dem ersten Punkt für jede Dimension in der Vielzahl von Dimensionen, z.B., wie er zur Berechnung des zusammengesetzten Testvektors und des Abfrage-Störungsvektors verwendet wird und wie er durch ein entsprechendes Maß der zentralen Tendenz über die Vielzahl von Kontrolldatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, und (ii) einem zweiten Punkt, der durch einen Wert des entsprechenden Merkmals in der Vielzahl von Merkmalen definiert ist, der für die jeweilige Vertiefung bestimmt wurde, wodurch eine Vielzahl von Kontrollvektoren berechnet wird. Das Verfahren würde auch das Berechnen (4078) eines On-Target-Werts für jede Teststörung als eine Projektion des entsprechenden Testvektors in der Vielzahl von Testvektoren auf den zusammengesetzten Testvektor umfassen. Das Verfahren würde auch die Berechnung (4080) eines Off-Target-Werts für jede Teststörung als Ablehnung des entsprechenden Testvektors gegenüber dem zusammengesetzten Testvektor beinhalten. Die Auswertung (4066) würde beinhalten, dass jede Teststörung in der Vielzahl von Teststörungen auf dem zweidimensionalen Plot aufgetragen wird, wobei der On-Target-Wert für die jeweilige Teststörung als eine Koordinate in der ersten Dimension und der Off-Target-Wert für die jeweilige Teststörung als eine Koordinate in der zweiten Dimension des zweidimensionalen Plots verwendet wird (z.B. wie für eine Vielzahl von Kontrollstörungen, die in 6 als Quadrate dargestellt sind).
  • In einigen Ausführungsformen, z. B. um den aufgezeichneten Werten für die Abfragestörungen einen zusätzlichen Kontext zu verleihen, werden die Projektion und die Ablehnung von Teststörungen (z. B. On-Target- und Off-Target-Effekte, die in einem „Krankheits“-Phänotyp-Zellkontext beobachtet werden, der nicht einer möglichen therapeutischen Verbindung ausgesetzt ist) auf dem zusammengesetzten Testvektor, z. B. repräsentativ für „kranke“ Zellphänotypen, neben den Abfragestörungen aufgezeichnet. Dementsprechend, mit Bezug auf 4I, umfasst das Verfahren 4000 in einigen Ausführungsformen das Berechnen (4082) für jede jeweilige Teststörung in der Vielzahl von Teststörungen eines entsprechenden Testvektors zwischen (i) dem ersten Punkt für jede Dimension in der Vielzahl von Dimensionen, z.B., wie er zur Berechnung des zusammengesetzten Testvektors und des Abfrage-Störungsvektors verwendet wird und wie er durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Kontrolldatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, und (ii) einem zweiten Punkt, der durch ein Maß der zentralen Tendenz über die Testdatenpunkte definiert ist, die mit der jeweiligen Teststörung verbunden sind. Das Verfahren würde auch das Berechnen (4084) eines On-Target-Werts für jede Teststörung als Projektion des entsprechenden Testvektors in der Vielzahl von Testvektoren auf den zusammengesetzten Testvektor umfassen. Das Verfahren würde auch die Berechnung (4086) eines Off-Target-Wertes für jede Teststörung als eine Ablehnung des entsprechenden Testvektors gegenüber dem zusammengesetzten Testvektor beinhalten. Die Auswertung (4066) würde beinhalten, dass jede Teststörung in der Vielzahl von Teststörungen auf dem zweidimensionalen Diagramm aufgetragen wird, wobei der On-Target-Wert für die jeweilige Teststörung als eine Koordinate in der ersten Dimension und der Off-Target-Wert für die jeweilige Teststörung als eine Koordinate in der zweiten Dimension des zweidimensionalen Diagramms verwendet wird (z. B. wie für eine Vielzahl von Teststörungen dargestellt). Die Teststörungen können als Kreise dargestellt werden, z. B. als Kreis 607 in 6. Die Kreise können alle eine bestimmte Farbe haben, wie z. B. Rot in einigen Ausführungsformen.
  • In einigen Ausführungsformen werden On-Target- und Off-Target-Werte für jede Vertiefung einer Teststörung (z. B. jede Instanz eines Experiments, das einer Teststörung entspricht) aufgezeichnet, um den aufgezeichneten Bewertungen für die Abfragestörungen zusätzlichen Kontext zu verleihen. Dementsprechend, unter Bezugnahme auf 4J, umfasst das Verfahren 4000 in einigen Ausführungsformen das Berechnen (4088) für jede jeweilige Vertiefung in der Vielzahl von Vertiefungen, die eine Teststörung in der Vielzahl von Teststörungen darstellen, eines entsprechenden Testvektors zwischen (i) dem ersten Punkt für jede Dimension in der Vielzahl von Dimensionen, z.B, wie er zur Berechnung des zusammengesetzten Testvektors und des Abfrage-Störungsvektors verwendet wird und wie er durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Kontrolldatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, und (ii) einem zweiten Punkt, der durch einen Wert des entsprechenden Merkmals in der Vielzahl von Merkmalen definiert ist, der für die jeweilige Vertiefung bestimmt wurde, wodurch eine Vielzahl von Testvektoren berechnet wird. Das Verfahren würde auch das Berechnen (4090) eines On-Target-Werts für jeden entsprechenden Testvektor in der Vielzahl der Testvektoren als Projektion des entsprechenden Testvektors auf den zusammengesetzten Testvektor umfassen. Das Verfahren würde auch die Berechnung (4092) eines Off-Target- Werts für jeden jeweiligen Testvektor in der Vielzahl von Testvektoren als eine Ablehnung des jeweiligen Testvektors gegenüber dem zusammengesetzten Testvektor umfassen. Die Auswertung (4066) würde beinhalten, dass jeder jeweilige Testvektor aus der Vielzahl der Testvektoren auf dem zweidimensionalen Plot aufgetragen wird, wobei der On-Target-Wert für den jeweiligen Testvektor als eine Koordinate in der ersten Dimension und der Off-Target-Wert für den Testvektor als eine Koordinate in der zweiten Dimension des zweidimensionalen Plots verwendet wird (z.B. wie für eine Vielzahl von Teststörungen, die in 6 als Kreise dargestellt sind).
  • In einigen Ausführungsformen vermitteln die Merkmale der aufgezeichneten Punkte zusätzliche Informationen über die Störungen. In einigen Ausführungsformen zeigt beispielsweise die Farbe und/oder Form des aufgezeichneten Punktes die Art der aufgezeichneten Probe an, z. B. Kontrolle, Test oder Abfrage. Dementsprechend, unter Bezugnahme auf 4K, umfasst das Verfahren 4000 in einigen Ausführungsformen das Einfärben (4094) des aufgezeichneten Punktes jedes jeweiligen Testvektors in der Vielzahl von Testvektoren in der zweidimensionalen Darstellung mit einer ersten Farbe, das Einfärben des aufgezeichneten Punktes jedes jeweiligen Kontrollvektors in der Vielzahl von Kontrollvektoren in der zweidimensionalen Darstellung mit einer zweiten Farbe und das Einfärben des aufgezeichneten Punktes jeder Abfrage-Störung in der Vielzahl von Abfrage-Störungen in der zweidimensionalen Darstellung mit einer dritten Farbe (z.B., wie in 6 gezeigt, wo Testvektorplots als Kreise, Kontrollvektorplots als Quadrate und Abfragestörungsplots als Dreiecke dargestellt sind). Zusätzlich oder alternativ können in einigen Ausführungsformen verschiedene Formen für Textvektorplots, Kontrollvektorplots und Abfrage-Störungsplots verwendet werden; und die verschiedenen Formen können mit oder ohne unterschiedliche Farben für die verschiedenen Plots und/oder mit oder ohne Schattierung verwendet werden (wobei die Intensität der Schattierung proportional oder umgekehrt proportional zu einem anderen Merkmal der aufgezeichneten Daten sein kann).
  • In ähnlicher Weise entspricht in einigen Ausführungsformen die Größe des gezeichneten Punktes einem Maß für die Varianz in den Merkmalen, die verwendet werden, um den Störungsvektor zu bilden, z. B. einen Kontrollvektor (108), einen Testvektor (110) oder einen Abfrage-Störungsvektor (112), wie in 1 beschrieben, aus dem die On-Target- und Off-Target-Werte berechnet wurden. Dementsprechend umfasst das Verfahren 4000 in einigen Ausführungsformen unter Bezugnahme auf 4L die Größenbestimmung (4096) des gezeichneten Punktes jedes jeweiligen Kontrollvektors in der Vielzahl von Kontrollvektoren in der zweidimensionalen Darstellung als Funktion einer Varianz des Maßes der zentralen Tendenz des zweiten Punktes, der zur Konstruktion des jeweiligen Kontrollvektors verwendet wurde. In ähnlicher Weise umfasst das Verfahren 4000 in einigen Ausführungsformen die Größenbestimmung (4098) des gezeichneten Punktes jedes jeweiligen Testvektors in der Vielzahl von Testvektoren in der zweidimensionalen Darstellung als Funktion einer Varianz des Maßes der zentralen Tendenz des zweiten Punktes, der verwendet wird, um den jeweiligen Testvektor zu konstruieren. In ähnlicher Weise umfasst in einigen Ausführungsformen das Verfahren 4000 die Größenbestimmung (4100) des aufgezeichneten Punktes jeder jeweiligen Abfragestörung in der Vielzahl von Abfragestörungen in der zweidimensionalen Darstellung als eine Funktion einer Varianz des jeweiligen Maßes der zentralen Tendenz der Vielzahl von Abfragestörungsdatenpunkten für jede Dimension in der Vielzahl von Dimensionen für die jeweilige Abfragestörung. Zum Beispiel werden die aufgezeichneten Punkte, die den in 6 dargestellten Kontrollstörungen, Teststörungen und Abfragestörungen entsprechen, auf der Grundlage der Varianz der jeweiligen zugrunde liegenden Merkmale dimensioniert. In einigen Ausführungsformen ist das Maß der zentralen Tendenz ein arithmetisches Mittel, ein gewichtetes Mittel, ein mittlerer Bereich, ein Midhinge, ein Trimean, ein geometrisches Mittel, ein geometrischer Median, ein winsorisiertes Mittel, ein Median oder ein Modus der Varianz der jeweiligen Merkmale. Dies hat den Vorteil, dass es einen Hinweis auf die Zuverlässigkeit der jeweiligen On-Target- und Off-Target-Werte für das Diagramm gibt. In einigen Ausführungsformen weisen beispielsweise kleinere Punkte auf kleinere Varianzen und größere Punkte auf größere Varianzen hin.
  • In einigen Ausführungsformen wird jede Verbindung auf eine oder mehrere Störungen in einer Vielzahl von Zelltypen (Zellkontexten) untersucht, um sicherzustellen, dass die mit einer bestimmten Verbindung beobachteten Effekte nicht auf einen bestimmten Zelltyp oder einen bestimmten Zustand der Zelle (z. B. Wachstumsstadium) beschränkt sind. Dementsprechend umfasst das Verfahren 4000 in einigen Ausführungsformen unter Bezugnahme auf 4M die Wiederholung (4102) des Erhaltens (4050), Berechnens (4060), Berechnens (4062) und Berechnens (4064) für jeden Zelltyp in einer Vielzahl von Zelltypen. In einigen Ausführungsformen umfasst die Vielzahl von Zelltypen mindestens 3 Zelltypen (4104). In anderen Ausführungsformen umfasst die Vielzahl von Zelltypen mindestens 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50 oder mehr Zelltypen. In einigen Ausführungsformen unterscheiden sich die Zelltypen nur durch eine genetische Veränderung, z. B. eine Gendeletion, -insertion oder -mutation. In einigen Ausführungsformen umfasst die Vielzahl der Zelltypen beispielsweise einen ersten Zelltyp und einen zweiten Zelltyp, der nach einer genetischen Veränderung (4106) der erste Zelltyp ist. In einigen Ausführungsformen umfasst die genetische Veränderung mindestens eine genetische Deletion oder Insertion (4108), die z. B. bewirkt, dass die Zelle einen „Krankheits“-Phänotyp aufweist.
  • Die 7A und 7B zeigen Dosis-Wirkungs-Kurven von Off-Target-Werten als Funktion von On-Target-Werten für verschiedene nicht erkrankte/nicht gestörte Zellkontexte (z. B. „gesunde“ Zellkontexte; Gruppierung von (meist) Quadraten 702), gestörte Zellkontexte (z. B., „Test“-Zellkontexte; Gruppierung von (meist) Kreisen 704) und gestörte Zellkontexte, die unterschiedlichen Konzentrationen verschiedener Verbindungen ausgesetzt sind (z. B. gescreente Testzellkontexte; Gruppierung von (meist) Dreiecken 706).
  • In einigen Ausführungsformen wird jede Verbindung bei einer Vielzahl von Konzentrationen untersucht, z. B. werden On-Target- und Off-Target-Werte für die Verbindung bei jeder Konzentration bestimmt. Dementsprechend, unter Bezugnahme auf 4N, umfasst das Verfahren 4000 in einigen Ausführungsformen die Wiederholung (4110) des Erhaltens (4050), Berechnens (4060), Berechnens (4062) und Berechnens (4064) für jede jeweilige Menge der Abfrage-Störung in einer Vielzahl von jeweiligen Mengen der Abfrage-Störung, wobei jede jeweilige Menge der Abfrage-Störung in der Vielzahl der jeweiligen Mengen der Abfrage-Störung als eine entsprechende Konzentration der Abfrage-Störung in der entsprechenden Teilmenge der Vielzahl von Vertiefungen ausgedrückt wird, wodurch ein On-Target-Wert und ein Off-Target-Wert bei jeder Konzentration in einer Vielzahl von Konzentrationen für die Abfrage-Störung erhalten wird. Die Auswertung (4066) würde das Auftragen der Abfragestörung bei jeder jeweiligen Konzentration in der Vielzahl von Konzentrationen auf einem zweidimensionalen Diagramm umfassen, wobei der On-Target-Wert für die Abfragestörung bei der jeweiligen Konzentration als eine Koordinate in einer ersten Dimension des zweidimensionalen Diagramms und der Off-Target-Wert für die Abfragestörung bei der jeweiligen Konzentration als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms verwendet wird (z. B. wie in den 7A und 7B als Reihe von verbundenen Punkten 707 dargestellt). Vorteilhafterweise erleichtert das Screening von Störungen bei einer Vielzahl von Konzentrationen die Identifizierung von Behandlungen, die bei einer bestimmten Konzentration möglicherweise nicht wirksam sind, was a priori nicht ersichtlich wäre. Das Screening von Störungen bei mehreren Konzentrationen erleichtert auch die Identifizierung von Behandlungen mit signifikanten Off-Target-Effekten bei höheren Konzentrationen, indem es Informationen über die On-Target- und Off-Target-Effekte einer Behandlung über einen Bereich von Konzentrationen liefert. Somit verbessert das Screening von Störungen bei einer Vielzahl von Konzentrationen die Identifizierung nützlicher Behandlungen.
  • In einigen Ausführungsformen wird jede Verbindung bei einer Vielzahl von Konzentrationen untersucht, und die sich ergebenden On-Target- und Off-Target-Werte werden als unabhängige Kurven aufgezeichnet, z. B. um die therapeutischen Eigenschaften einer Behandlung weiter zu charakterisieren. Dementsprechend umfasst das Verfahren 4000 in einigen Ausführungsformen unter Bezugnahme auf 40O die Wiederholung (4112) des Erhaltens (4050), Berechnens (4060), Berechnens (4062) und Berechnens (4064) für jede jeweilige Menge der Abfrage-Störung in einer Vielzahl von jeweiligen Mengen der Abfrage-Störung, wobei jede jeweilige Menge der Abfrage-Störung in der Vielzahl der jeweiligen Mengen der Abfrage-Störung als eine entsprechende Konzentration der Abfrage-Störung in der entsprechenden Teilmenge der Vielzahl von Vertiefungen ausgedrückt wird, wodurch ein On-Target-Wert und ein Off-Target-Wert bei jeder Konzentration in einer Vielzahl von Konzentrationen für die Abfrage-Störung erhalten wird. So umfasst in einigen Ausführungsformen die Auswertung (4066) das Auftragen der Abfragestörung bei jeder jeweiligen Konzentration in der Vielzahl von Konzentrationen auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für die Abfragestörung bei der jeweiligen Konzentration als eine Koordinate in einer ersten Dimension des zweidimensionalen Diagramms und der jeweiligen Konzentration als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms, wodurch eine On-Target-Kurve für die Abfragestörung erhalten wird (z.B., dargestellt als modellierte Kurven 802, 806, 810, 814, 818 und 822 in den 8A-8G). Ebenso umfasst in einigen Ausführungsformen die Auswertung (4066) das Auftragen der Abfrage-Störung bei jeder jeweiligen Konzentration in der Vielzahl von Konzentrationen auf dem zweidimensionalen Diagramm unter Verwendung des Off-Target-Werts für die Abfrage-Störung bei der jeweiligen Konzentration als eine Koordinate in der ersten Dimension des zweidimensionalen Diagramms und der jeweiligen Konzentration als eine Koordinate in der zweiten Dimension des zweidimensionalen Diagramms, wodurch eine Off-Target-Kurve für die Abfrage-Störung erhalten wird (z.B., dargestellt als modellierte Kurven 804, 808, 812, 816, 820 und 824 in den 8A-8G). Vorteilhafterweise erleichtert die Aufzeichnung von On-Target- und Off-Target-Werten als getrennte Funktionen der Konzentration für eine Abfrage-Störung die Identifizierung und Charakterisierung der therapeutischen Wirkungen einer Behandlung, wie z. B. durch die unterschiedlichen Muster der On-Target- und Off-Target-Kurven in den 8A-8G gezeigt.
  • In einigen Ausführungsformen werden die aufgezeichneten On-Target- und Off-Target-Werte, die für eine Vielzahl von Konzentrationen einer Suchstörung (z. B. einer Verbindung) berechnet wurden, an lineare oder nichtlineare Kurven angepasst. Vorteilhafterweise ermöglicht die Anpassung der On-Target- und Off-Target-Werte an eine Kurve die Quantifizierung von Bereichen, die durch eine oder mehrere der Kurven begrenzt werden, was Informationen über die therapeutischen Wirkungen der Abfrage-Störung liefert. Unter Bezugnahme auf 4AB umfasst das Verfahren 4000 in einigen Ausführungsformen die Anpassung (4194) der On-Target-Kurve an eine erste Sigmoidalfunktion. In einigen Ausführungsformen umfasst das Verfahren 4000 das Anpassen (4198) der Off-Target-Kurve an eine zweite sigmoide Funktion. In einigen Ausführungsformen umfasst das Verfahren 4000 die Anpassung der Summe der ersten sigmoiden Funktion und der zweiten sigmoiden Funktion, um eine biphasische Reaktion der Abfrage-Störung als Funktion der Konzentration zu ermöglichen. In einigen Ausführungsformen wird die Anpassung der Summe von zwei Sigmoiden, um biphasische Reaktionen zu ermöglichen, wie folgt durchgeführt: F ( x ) sig 1 ( x ) + sig 2 ( x ) .
    Figure DE112020002936T5_0003
    In einigen Ausführungsformen wird die On-Target-Kurve so eingeschränkt, dass d1 = 1 und d0 = 0 ist, z. B. so, dass die Summe der maximalen Antworten 1 ist, d. h. die Summe der maximalen Antworten liegt in der Mitte der Krankheits-Cloud. Die Off-Target-Kurve wird so eingeschränkt, dass C1 = C2 = 0 ist, d. h. sie muss bei einem Nebeneffekt von Null beginnen, d. h. es wird kein Effekt verursacht, wenn der Testzustand nicht der Abfrage-Störung ausgesetzt ist.
  • In einigen Ausführungsformen hat die erste Sigmoidalfunktion (z.B. an die die On-Target-Werte angepasst werden) die Form (4196): ( c + ( d c ) ( 1 + ( ( x E C 50 ) ) b ) ) + ( c + ( d c ) ( 1 + ( ( x E C 50 ) ) b ) ) ,
    Figure DE112020002936T5_0004
    wo:
    • c = ein für die Abfrage-Störung berechneter minimaler On-Target-Wert,
    • d = ein für die Abfrage-Störung berechneter maximaler On-Target-Wert,
    • EC50 = eine Konzentration der Abfrage-Störung, die der Hälfte ihrer maximalen On-Target-Wirkung entspricht,
    • x = eine Konzentration der Abfrage-Störung in der Vielzahl von Konzentrationen und
    • b = eine Hill-Steigung der On-Target-Kurve.
  • In ähnlicher Weise hat in einigen Ausführungsformen die zweite Sigmoidalfunktion (z.B. an die die Off-Target-Werte angepasst werden) die Form (4200): ( c ' + ( d ' c ' ) ( 1 + ( ( x E C 50 ' ) ) b ' ) ) + ( c ' + ( d ' c ' ) ( 1 + ( ( x E C 50 ' ) ) b ' ) ) ,
    Figure DE112020002936T5_0005
    wo:
    • c = ein für die Abfrage-Störung berechneter minimaler Off-Target-Wert,
    • d = ein für die Abfrage-Störung berechneter maximaler Off-Target-Wert ,
    • EC50 = eine Konzentration der Abfrage-Störung, die der Hälfte ihrer Off-Target-Wirkung entspricht,
    • x = eine Konzentration der Abfrage-Störung in der Vielzahl von Konzentrationen und
    • b = eine Hill-Steigung der Off-Target-Kurve.
  • Wie der Fachmann weiß, beschreibt die Hill-Steigung die Steilheit der Kurve. Diese Variable wird üblicherweise als Hill-Steigung, Steigungsfaktor oder Hill-Koeffizient bezeichnet. Ist er positiv, steigt die Kurve mit zunehmendem X an. Ist er negativ, so sinkt die Kurve mit zunehmendem X. Eine standardmäßige sigmoide Dosis-Wirkungs-Kurve, z. B. wie oben dargestellt, hat eine Hill-Steigung von 1,0. Wenn die Hill-Steigung kleiner als 1,0 ist, ist die Kurve flacher. Wenn die Hill-Steigung größer als 1,0 ist, ist die Kurve steiler. Die Hill-Steigung hat keine Einheiten.
  • Andere sigmoidale Funktionen und Funktionen, die eine sigmoidale Funktion annähern, die dem Fachmann bekannt sind, können ebenfalls zur Modellierung der On-Target- und Off-Target-Werte verwendet werden. Nicht einschränkende Beispiele für Funktionen, die sich zur Erzeugung einer sigmoidalen Kurve eignen, sind logistische Funktionen, hyperbolische Tangenten, Arkustangens-Funktionen, Gompertz-Kurven, Gudermann-Funktionen, Fehlerfunktionen, verallgemeinerte logistische Funktionen, Smoothstep-Funktionen und algebraische Funktionen. Für eine Übersicht über diese und andere geeignete Modellierungsfunktionen siehe z.B. CRC Standard Curves and Surfaces with Mathematica, Third Edition, Ed. David H. von Seggern, CRC Press, dessen Inhalt hier ausdrücklich durch Verweis in seiner Gesamtheit für alle Zwecke aufgenommen wird.
  • Quantifizierung des therapeutischen Ansprechens
  • In einigen Ausführungsformen werden sigmoidale Funktionen, die On-Target- und Off-Target-Werte über einen Bereich von Konzentrationen für eine Abfragestörung modellieren, z. B. wie oben beschrieben, verwendet, um einen therapeutischen Antwort-Wert für die Abfragestörung zu berechnen. Im Allgemeinen reagiert ein therapeutischer Antwort-Wert positiv auf On-Target-Werte und negativ auf Off-Target-Werte, so dass Abfrage-Störungen mit höheren On-Target-Werten und niedrigeren Off-Target-Werten therapeutische Antwort-Werte aufweisen, die höher sind als diejenigen für Verbindungen mit niedrigeren On-Target-Werten und höheren Off-Target-Werten. Die unten beschriebenen 8A-8G dienen zur Veranschaulichung des Konzepts des therapeutischen Ansprechens. Anstatt jedoch sigmoidale Funktionen zu zeichnen, die On-Target- und Off-Target-Werte modellieren, und eine Fläche zu integrieren, die durch bestimmte Grenzen innerhalb des Plots definiert ist, wird in einigen Ausführungsformen ein therapeutischer Antwort-Wert mathematisch als Funktion der On-Target- und Off-Target-Sigmoidalfunktionen bestimmt.
  • Unter Bezugnahme auf 8B und 4P umfasst das Verfahren 4000 in einigen Ausführungsformen die Verwendung (4114) der On-Target-Kurve 806 und der Off-Target-Kurve 808, um ein therapeutisches Fenster für die Abfrage-Störung zu quantifizieren, wobei das therapeutische Fenster durch eine Fläche 809 einer geschlossenen zweidimensionalen Form bestimmt wird, die begrenzt ist durch (i) eine Amplitude der On-Target-Kurve zwischen einer ersten Position 860 auf der On-Target-Kurve, die einen maximalen On-Target-Wert in der On-Target-Kurve darstellt, und einer zweiten Position 862, die einen Schnittpunkt der On-Target-Kurve und der Off-Target-Kurve darstellt, (ii) eine Amplitude der Off-Target-Kurve 808 zwischen der zweiten Position 862 und einer dritten Position 864 auf der Off-Target-Kurve, die einen maximalen Off-Target-Wert in der Off-Target-Kurve darstellt, und (iii) eine zwischen der ersten Position und der dritten Position gezogene Linie, z. B. dargestellt als Bereich 809 in 8B. Diese Teile von 8B sind in 8C isoliert und detaillierter dargestellt. Mit anderen Worten: Der Bereich 809 wird durch (i) den Abschnitt 882 der On-Target-Kurve 806, (ii) den Abschnitt 884 der Off-Target-Kurve 808 und die Linie 886 bestimmt (siehe 880 in 8C). In 8 hat die erste Position 860 eine ähnliche Amplitude wie die dritte Position 864. In einigen Ausführungsformen wird die Linie 886, die zum Teil zur Bestimmung des Bereichs 809 verwendet wird, von der ersten Position 860 zur dritten Position 864 gezogen. In alternativen Ausführungsformen, die in 8B nicht dargestellt sind, wird die Linie 886, die teilweise zur Bestimmung der Fläche 886 verwendet wird, von der ersten Position 860 mit einer Steigung von Null nach rechts gezogen, bis sie die Off-Target-Kurve 808 schneidet. In noch weiteren alternativen Ausführungsformen, die in 8B nicht dargestellt sind, wird die Linie 886, die teilweise zur Definition des Bereichs 886 verwendet wird, von der dritten Position 860 nach links mit Nullneigung gezogen, bis sie die On-Target-Kurve 806 schneidet. Diese alternativen Ausführungsformen werden z. B. in Fällen verwendet, in denen sich der maximale Wert für die On-Target- und die Off-Target-Kurve wesentlich voneinander unterscheiden. Es wird deutlich, dass eine beliebige Anzahl weiterer Varianten zur Berechnung von 809 möglich sind. In einigen Ausführungsformen hat die Linie 886 beispielsweise eine Steigung von Null und eine Amplitude, die dem Durchschnitt der Amplitude der ersten Position 860 und der dritten Position 864 entspricht, wobei das in 8B dargestellte Koordinatensystem verwendet wird. In noch anderen Ausführungsformen hat die Linie 886 eine Steigung von Null und eine Amplitude, die ein fester Prozentsatz des Durchschnitts der Amplitude der ersten Position 860 und der dritten Position 864 ist, wobei das in 8B dargestellte Koordinatensystem verwendet wird. Wenn beispielsweise der feste Prozentsatz 90 Prozent beträgt und der Durchschnitt der ersten Position 860 und der dritten Position 864 100 beliebige Einheiten beträgt, dann ist die Amplitude der Linie 886 90 beliebige Einheiten.
  • In einigen Ausführungsformen wird das therapeutische Fenster einer Abfragestörung (z. B. einer Therapie) für einen bestimmten Krankheitszustand durch eine Funktion des über den beiden Kurven begrenzten Bereichs dargestellt, wie z. B. der Bereich 809 in 8B. In einigen Ausführungsformen wird die Fläche, die dem therapeutischen Fenster entspricht, verwendet, um die Abfragestörungen im Hinblick auf die Behandlung eines bestimmten Testzustands in eine Rangfolge zu bringen, z. B. um zu ermitteln, welche Therapien zur Behandlung eines entsprechenden Krankheitszustands in Frage kommen.
  • Ungeachtet der verschiedenen Ausführungsformen für die Berechnung des Bereichs 809 wird, wie oben erörtert, in einigen Ausführungsformen der Bereich, der das therapeutische Fenster darstellt, zusätzlich gewichtet, um der Form des begrenzten Bereichs Rechnung zu tragen, der durch unterschiedliche Auswirkungen der Abfragestörungen beeinflusst wird. Das heißt, dass verschiedene Faktoren berücksichtigt werden, wenn bestimmt wird, welche Abfragestörungen effektiver sind, um einen Testzustand zu adressieren. Diese können dazu verwendet werden, Annahmen darüber zu treffen, welche Therapien für den In-vivo-Einsatz besser geeignet sind, z. B. wenn der begrenzte Bereich für verschiedene Verbindungen gleich ist. Die in den 8D-8G dargestellten begrenzten Bereiche haben beispielsweise alle die gleiche Fläche X. Die Form des begrenzten Bereichs, wie sie z. B. durch die Form der Kurven für die On-Target- und Off-Target-Werte bestimmt wird, ist jedoch unterschiedlich und gibt Aufschluss über die Auswirkungen der entsprechenden Therapien. Dementsprechend wird in einigen Ausführungsformen die Rangfolge der Abfragestörungen für einen bestimmten Testzustand durch Annahmen über die Form des Bereichs bestimmt. In einigen Ausführungsformen wird beispielsweise davon ausgegangen, dass Therapien, die einen Phänotyp retten (z. B. eine positive therapeutische Wirkung haben), bei niedrigeren Dosen besser sind als Therapien, die einen Phänotyp bei höheren Dosen retten. Daher wird in einigen Ausführungsformen ein therapeutisches Fenster (Bereich 809) gewichtet, um die Bewertungen für Wirkstoffe, die bei niedrigeren Dosen wirksam sind, zu beeinflussen. Beispielsweise zeigt die On-Target-Kurve 818 in 8F eine Wirksamkeit zur Rettung eines Testzustands bei einer niedrigeren Konzentration einer ersten entsprechenden Abfrage-Störung als die On-Target-Kurve 822 in 8G für eine zweite entsprechende Abfrage-Störung. Daher wäre in einigen Ausführungsformen ein für die Abfrage-Störung gemäß 8F berechneter Rettungswert höher als der für die Abfrage-Störung gemäß 8G berechnete Rettungswert. Dementsprechend wird in einigen Ausführungsformen die Fläche 809 (z. B. die begrenzte Fläche 809 über den On-Target- und Off-Target-Kurven) mit der Konzentration der Abfrage-Störung (Dosis) an der zweiten Position 862 gewichtet (4118). In 8B wird der Fall betrachtet, dass die Fläche 809 110 willkürliche Einheiten im Quadrat beträgt und die Konzentration der Abfrage-Störung (Dosis) an der zweiten Position 862 100 mikromolar ist. In einigen derartigen Ausführungsformen wird die Fläche 809 gewichtet, indem 100 x 10-6 M mit 110 beliebigen Einheiten zum Quadrat multipliziert wird, um einen endgültigen gewichteten Wert für die Fläche 809 zu erhalten. Wie zu erkennen ist, können auch andere Formen der Gewichtung durchgeführt werden. Zum Beispiel wird in einigen Ausführungsformen die Fläche 809 durch die Konzentration der Abfragestörung (Dosis) an der zweiten Position 862 geteilt. In noch anderen Ausführungsformen wird die Fläche 809 gewichtet, indem die Fläche durch den log10 der Konzentration der Abfragestörung (Dosis) an der zweiten Position 862 geteilt wird. In noch anderen Ausführungsformen wird die Fläche 809 gewichtet, indem die Fläche mit dem log10 der Konzentration der Abfragestörung (Dosis) an der zweiten Position 862 multipliziert wird. Solche Beispiele dienen zur Veranschaulichung, dass es viele verschiedene Möglichkeiten gibt, wie die Konzentration der Abfragestörung (Dosis) an der zweiten Position 862 zur Gewichtung der Fläche 809 verwendet werden kann, und dass alle diese Möglichkeiten in den Anwendungsbereich der vorliegenden Offenbarung einbezogen sind.
  • In einigen Ausführungsformen wird davon ausgegangen, dass Therapien, die ein längeres Fenster zwischen Rettung und Nebenwirkung aufweisen, besser sind als Therapien mit einem kürzeren Fenster zwischen Rettung und Nebenwirkung. Daher wird in einigen Ausführungsformen das therapeutische Fenster 809 gewichtet, um Bewertungen für Verbindungen zu verzerren, bei denen der Abstand (z. B. ein Maß für die zentrale Tendenz des Abstands zwischen einer On-Target-Kurve und einer Off-Target-Kurve oder ein maximaler Abstand zwischen einer On-Target-Kurve und einer Off-Target-Kurve an einem bestimmten Punkt) zwischen einer für einen Testzustand berechneten On-Target-Kurve und einer entsprechenden für den Testzustand berechneten Off-Target-Kurve größer ist. Dementsprechend wird die Fläche 809 (z. B. die begrenzte Fläche über der On-Target- und der Off-Target-Kurve) unter Bezugnahme auf 880 in 8C in einigen Ausführungsformen mit dem geringsten Abstand 886 zwischen der zweiten Position 862 und der Linie 886, die zwischen der ersten Position 860 und der dritten Position 864 gezogen wird, gewichtet (4116). In einigen Ausführungsformen wird die Fläche 809 vor einer solchen Gewichtung zunächst mit einer der oben beschriebenen Varianten berechnet. Darüber hinaus kann der geringste Abstand 886 zwischen der zweiten Position 862 und der Linie 886, die zwischen der ersten Position 860 und der dritten Position 864 gezogen wird, auf viele verschiedene Arten als Gewicht für die Fläche 809 verwendet werden. In einigen Ausführungsformen wird die Fläche 809, die das therapeutische Fenster darstellt, mit einer Länge der Linie 886 gewichtet. In 8B ist der Fall dargestellt, dass die Fläche 809 110 willkürliche Einheiten zum Quadrat und die Länge der Linie 886 80 Einheiten des Krankheitswertes (Einheiten der y-Achse) beträgt. In einigen derartigen Ausführungsformen wird die Fläche 809 gewichtet, indem 80 Krankheitspunkteinheiten mit 110 beliebigen Einheiten zum Quadrat multipliziert werden, um einen gewichteten Endwert für die Fläche 809 zu erhalten. Wie zu erkennen ist, können auch andere Formen der Gewichtung durchgeführt werden. In einigen Ausführungsformen wird beispielsweise die Fläche 809 durch die Länge (Anzahl der Krankheits-Wert-Einheiten) der Linie 886 geteilt. In noch anderen Ausführungsformen wird die Fläche 809 gewichtet, indem die Fläche durch den log10 der Länge der Linie 886 geteilt wird. In wieder anderen Ausführungsformen wird die Fläche 809 gewichtet, indem die Fläche mit dem log10 der Länge der Linie 886 (in Krankheitspunkteinheiten) multipliziert wird. Diese Beispiele sollen veranschaulichen, dass es viele verschiedene Möglichkeiten gibt, wie die Konzentration der Länge der Linie 886 zur Gewichtung der Fläche 809 verwendet werden kann, und dass alle diese Möglichkeiten in den Anwendungsbereich der vorliegenden Offenbarung fallen.
  • In einigen Ausführungsformen wird davon ausgegangen, dass Therapien (z. B. Verbindungen), die eine größere Rettung für einen Testzustand bieten (z. B. einen größeren positiven therapeutischen Effekt), besser sind als Therapien, die einen geringeren Rettungseffekt bieten. Dementsprechend wird in einigen Ausführungsformen ein therapeutisches Fenster 809 gewichtet, um die Bewertungen für Verbindungen, die eine größere Wirksamkeit aufweisen, zu beeinflussen. Beispielsweise erreicht die On-Target-Kurve 814 in 8E ihren Höhepunkt bei einer sehr viel geringeren als der vollständigen Rettung des Phänotyps im Testzustand. Das heißt, dass die On-Target-Kurve in 8E bei höheren Dosen der Verbindung nicht auf Null abfällt, sondern sich bei einem Wert deutlich über Null einpendelt, unabhängig von der zusätzlichen Menge (höheren Dosis) der Verbindung, die verwendet wird. Dies steht im Gegensatz zu der On-Target-Kurve 810 in 8D, die bei höheren Konzentrationen (Dosen) der Testverbindungen auf Null abfällt. In einigen Ausführungsformen wird daher ein Rettungswert, der für die Abfragestörung (z. B. eine Verbindung) berechnet wird, die dem unter Verwendung von 8D berechneten Rettungsbereich 809 entspricht, relativ zu dem Rettungswert, der für die Abfragestörung berechnet wird, die dem unter Verwendung von 8E berechneten Rettungsbereich 809 entspricht, höher gewichtet. Ein solches Gewicht kann auf beliebige Weise kodiert werden. In einigen Ausführungsformen wird beispielsweise der minimale Krankheitswert aus der On-Target-Kurve abgeleitet (z. B. der minimale y-Wert der On-Target-Kurve unter Verwendung des Koordinatensystems von 8), und dieser minimale Krankheitswert wird zur Gewichtung des entsprechenden Bereichs 809 verwendet. Im Fall von 8D ist der minimale Krankheitswert Null, während in 8E der minimale Krankheitswert der On-Target-Kurve wesentlich größer als Null ist. Da der niedrigere Krankheitswert höher gewichtet werden soll, kann eine Gewichtung als fester Wert abzüglich des minimalen Krankheitswertes formuliert werden. In einigen Ausführungsformen ist die Gewichtung beispielsweise die Differenz zwischen dem maximalen Krankheitswert und dem minimalen Krankheitswert auf der On-Target-Kurve. Wie in 8D dargestellt, wäre die Gewichtung in solchen Fällen also der Krankheitswert der Position 860 minus dem Krankheitswert der Position 888. Wie bereits erwähnt, kann eine solche Gewichtung auf den Rettungsbereich 809 auf verschiedene Weise angewandt werden, wodurch der Bereich gewichtet wird. Beispielsweise kann das Gewicht mit dem Rettungsbereich 809 multipliziert oder geteilt werden, oder eine mathematische Funktion des Gewichts, wie z. B. ein Logarithmus des Gewichts, kann mit dem Rettungsbereich 809 multipliziert oder geteilt werden.
  • In einigen Ausführungsformen wird davon ausgegangen, dass Therapien, die geringere Nebenwirkungen haben (z. B. niedrige Off-Target-Werte), besser sind als Therapien, die größere Nebenwirkungen haben. Beispielsweise erreicht die Off-Target-Kurve 816 in 8E im Vergleich zur Off-Target-Kurve 812 in 8D ein Plateau bei geringeren Off-Target-Effekten (gemessen in Krankheits-Wert-Einheiten). Daher würde in einigen Ausführungsformen ein Rettungs-Wert, der für die Abfrage-Störung (z. B. eine Verbindung) berechnet wird, die dem unter Verwendung von 8E berechneten Rettungs-Bereich 809 entspricht, relativ zu dem Rettungs-Wert, der für die Abfrage-Störung berechnet wird, die dem unter Verwendung von 8D berechneten Rettungs-Bereich 809 entspricht, höher gewichtet werden. Eine solche Gewichtung kann auf beliebige Weise kodiert werden. In einigen Ausführungsformen wird beispielsweise ein maximaler Krankheitswert aus der Off-Target-Kurve abgeleitet (z. B. der maximale y-Wert der Off-Target-Kurve unter Verwendung des Koordinatensystems von 8), und dieser maximale Krankheitswert wird zur Gewichtung des entsprechenden Bereichs 809 verwendet. Im Fall von 8D ist der maximale Krankheitswert der Off-Target-Kurve größer als der der entsprechenden Off-Target-Kurve in 8E. Da für einen niedrigeren maximalen y-Wert (Krankheitseinheiten) eine höhere Gewichtung gewünscht wird, kann eine Gewichtung als fester Wert abzüglich des maximalen y-Wertes der Off-Target-Kurve formuliert werden. In einigen Ausführungsformen ist die Gewichtung beispielsweise die Differenz zwischen dem maximalen Krankheitswert der On-Target-Kurve und dem minimalen Krankheitswert der Off-Target-Kurve. Bezogen auf 8D wäre die Gewichtung in solchen Ausführungsformen also der Krankheitswert der Position 860 minus dem Krankheitswert der Position 890. In einigen Ausführungsformen ist die Gewichtung gleich: 1 + ( Krankheitswert an Position 860 ) ( Krankheitswert an Position 890 )
    Figure DE112020002936T5_0006
  • In noch anderen Ausführungsformen ist die Gewichtung bzw. das Gewicht: Konstante + ( Krankheitswert an Position 860 ) ( Krankheitswert an Position 890 )
    Figure DE112020002936T5_0007
    wobei die Konstante von Fall zu Fall bestimmt wird, z. B. für ein bestimmtes Zellfeld, ein zusammengesetztes Feld oder eine Reihe von Testbedingungen. Wie bereits erwähnt, können solche Gewichte auf den Rettungsbereich 809 auf verschiedene Weise angewendet werden, wodurch der Bereich gewichtet wird. Beispielsweise kann das Gewicht mit dem Rettungsbereich 809 multipliziert oder geteilt werden, oder eine mathematische Funktion des Gewichts, z. B. ein Logarithmus des Gewichts, kann mit dem Rettungsbereich 809 multipliziert oder geteilt werden.
  • Mit Bezug auf 4Q beinhaltet das Verfahren 4000 in einigen Ausführungsformen die Verwendung (4120) der On-Target-Kurve und der Off-Target-Kurve, um eine Rettungsqualität für die Abfrage-Störung zu quantifizieren, wobei die Rettungsqualität durch Integration einer Differenz zwischen (a) der Amplitude der ersten Position und (b) dem maximalen Krankheitswert bei jeder jeweiligen Konzentration in der Vielzahl von Konzentrationen bestimmt wird, wobei der maximale Krankheitswert bei jeder jeweiligen Konzentration in der Vielzahl von Konzentrationen der größte Krankheitswert aus der On-Target-Kurve und der Off-Target-Kurve bei der jeweiligen Konzentration ist. Dies ist in 8C isoliert und ausführlicher in 880 dargestellt. Bei allen Konzentrationen links vom Punkt 862 liegt der maximale Krankheitswert auf dem Segment 882 der On-Target-Kurve 806. Für Konzentrationen links von Punkt 862 werden daher die Unterschiede im Krankheitswert zwischen Linie 886 und Linie 882 integriert, um den ersten Teil des Bereichs 809 zu bilden. Bei allen Konzentrationen rechts von Punkt 862 ist der höchste Krankheitswert auf dem Segment 884 der Off-Target-Kurve 808 zu finden. Daher werden für Konzentrationen rechts von Punkt 862 die Unterschiede zwischen Linie 886 und Linie 884 integriert, um den zweiten Teil der Fläche 809 zu bilden.
  • In einigen Ausführungsformen wird ein therapeutischer Antwort-Wert berechnet, indem ein relatives Maß der On-Target- und Off-Target-Werte integriert wird, die von den Modellsigmoidalfunktionen bei einer Vielzahl von Konzentrationen bereitgestellt werden. Unter Bezugnahme auf 4R schließt das Verfahren 4000 in einigen Ausführungsformen die Verwendung (4122) der On-Target-Kurve und der Off-Target-Kurve ein, um eine Rettungsqualität (therapeutischer Antwort-Wert) für die Abfrage-Störung zu quantifizieren. In solchen Ausführungsformen ist die Rettungsqualität ein Maß für die Qualität einer Abfrage-Störung, wobei die Rettungsqualität wie folgt berechnet wird: i = [ a ] [ b ] max ( Ph a ¨ notyp ( c i ) , S e i t e ( c i ) ) log ( c i Gewicht ) c i d c
    Figure DE112020002936T5_0008
    Wobei:
    • ci ist eine i-te-Konzentration der Verbindung in der Vielzahl von Konzentrationen für die Verbindung,
    • i ist ein Index für jede Konzentration der Verbindung in der Vielzahl von Konzentrationen,
    • [a] ist eine der niedrigsten und höchsten Konzentrationen der Verbindung in der Vielzahl von Konzentrationen,
    • [b] ist die jeweils andere der niedrigsten und der höchsten Konzentration der Verbindung in der Vielzahl von Konzentrationen,
    • Phönotyp(ci) ist der On-Target-Wert (z. B. der Krankheits-Wert auf der y-Achse in 8B) für die Verbindung bei der Konzentration ci in der Phänotypkurve (z. B. die On-Target-Kurve 806 in 8B),
    • Seite (ci) ist der Off-Target-Wert (z. B. der Krankheits-Wert auf der y-Achse in 8B) für die Verbindung bei der Konzentration ci in der Nebenwirkungskurve (z. B. die Off-Target-Kurve 808 in 8B), und
    • Gewicht ist ein numerisches Gewicht.
  • In einigen Ausführungsformen wird anstelle des Logarithmus des Produkts aus der i-ten-Konzentration der Verbindung und dem numerischen Gewicht der natürliche Logarithmus oder eine andere Logarithmusbasis des Produkts verwendet. In einigen Ausführungsformen stellt das Produkt aus der i-ten-Konzentration des Wirkstoffs und der numerischen Gewichtung eine Konfidenz des Flächenwerts dar, der die Kurvenanpassung an das rohe Testergebnis und den Nebenwirkungswert misst. In einigen Ausführungsformen wird eine Warnung ausgegeben, wenn der Logarithmus der Residuen über einer Standardabweichung vom Mittelwert aller Assays liegt. Residuen für die Testzustands- und Nebenwirkungswerte sind definiert als die Summe der absoluten Residuen zwischen den sigmoidalen Anpassungen und den Testzustands-, Rettungs- und Nebenwirkungsdaten eines Arzneimittels. Nicht einschränkende Beispiele für numerische Gewichte umfassen Werte zwischen 100 und 100.000, z. B. 100, 250, 500, 1000, 2500, 5000, 7500, 10.000, 25.000, 50.000, 75.000, 100.000 und jeden Wert dazwischen. In einer Ausführungsform beträgt das numerische Gewicht 7500. In einigen Ausführungsformen wird das Gewicht so gewählt, dass die Rettungswerte für die Verbindungen tendenziell in eine geeignete Verteilung fallen, z. B. in eine Normalverteilung. Siehe Statistical Reasoning, Allyn and Bacon, Needham Heights, Massachusetts, 1991, Kapitel 7, S. 267-299, das hiermit durch Bezugnahme einbezogen wird. In einigen Ausführungsformen wird das Gewicht so gewählt, dass sich die Rettungswerte für die Verbindungen ausreichend unterscheiden, um die getesteten Verbindungen in eine Rangfolge zu bringen.
  • In einigen Ausführungsformen wird die Rettungsqualität wie folgt berechnet: i = a b e ( d 2 s 2 σ 2 ) e ( 1 σ 2 ) 1 e ( 1 σ 2 )
    Figure DE112020002936T5_0009
    wo,
    • d ist der On-Target-Wert für die Störung bei Konzentration i,
    • s ist der Off-Target-Wert für die Störung bei Konzentration i,
    • σ ist die Standardabweichung eines Gauß-Kerns, und
    • i ist ein Index für jede Konzentration oder eine Untergruppe von Konzentrationen der Verbindung in einer Vielzahl von Konzentrationen.
  • In einigen Ausführungsformen wird die Rettungsqualität wie folgt berechnet: i 2 e | a d d | n d a s s 2 1
    Figure DE112020002936T5_0010
    wo,
    • d ist der On-Target-Wert für die Störung bei Konzentration i,
    • s ist der Off-Target-Wert für die Störung bei Konzentration i,
    • ad ist eine Konstante, die auf der Grundlage von Messungen der Ausbreitung der Krankheit und der gesunden Clouds so gewählt wird, dass die Qualität bei d = 1 und s = 0 gleich 0 ist und die Qualität an einem Punkt mit gleichem Abstand zur kranken und gesunden Cloud 1 2
      Figure DE112020002936T5_0011
      ist und
    • i ist ein Index für jede Konzentration oder eine Untergruppe von Konzentrationen der Verbindung in einer Vielzahl von Konzentrationen.
  • In einigen Ausführungsformen werden die Testergebnisse für eine oder mehrere Abfragestörungen aus dem Datensatz entfernt, bevor die anderen untersuchten Abfragestörungen analysiert und/oder in eine Rangfolge gebracht werden. Eine solche Eliminierung ermöglicht es, das endgültige Ranking und die grafische Darstellung der verbleibenden Abfragestörungen so zu filtern, dass Störungen, die für den Assay als nicht nützlich erachtet werden, nicht berücksichtigt werden. Dies verbessert die Übersichtlichkeit der endgültigen Diagramme. Unter Bezugnahme auf 4AA eliminiert (4190) das Verfahren 4000 in einigen derartigen Ausführungsformen eine oder mehrere Abfragestörungen aus der Vielzahl von Abfragestörungen unter Verwendung eines Eliminierungskriteriums, das zumindest teilweise auf dem On-Target-Wert jeder Abfragestörung in der Vielzahl von Abfragestörungen basiert. In einigen solchen Ausführungsformen ist das Eliminationskriterium (4192): E = uudx K uuudx ,
    Figure DE112020002936T5_0012
    wobei:
    • jede jeweilige Abfragestörung in der Vielzahl von Abfragestörungen, die einen Target-Wert von weniger als E hat, aus der Vielzahl von Abfragestörungen eliminiert wird,
    • uudx = ein Maß für die zentrale Tendenz des Target-Werts über die Vielzahl der Abfragestörungen hinweg ist,
    • uuudx = eine Standardabweichung des Target-Werts über die Vielzahl von Abfragestörungen ist, und
    • K = ein Gewicht ist.
  • Das heißt, die Störungen, die K Standardabweichungen unter dem Durchschnittswert für die Störungen liegen, werden eliminiert. Ist K beispielsweise „1“, werden diejenigen Störungen eliminiert, die mehr als 1 Standardabweichung unter dem Durchschnittswert der Störungen liegen. Ist K gleich „2“, so werden diejenigen Störungen eliminiert, die mehr als 2 Standardabweichungen unter dem Durchschnittswert der Störungen liegen. Für jede jeweilige Abfragestörung, die in der Vielzahl von Abfragestörungen verbleibt, wird das Gewinnen (4050), Berechnen (4060), Berechnen (4062) und Berechnen (4064) für jede jeweilige Menge der jeweiligen Abfragestörung in einer Vielzahl von jeweiligen Mengen der jeweiligen Abfragestörung wiederholt. Jede jeweilige Menge der jeweiligen Abfragestörung wird als eine entsprechende Konzentration der jeweiligen Abfragestörung in der entsprechenden Teilmenge der Vielzahl von Vertiefungen ausgedrückt, wodurch ein On-Target-Wert und ein Off-Target-Wert bei jeder Konzentration in einer Vielzahl von Konzentrationen für die jeweilige Abfragestörung erhalten wird. In einigen Ausführungsformen ist die Gewichtung (K) 3. In anderen Ausführungsformen ist die Gewichtung K 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 oder mehr. In einigen Ausführungsformen ist eine minimale und/oder maximale Anzahl von Abfrage-Störungen erforderlich, um voranzukommen. Dementsprechend wird in einigen Ausführungsformen eine Verschiebung des Schwellenwerts vorgenommen, wenn die gewünschten minimalen oder maximalen Spezifikationen verletzt werden, z. B. damit das Verfahren fortgesetzt werden kann.
  • 6 zeigt ein Beispieldiagramm der On-Target- und Off-Target-Effekte der untersuchten Wirkstoffe, das nach den hier beschriebenen Methoden erstellt wurde. Das Diagramm zeigt Informationen über die Auswirkungen jedes Medikaments in Bezug auf seine Fähigkeit, morphologische Defekte zu beheben, die mit dem Knockdown eines krankheitsassoziierten Gens verbunden sind, sowie das Ausmaß unspezifischer Effekte (z. B. Nebenwirkungen und Toxizität), die durch die Behandlung verursacht werden. Die Daten werden im Verhältnis zu den mit dem Vehikel behandelten Knockdowns (Krankheit), dargestellt als Quadrate, und den Negativkontrollen (Kontrolle), dargestellt als Kreise, dargestellt. Die Reaktionen auf das Medikament sind als Dreiecke dargestellt. Der Krankheits-Wert (auf der x-Achse) misst die Ähnlichkeit zwischen der untersuchten Funktionsverlust-Krankheitssignatur und der Signatur der jeweiligen Behandlung. Der Nebenwirkungs-Wert (auf der y-Achse dargestellt) misst die verbleibenden Wirkungen einer Behandlung, die von der Krankheitssignatur unabhängig sind. Ein Medikament, das einer Abfrage-Störung mit einem Krankheits-Wert und einem Off-Target-Wert entspricht, der näher an der Mitte der Cloud „gesunder“ Kontrollen liegt, hat im Vergleich zu anderen Medikamenten eine höhere Wahrscheinlichkeit, die Krankheitssignatur erfolgreich zu retten, ohne Nebenwirkungen zu verursachen. Die Größe der Marker in jedem Datendiagramm spiegelt das Vertrauen in den Krankheitswert wider (je größer der Marker, desto größer das Vertrauen in den Krankheitswert). Die 7A und 7B zeigen Beispiele für ähnliche Diagramme, die mit Tests erstellt werden können, die mit steigenden Konzentrationen des Arzneimittelkandidaten durchgeführt werden, wie die verbundenen Punkte 707 zeigen.
  • Assay-Qualität
  • In einigen Ausführungsformen wird eine oder mehrere Metrik(en) in Bezug auf die Qualität des Screening-Tests bestimmt, z. B. um die Leistung der verwendeten Screening-Methode zu bewerten und Informationen über das Vertrauen in Abfrage-Störungen (z. B. Therapien) zu erhalten, die als vielversprechend für die Behandlung einer bestimmten Indikation identifiziert wurden, z. B. als Schritt 134 in Verfahren 100.
  • Unter Bezugnahme auf 4S beinhaltet das Verfahren 4000 in einigen Ausführungsformen die Bestimmung der Qualität eines oder mehrerer Testzustände, die beim Screening verwendet werden. In einigen Ausführungsformen umfasst dies das Berechnen (4124) einer Vielzahl von Testvektoren, wobei jeder jeweilige Testvektor in der Vielzahl von Testvektoren zwischen (i) dem ersten Punkt und (ii) einem zweiten Punkt liegt, der durch einen jeweiligen Testdatenpunkt in dem Satz von Testdatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist. In einigen Ausführungsformen umfasst das Verfahren 4000 dann das Berechnen (4126) einer Vielzahl von Kontrollzustandsvektoren, wobei jeder jeweilige Kontrollzustandsvektor in der Vielzahl von Kontrollzustandsvektoren zwischen (i) dem ersten Punkt und (ii) einem dritten Punkt liegt, der durch einen jeweiligen Kontrolldatenpunkt in der Menge von Kontrolldatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist. Unter Bezugnahme auf 4T umfasst das Verfahren 4000 in einigen Ausführungsformen dann die Berechnung (4128) eines On-Target-Werts für jeden jeweiligen Testvektor in der Vielzahl von Testvektoren als Projektion des jeweiligen Testvektors auf den zusammengesetzten Testvektor. In einigen Ausführungsformen umfasst das Verfahren 4000 dann das Berechnen (4130) eines Off-Target-Wertes für jeden jeweiligen Testvektor in der Vielzahl der Testvektoren als eine Ablehnung des jeweiligen Testvektors gegenüber dem zusammengesetzten Testvektor. In einigen Ausführungsformen umfasst das Verfahren 4000 dann das Berechnen (4132) eines On-Target-Werts für jeden jeweiligen Kontrollvektor in der Vielzahl der Kontrollvektoren als eine Projektion des jeweiligen Kontrollvektors auf den zusammengesetzten Testvektor. In einigen Ausführungsformen umfasst das Verfahren 4000 dann das Berechnen (4134) eines Off-Target-Werts für jeden jeweiligen Kontrollvektor in der Vielzahl der Kontrollvektoren als eine Ablehnung des jeweiligen Kontrollvektors gegenüber dem zusammengesetzten Testvektor. In einigen Ausführungsformen umfasst das Verfahren 4000 dann das Auftragen (4136) jedes jeweiligen Testvektors in der Vielzahl von Testvektoren auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für den jeweiligen Testvektor als eine Koordinate in einer ersten Dimension des zweidimensionalen Diagramms und des Off-Target-Werts für den jeweiligen Testvektor als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms, wodurch eine Vielzahl von Testzustandsdatenpunkten erhalten wird. In einigen Ausführungsformen umfasst das Verfahren 4000 dann das Auftragen (4138) jedes jeweiligen Kontrollvektors in der Vielzahl von Kontrollvektoren auf dem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für den jeweiligen Kontrollvektor als eine Koordinate in der ersten Dimension und des Off-Target-Werts für den jeweiligen Kontrollvektor als eine Koordinate in der zweiten Dimension, wodurch eine Vielzahl von Kontrolldatenpunkten erhalten wird. In einigen Ausführungsformen umfasst das Verfahren 4000 dann das Berechnen (4140) eines normalisierten Abstands zwischen der Vielzahl von Testzustandsdatenpunkten und der Vielzahl von Kontrolldatenpunkten.
  • Unter Bezugnahme auf 4U umfasst in einigen Ausführungsformen die Bestimmung der Qualität eines oder mehrerer Testzustände, die beim Screening verwendet werden, die Berechnung (4142) einer normalisierten Dichtheit der Vielzahl von Testzustandsdatenpunkten. In einigen Ausführungsformen erfolgt die Normierung durch das zweite Moment der zweiten Maßverteilung (Winkel in Kontrollen). Dementsprechend wird unter Bezugnahme auf 4V in einigen Ausführungsformen die normalisierte Dichtheit durch ein Verfahren berechnet, das für jeden jeweiligen Testvektor in der Vielzahl von Testvektoren die Berechnung einer Testzustands-ähnlichen Metrik zwischen (i) dem jeweiligen Testvektor und (ii) einer Verteilungsmetrik der Vielzahl von Testvektoren mit dem jeweiligen Testvektor, der aus der Vielzahl von Testvektoren entfernt wurde, umfasst (4144), wodurch eine Vielzahl von Testzustandsähnlichkeitsmetriken für die Vielzahl von Testvektoren erhalten wird, wobei jede Testzustandsähnlichkeitsmetrik in der Vielzahl von Testzustandsähnlichkeitsmetriken eindeutig einer Teststörung in dem Satz von Teststörungen entspricht. Das Verfahren umfasst auch das Berechnen einer komplementären Verteilung durch einen Unterprozess, der Folgendes umfasst: (a) für jeden jeweiligen Kontrollzustandsvektor in der Vielzahl von Kontrollzustandsvektoren, Berechnen einer jeweiligen Kontrollähnlichkeitsmetrik zwischen (i) dem jeweiligen Kontrollvektor und (ii) einer Verteilungsmetrik der Vielzahl von Kontrollvektoren, wobei der jeweilige Kontrollvektor aus der Vielzahl von Kontrollvektoren entfernt wird, wodurch die Vielzahl von Kontrollähnlichkeitsmetriken erhalten wird, wobei jede Kontrollähnlichkeitsmetrik in der Vielzahl von Kontrollähnlichkeitsmetriken eindeutig einer Kontrollstörung in dem Satz von Kontrollstörungen entspricht, und (b) Berechnen der komplementären Verteilung als eine Verteilungsmetrik der Vielzahl von Kontrollähnlichkeitsmetriken. Das Verfahren umfasst auch die Bestimmung eines ersten Maßes der zentralen Tendenz des Winkels zwischen (i) jeder jeweiligen Testzustandsähnlichkeitsmetrik in der Vielzahl von Testzustandsähnlichkeitsmetriken und (ii) der komplementären Verteilung über die Vielzahl von Testzustandsähnlichkeitsmetriken. Das Verfahren umfasst auch die Normierung des ersten Maßes der zentralen Tendenz des Winkels durch ein zweites Maß der zentralen Tendenz des Winkels zwischen (i) jeder Kontrollähnlichkeitsmetrik in der Vielzahl der Kontrollähnlichkeitsmetriken und (ii) der komplementären Verteilung über die Vielzahl der Kontrollähnlichkeitsmetriken, wobei das normierte erste Maß der zentralen Tendenz die normierte Dichtheit der Vielzahl der Testzustandsdatenpunkte darstellt.
  • In einigen Ausführungsformen ist die Verteilungsmetrik der Vielzahl von Testvektoren, wenn der jeweilige Testvektor aus der Vielzahl von Testvektoren entfernt wird, ein Maß der zentralen Tendenz jeder entsprechenden Dimension in der Vielzahl von Dimensionen über die Vielzahl von Testvektoren außer dem jeweiligen Testvektor (4146). In einigen Ausführungsformen ist das Maß der zentralen Tendenz jeder entsprechenden Dimension in der Vielzahl von Dimensionen über die Vielzahl von Testvektoren, die nicht der jeweilige Testvektor sind, ein arithmetisches Mittel, ein gewichtetes Mittel, ein mittlerer Bereich, ein Midhinge, ein Trimean, ein geometrisches Mittel, ein geometrischer Median, ein winsorisierter Mittelwert, ein Median oder ein Modus der entsprechenden Dimension über die Vielzahl von Testvektoren (4148). In einigen Ausführungsformen wird der jeweilige Testzustand ähnlich der Metrik zwischen (i) dem jeweiligen Testvektor und (ii) der Verteilungsmetrik der Vielzahl von Testvektoren berechnet, wobei der jeweilige Testvektor aus der Vielzahl von Testvektoren entfernt wird, als ein Abstand zwischen entsprechenden Dimensionen des Testvektors und der Verteilungsmetrik der Vielzahl von Testvektoren, wobei der jeweilige Testvektor aus der Vielzahl von Testvektoren entfernt wird (4150). In einigen Ausführungsformen ist der Abstand ein Winkelabstand, der wie folgt berechnet wird (4152): i n A i B i i = 1 n A i 2 i = 1 n B i 2
    Figure DE112020002936T5_0013
    wo:
    • Ai ist eine Dimension i im jeweiligen Testvektor,
    • Bi ist die Verteilungsmetrik der entsprechenden Dimension i in der Vielzahl von Dimensionen über die Vielzahl von Testvektoren, die nicht der jeweilige Testvektor sind, und
    • n ist die Anzahl der Dimensionen des jeweiligen Testvektors.
  • Unter Bezugnahme auf 4W ist in einigen Ausführungsformen die Verteilungsmetrik der Vielzahl von Kontrollvektoren mit dem jeweiligen Kontrollvektor, der aus der Vielzahl von Kontrollvektoren entfernt wurde, ein Maß der zentralen Tendenz jeder entsprechenden Dimension in der Vielzahl von Dimensionen über die Vielzahl von Kontrollvektoren außer dem jeweiligen Kontrollvektor (4154). In einigen Ausführungsformen ist das Maß der zentralen Tendenz jeder entsprechenden Dimension in der Vielzahl von Dimensionen über die Vielzahl von Kontrollvektoren, die nicht der jeweilige Kontrollvektor sind, ein arithmetisches Mittel, ein gewichtetes Mittel, ein mittlerer Bereich, ein Midhinge, ein Trimean, ein geometrisches Mittel, ein geometrischer Median, ein winsorisiertes Mittel, ein Median oder ein Modus der entsprechenden Dimension über die Vielzahl von Kontrollvektoren (4156). In einigen Ausführungsformen wird die jeweilige Kontrollähnlichkeitsmetrik zwischen (i) dem jeweiligen Kontrollvektor und (ii) der Verteilungsmetrik der Vielzahl von Kontrollvektoren mit dem jeweiligen Kontrollvektor, der aus der Vielzahl von Kontrollvektoren entfernt wurde, als ein Abstand zwischen entsprechenden Dimensionen des Kontrollvektors und der Verteilungsmetrik der Vielzahl von Kontrollvektoren mit dem jeweiligen Kontrollvektor, der aus der Vielzahl von Kontrollvektoren entfernt wurde, berechnet (4158). In einigen Ausführungsformen ist der Abstand ein Winkelabstand, der berechnet wird (4160) als: i n A i B i i = 1 n A i 2 i = 1 n B i 2
    Figure DE112020002936T5_0014
    wo:
    • Ai ist eine Dimension i im jeweiligen Kontrollvektor,
    • Bi ist die Verteilungsmetrik der entsprechenden Dimension i in der Vielzahl von Dimensionen über die Vielzahl von Kontrollvektoren, die nicht der jeweilige Kontrollvektor sind, und
    • n ist die Anzahl der Dimensionen des jeweiligen Kontrollvektors.
  • In einigen Ausführungsformen wird die Qualität einer oder mehrerer geretteter Abfrage-Störungen bestimmt. Unter Bezugnahme auf 4X umfasst das Verfahren 4000 in einigen Ausführungsformen die Bestimmung (4162) einer Gesamtqualität des Assays. In einigen Ausführungsformen umfasst dies das Berechnen (4164) einer Vielzahl von Testvektoren, wobei jeder jeweilige Testvektor in der Vielzahl von Testvektoren zwischen (i) dem ersten Punkt und (ii) einem zweiten Punkt liegt, der durch einen jeweiligen Testdatenpunkt in dem Satz von Testdatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist. In einigen Ausführungsformen umfasst das Verfahren 4000 dann das Berechnen (4166) einer Vielzahl von Kontrollvektoren, wobei jeder jeweilige Kontrollvektor in der Vielzahl von Kontrollvektoren zwischen (i) dem ersten Punkt und (ii) einem dritten Punkt liegt, der durch einen jeweiligen Kontrolldatenpunkt in der Menge von Kontrolldatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist. In einigen Ausführungsformen umfasst das Verfahren 4000 dann das Berechnen (4168) eines On-Target-Werts für jeden jeweiligen Testvektor in der Vielzahl von Testvektoren als eine Projektion des jeweiligen Testvektors auf den zusammengesetzten Testvektor. In einigen Ausführungsformen umfasst das Verfahren 4000 dann die Berechnung (4170) eines Off-Target-Wertes für jeden jeweiligen Testvektor in der Vielzahl der Testvektoren als eine Ablehnung des jeweiligen Testvektors gegenüber dem zusammengesetzten Testvektor. In einigen Ausführungsformen umfasst das Verfahren dann das Berechnen (4172) eines On-Target-Werts für jeden jeweiligen Kontrollvektor aus der Vielzahl der Kontrollvektoren als Projektion des jeweiligen Kontrollvektors auf den zusammengesetzten Testvektor. In einigen Ausführungsformen umfasst das Verfahren 4000 dann die Berechnung (4174) eines Off-Target-Werts für jeden jeweiligen Kontrollvektor in der Vielzahl von Kontrollvektoren als eine Ablehnung des jeweiligen Kontrollvektors gegenüber dem zusammengesetzten Testvektor. Unter Bezugnahme auf 4Y umfasst das Verfahren 4000 in einigen Ausführungsformen dann das Auftragen (4176) jedes jeweiligen Testvektors in der Vielzahl von Testvektoren auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für den jeweiligen Testvektor als eine Koordinate in einer ersten Dimension des zweidimensionalen Diagramms und des Off-Target-Werts für den jeweiligen Testvektor als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms, wodurch eine Vielzahl von Testzustandsdatenpunkten erhalten wird. In einigen Ausführungsformen umfasst das Verfahren 4000 dann das Plotten (4178) jedes jeweiligen Kontrollvektors in der Vielzahl von Kontrollvektoren auf dem zweidimensionalen Plot unter Verwendung des On-Target-Werts für den jeweiligen Kontrollvektor als eine Koordinate in der ersten Dimension und des Off-Target-Werts für den jeweiligen Kontrollvektor als eine Koordinate in der zweiten Dimension, wodurch eine Vielzahl von Kontrolldatenpunkten erhalten wird. In einigen Ausführungsformen umfasst das Verfahren 4000 dann das Berechnen (4180) der Testqualität als normalisierter Abstand zwischen der Vielzahl von Testzustandsdatenpunkten und der Vielzahl von Kontrolldatenpunkten. In einigen Ausführungsformen umfasst das Verfahren 4000 dann das Bestimmen (4182) einer Testzustandsqualität durch Berechnen einer normierten Dichtheit der Vielzahl von Testzustandsdatenpunkten. In einigen Ausführungsformen umfasst das Verfahren 4000 dann die Verwendung (4184) der Rettungsqualität für die Abfrage-Störung, der Assay-Qualität und der Testzustandsqualität, um eine Gesamtqualität zu berechnen.
  • In einigen Ausführungsformen wird die Gesamtqualität wie folgt berechnet (4186): ( Rettungsqualit a ¨ t f u ¨ r die Verbindung ) exp ( Assay Qualit a ¨ t 1 ) 1 1 + exp ( 1 Ph a ¨ notyp Qualit a ¨ t ) .
    Figure DE112020002936T5_0015
  • Unter Bezugnahme auf 4Z wird in einigen Ausführungsformen die normalisierte Dichtheit durch ein Verfahren (4188) berechnet, das für jeden jeweiligen Testvektor in der Vielzahl von Testvektoren die Berechnung einer Testzustandsähnlichkeitsmetrik zwischen (i) dem jeweiligen Testvektor und (ii) einer Verteilungsmetrik der Vielzahl von Testvektoren mit dem jeweiligen Testvektor, der aus der Vielzahl von Testvektoren entfernt wurde, umfasst, wodurch eine Vielzahl von Testzustandsähnlichkeitsmetriken für die Vielzahl von Testvektoren erhalten wird, wobei jede Testzustandsähnlichkeitsmetrik in der Vielzahl von Testzustandsähnlichkeitsmetriken eindeutig einer Teststörung in dem Satz von Teststörungen entspricht. Das Verfahren umfasst auch das Berechnen einer Nullverteilung durch einen Unterprozess, der Folgendes umfasst: (a) für jeden jeweiligen Kontrollvektor in der Vielzahl von Kontrollvektoren, Berechnen einer jeweiligen Kontrollähnlichkeitsmetrik zwischen (i) dem jeweiligen Kontrollvektor und (ii) einer Verteilungsmetrik der Vielzahl von Kontrollvektoren, wobei der jeweilige Kontrollvektor aus der Vielzahl von Kontrollvektoren entfernt wird, wodurch die Vielzahl von Kontrollähnlichkeitsmetriken erhalten wird, wobei jede Kontrollähnlichkeitsmetrik in der Vielzahl von Kontrollähnlichkeitsmetriken eindeutig einer Kontrollstörung in dem Satz von Kontrollstörungen entspricht, und (b) Berechnen der Nullverteilung als eine Verteilungsmetrik der Vielzahl von Kontrollähnlichkeitsmetriken. Das Verfahren umfasst auch das Bestimmen eines ersten Maßes der zentralen Tendenz des Winkels zwischen (i) jeder jeweiligen Testzustandsähnlichkeitsmetrik in der Vielzahl von Testzustandsähnlichkeitsmetriken und (ii) der Nullverteilung über die Vielzahl von Testzustandsähnlichkeitsmetriken, und Normalisieren des ersten Maßes der zentralen Tendenz des Winkels durch ein zweites Maß der zentralen Tendenz des Winkels zwischen (i) jeder Kontrollähnlichkeitsmetrik in der Vielzahl von Kontrollähnlichkeitsmetriken und (ii) der Nullverteilung über die Vielzahl von Kontrollähnlichkeitsmetriken, wobei das normalisierte erste Maß der zentralen Tendenz die normalisierte Dichtheit der Vielzahl von Testzustandsdatenpunkten darstellt.
  • In einigen Ausführungsformen werden eine oder mehrere Qualitätsmetriken für Zellkontexte bestimmt, die in den hier beschriebenen Screening-Verfahren verwendet werden. So wird beispielsweise in einigen Ausführungsformen, in denen eine Teststörung die Expression eines Zielgens herabsetzen soll, die Expression des Zielgens in einem oder mehreren Fällen des Testzustands bestimmt und mit einem Schwellenwert für die Herabsetzung der Expression verglichen, um festzustellen, ob die Teststörung das gewünschte Ergebnis erzielt. In ähnlicher Weise wird in einigen Ausführungsformen, in denen eine Teststörung die Expression eines Zielgens ausschalten soll, die Expression des Zielgens in einem oder mehreren Fällen eines entsprechenden Kontrollzustands bestimmt und mit einem Basisschwellenwert für die Expression verglichen, um festzustellen, ob der Zellkontext ein geeigneter Ausgangspunkt für Screening-Assays ist. Fällt eine dieser Messgrößen aus, kann der Test so umgestaltet werden, dass das gewünschte Ergebnis erzielt wird. Wenn beispielsweise die Expression eines Zielgens in einem Testzustand nicht ausreichend unterdrückt wird, kann eine andere Teststörung erzeugt werden, die auf das betreffende Gen abzielt (z. B. kann eine neue siRNA, die auf einen anderen Teil des Gens abzielt, in künftigen Experimenten verwendet werden). Ebenso kann ein anderer Zellkontext, der eine adäquate Expression des interessierenden Gens gewährleistet, gesucht werden, um den alten Zellkontext zu ersetzen, wenn ein Basisniveau der Expression des Zielgens im Kontrollzustand nicht vorhanden ist. Methoden zur Messung der Genexpression sind in der Fachwelt gut bekannt und umfassen unter anderem quantitative PCR, Hybridisierung, Northern Blotting und Massenspektroskopie.
  • Zellkontexte
  • Wie oben beschrieben, beziehen sich Kontrollzustände, Testzustände und Abfragezustände jeweils auf eine Versuchsbedingung, die im Allgemeinen einen Zellkontext umfasst. In einigen Ausführungsformen werden die Zellkontexte, die in den Kontrollzuständen verwendet werden, einer Kontrollstörung ausgesetzt, wie oben beschrieben. Die in den Test- und Abfragezuständen verwendeten Zellkontexte werden gestört (z. B. durch Exposition gegenüber einer Verbindung oder physikalischen Bedingung und/oder durch Mutation des Zellgenoms), um einen „kranken“ Phänotyp darzustellen. Dementsprechend werden die Abfragezustände dann einer Abfrage-Störung ausgesetzt, z. B. einer oder mehreren therapeutischen Verbindungen und/oder physikalischen Bedingungen.
  • In einigen Ausführungsformen handelt es sich bei einem Zellkontext um eine oder mehrere Zellen, die in eine Vertiefung einer Multiwell-Platte 302 eingebracht wurden, z. B. eine bestimmte Zelllinie, Primärzellen oder ein Co-Kultursystem. In einigen Ausführungsformen, wie hier unter Bezugnahme auf 3 beschrieben, wird mindestens jede Abfrage-Störung (z. B. eine Verbindung in einer Verbindungsbibliothek) einer Vielzahl verschiedener gestörter Zellkontexte ausgesetzt, z. B. mindestens zwei, drei, vier, fünf, sechs, sieben, acht, neun, zehn oder mehr gestörte Zellkontexte. In einigen Ausführungsformen wird zumindest jede Abfrage-Störung (z. B. eine Verbindung in einer Verbindungsbibliothek) einem einzigen gestörten Zellkontext ausgesetzt (z. B. einer einzigen Zelllinie oder einem primären Zelltyp).
  • Beispiele für Zelltypen, die in einen Zellkontext aufgenommen werden können, sind unter anderem U2OS-Zellen, A549-Zellen, MCF-7-Zellen, 3T3-Zellen, HTB-9-Zellen, HeLa-Zellen, HepG2-Zellen, HEKTE-Zellen, SH-SY5Y-Zellen, HUVEC-Zellen, HMVEC-Zellen, primäre menschliche Fibroblasten und primäre menschliche Hepatozyten/3T3-J2-Fibroblasten-Kokulturen. In einigen Fällen ist eine Zelllinie, die als Grundlage für einen Zellkontext verwendet wird, eine Kultur aus menschlichen Zellen. In einigen Ausführungsformen ist eine Zelllinie, die als Grundlage für einen Zellkontext verwendet wird, eine der in der nachstehenden Tabelle 3 aufgeführten Zelllinien oder eine genetische Veränderung einer solchen Zelllinie. In einigen Ausführungsformen stammt jede Zelllinie, die in der Screening-Methode als ein anderer Zellkontext verwendet wird, von derselben Spezies. In einigen Ausführungsformen können die für einen Zellkontext im Screening-Verfahren verwendeten Zelllinien von mehr als einer Spezies sein. Beispielsweise stammt eine erste Zelllinie, die als erster Kontext verwendet wird, von einer ersten Spezies (z. B. dem Menschen) und eine zweite Zelllinie, die als zweiter Kontext verwendet wird, von einer zweiten Spezies (z. B. dem Affen). Tabelle 3 - Beispielhafte Zelltypen, die als Grundlage für die Bereitstellung von Zellkontext in einigen Ausführungsformen verwendet werden.
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    jb6 p+ c141 Maus Haut Adhärent keine
    jcam1.6 Menschen Lymphozyten Suspension keine
    jb6 rt101 Maus Epithelial Beide ja
    jy Menschen Lymphozyten Suspension keine
    k562 Menschen Knochen Suspension keine
    j82 Menschen Blase Adhärent keine
    ivec-Zellen Menschen Endothelium Adhärent keine
    jeg-3 Menschen Andere Adhärent keine
    jurkat Menschen Lymphozyten Suspension keine
    j5581 Maus Blut Suspension keine
    k46 Maus Lymphozyten Suspension keine
    j774-Zellen Maus Makrophagen Adhärent keine
    knrk Ratte Epithelial Beide keine
    Keratinozyten Maus Keratinozyten Adhärent ja
    kc1 Drosophila Melanogaster Standard Adhärent keine
    kc18-2-40-Zellen Menschen Keratinozyten Adhärent keine
    kt-3 Menschen Lymphozyten Suspension keine
    kmst-6 Menschen Haut Adhärent keine
    11210-fas Maus Myoblasten Suspension ja
    kb Menschen Fibroblasten Adhärent keine
    Keratinozyten Menschen Keratinozyten Adhärent ja
    kg-1 Zellen Menschen Knochenmark Suspension keine
    ks-Zellen Menschen Haut Adhärent ja
    kd83 Maus Blut Suspension keine
    1-m(tk-) Maus Konnektiv Adhärent keine
    18 Zellen Ratte Myoblasten Adhärent ja
    1k35.2 Maus Lymphozyten Suspension keine
    11210 Maus Monozyten Suspension ja
    lan-5 Menschen Gehirn Adhärent keine
    llc-pk1 Schwein Niere Adhärent keine
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    Lewis-Lungenkarzinom, LLC Maus Lunge Beide keine
    16e9 Ratte Muskeln Adhärent keine
    lmh Huhn Leber Adhärent keine
    16 Zellen Ratte Muskeln Adhärent keine
    lisn c4 (nih 3t3-Derivat, das egf überexprimiert) Maus Fibroblasten Adhärent ja
    lap1 Maus Lymphozyten Suspension ja
    lap3 Maus Embryo Adhärent keine
    1929 Maus Fibroblasten Adhärent keine
    mg87 Maus Fibroblasten Adhärent keine
    min6 Maus Standard Beide keine
    mel Maus Andere Adhärent keine
    Melenomzellen Menschen Melanom Adhärent ja
    mdbk Kuh Niere Adhärent keine
    mkn45 Magenkrebs Menschen Magen Adhärent ja
    mewo Menschen Melanom Adhärent keine
    mda-mb-468 Menschen Brust/Mammaria Adhärent keine
    mdck Hund Niere Adhärent keine
    mf4/4 Maus Makrophagen Adhärent keine
    me-180 Menschen Gebärmutterhals Adhärent ja
    mes-sa Menschen Gebärmutter Adhärent keine
    mg-63-Zellen Menschen Knochen Adhärent keine
    Mono-Mac-6-Zellen Menschen Blut Suspension keine
    Monozyten Menschen Blut Suspension ja
    mrc-5 Menschen Lunge Adhärent ja
    Mob-Zellen Maus Osteoblasten Adhärent ja
    msc humane mesenchymale Stammzelle Menschen Knochenmark Adhärent ja
    mt-2 Menschen Lymphozyten Adhärent ja
    embryonale Fibroblasten der Maus Maus Fibroblasten Adhärent ja
    mnt1 Menschen Haut Adhärent ja
    ms1 Maus Bauchspeicheldrüse Adhärent keine
    mr1 Ratte Embryo Adhärent keine
    mt4 Menschen Lymphozyten Suspension ja
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    molt4 (menschliche akute lymphoblastische Leukämie) Menschen Blut Suspension keine
    hep3b Menschen Leber Adhärent keine
    hepatische Sternzellen Ratte Leber Adhärent ja
    hela 229 Zellen Menschen Gebärmutterhals Beide ja
    hep2 Menschen Epithelial Adhärent keine
    hela-cd4 Menschen Epithelial Adhärent keine
    hct116 Menschen Kolon Adhärent keine
    Hepatozyten Maus Leber Adhärent ja
    hela s3 Menschen Gebärmutterhals Adhärent keine
    hel Menschen Lymphozyten Suspension ja
    Hela-Zellen Menschen Gebärmutterhals Adhärent keine
    hela t4 Menschen Blut Suspension keine
    hepg2 Menschen Leber Adhärent keine
    High 5 (bti-tn-5bl-4) Insekt Embryo Adhärent keine
    hit-t15-Zellen Hamster Epithelial Adhärent keine
    Hepatozyten Ratte Leber Adhärent ja
    hitb5 Menschen Muskeln Adhärent ja
    hi299 Menschen Lunge Adhärent keine
    hfff2 Menschen Vorhaut Adhärent ja
    hib5 Ratte Gehirn Adhärent ja
    hm-1 embryonale Stammzellen Maus Andere Adhärent ja
    hitb5 Menschen Muskeln Adhärent ja
    hl-60 Menschen Lymphozyten Suspension keine
    hl-5 Maus Herz Adhärent keine
    hl-1 Maus Herz Adhärent keine
    glya Hamster Eierstock Adhärent keine
    Gamma 3t3 Maus Fibroblasten Adhärent keine
    gh3 Ratte Hypophyse Adhärent keine
    granta-519 Menschen Blut Suspension keine
    Freestyle 293 Menschen Niere Suspension keine
    g401 Menschen Konnektiv Adhärent keine
    fto-2b-Zellen (Rattenhepatom) Ratte Leber Suspension ja
    gh4c1 Ratte Hypophyse Adhärent ja
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    fsdc, murine dendritische Zelle Maus Blut Beide keine
    goto Menschen Neuroblastom Adhärent ja
    gc-2spd (ts) Maus Epithelial Adhärent keine
    Glomeruli Ratte Lunge Adhärent ja
    frt Ratte Schilddrüse Suspension keine
    h19-7/igf-ir Ratte Gehirn Suspension keine
    gt1 Maus Gehirn Adhärent keine
    GripTite 293 msr Menschen Niere Adhärent keine
    h441 Menschen Lunge Adhärent ja
    h-500, Leydig-Tumorzelle Ratte Hoden Adhärent ja
    h4 Menschen Glia Adhärent keine
    Endometrium-Stromazellen des Meerschweinchens Meerschweinchen Eierstock Adhärent ja
    h187 Menschen Lunge Adhärent ja
    h35 Ratte Leber Adhärent keine
    h-7 Maus Knochenmark Suspension keine
    h1299 Menschen Lunge Adhärent keine
    Granulosazellen Maus Eierstock Beide ja
    hb1100-Zellen Menschen Brust/Mammaria Adhärent keine
    h9c2 Ratte Myoblasten Adhärent keine
    hbec-90 Menschen Gehirn Adhärent keine
    has-p Maus Brust/Mammaria Adhärent ja
    hasmcs Menschen Muskeln Adhärent keine
    hc11 Maus Brust/Mammaria Adhärent keine
    hacat Menschen Keratinozyten Adhärent ja
    hb60-5-Zellen Maus Spleen Adhärent keine
    h4iie Ratte Leber Adhärent ja
    hca-7 Menschen Kolon Adhärent ja
    hcd57 Maus Blut Suspension keine
    haecs Menschen Aorta Adhärent ja
    rpe.40 Hamster Niere Adhärent ja
    rcme, koronare Mikrogefäßendothelien des Kaninchen Kaninchen Endothelial Adhärent ja
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    rko, Rektumkarzinom-Zelllinie Menschen Kolon Adhärent keine
    ros, osteoblastische Zelllinie der Ratte Ratte Osteoblasten Adhärent ja
    rhl8 Menschen Muskeln Adhärent keine
    rcho Ratte Standard Adhärent keine
    rccd1 Ratte Niere Adhärent keine
    s194 Zellen Maus Lymphozyten Adhärent ja
    rin 1046-38 Ratte Bauchspeicheldrüse Suspension keine
    rw-4 Maus Embryo Adhärent ja
    rj2.2.5 Menschen Lymphozyten Suspension keine
    rk13 Kaninchen Niere Adhärent keine
    remc Ratte Brust/Mammaria Adhärent keine
    sk-br-3 Menschen Brust/Mammaria Adhärent keine
    s49.1 Maus Thymus Suspension keine
    Schizosaccharomyces pombe Hefe Andere Beide ja
    sf9 Insekt Eierstock Suspension keine
    sf21 Insekt Andere Beide ja
    sf21 ae Insekt Andere Beide ja
    sh-sy5y Menschen Gehirn Beide keine
    s2-013 Menschen Bauchspeicheldrüse Beide ja
    saos-2 Menschen Knochen Adhärent keine
    siha Menschen Gebärmutterhals Adhärent keine
    scc 12, menschliche Plattenepithelkarzinom-Linie (c12c20) Menschen Haut Adhärent ja
    shep Menschen Gehirn Adhärent keine
    sk-lms-1 Menschen Andere Adhärent keine
    sk-n-sh, neuronale Zellen Menschen Gehirn Adhärent ja
    sk-n-as Menschen Neuroblastom Adhärent keine
    sknmc Menschen Gehirn Adhärent keine
    Sk-Hep-1-Zellen Menschen Haut Beide ja
    skov3 Menschen Eierstock Adhärent keine
    sk-n-be(2) Menschen Neuroblastom Adhärent ja
    smmc7721 Menschen Leber Adhärent keine
    glatte Muskelzellen Ratte Aorta Adhärent ja
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    (Aorta) rasmc (a7-r5)
    s12 Drosophila melanogaster Standard Beide keine
    sk-ut-1 Menschen Muskeln Adhärent keine
    n2a Maus Neuroblastom Adhärent keine
    Myozyten (ventrikulär) Ratte Herz Adhärent ja
    mtln3 Ratte Brust/Mammaria Adhärent keine
    nle-115 Maus Gehirn Adhärent keine
    mtsv1-7 Menschen Epithelial Adhärent keine
    murine alveoläre Makrophagen Zelllinie mhs Ratte Lunge Adhärent keine
    n18tg-Zellen Maus Neuroblastom Adhärent keine
    n13 Maus Gehirn Adhärent keine
    mutu-Gruppe3, B-ZellLinie Menschen Lymphozyten Suspension keine
    mtd-1a Maus Epithelial Adhärent ja
    mutu i Menschen Lymphozyten Suspension keine
    mvllu Nerz Lunge Adhärent keine
    ncb20 Maus Neuroblastom Adhärent ja
    nb324k Menschen Niere Adhärent keine
    neuronale Stammzellen Ratte Gehirn Beide ja
    Neuroblastom Menschen Gehirn Adhärent ja
    nci-h23 Menschen Lunge Adhärent keine
    nci-h460 Menschen Lunge Adhärent keine
    Neuronen (Astrozyten) Ratte Gehirn Adhärent ja
    Neuro 2a, eine murine Neuroblastom-Zelllinie Maus Neuroblastom Adhärent keine
    nbt-ii Ratte Blase Adhärent keine
    Neuonen (Astrozyten) Ratte Astrozyten Adhärent ja
    nci-h295 Menschen Niere Adhärent keine
    nci-h358 Menschen Lunge Adhärent keine
    Neuonen (Hippocampus und Septum) Ratte Gehirn Adhärent ja
    Neuronen Maus Gehirn Adhärent ja
    nhdf Menschen Fibroblasten Adhärent keine
    Neuronen (postnatal/adult) Ratte Gehirn Adhärent ja
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    nhbe Menschen Lunge Adhärent ja
    ng108-15 Maus Neuroblastom Adhärent keine
    Neuronen (embryonale Kortikalis) Ratte Gehirn Adhärent ja
    Neuronen (kortikal) Maus Andere Adhärent ja
    ng 125 Menschen Neuroblastom Adhärent keine
    nhf3 Menschen Fibroblasten Adhärent keine
    Neurospora crassa Pilze Embryo Adhärent ja
    Neuronen (Superior Cervical Ganglia - scg) Ratte Gehirn Adhärent ja
    Neuronen (Ganglien) Frosch Gehirn Beide ja
    ns20y Maus Neuroblastom Adhärent keine
    nrk Ratte Fibroblasten Adhärent ja
    nmumg Maus Brust/Mammaria Adhärent keine
    o23 Hamster Fibroblasten Adhärent keine
    nt2 Menschen Fibroblasten Adhärent keine
    nhff Menschen Vorhaut Adhärent ja
    nih 3t3, 3t3-11 Maus Fibroblasten Adhärent keine
    Ohio HeLas Menschen Gebärmutterhals Suspension keine
    nih 3t6 Maus Fibroblasten Adhärent keine
    nih 3t3-11, nih 3t3 Maus Embryo Adhärent keine
    nt2-d1 Menschen Hoden Adhärent keine
    nih 3t3-11, nih 3t3 () Maus Embryo Adhärent keine
    orbitaler Fibroblast Menschen Fibroblasten Adhärent ja
    Osteoblasten Ratte Knochen Adhärent ja
    p 19-Zellen Maus Embryo Adhärent ja
    ovcar-3 Menschen Eierstock Adhärent keine
    opaque Zellen Schaf Endothelial Adhärent keine
    Ovarial-Oberflächenepithel (Ose) Menschen Eierstock Adhärent ja
    p388d1 Maus Makrophagen Adhärent ja
    p825, Mastozytomzellen Maus Makrophagen Adhärent ja
    p19c16 Maus Herz Adhärent keine
    omega e Maus Embryo Adhärent keine
    ok, aus den proximalen Nierentubuli Opossum Niere Adhärent ja
    p815, Mastozytomzellen Maus Makrophagen Adhärent ja
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    p3.653 x ag8 murine Myelomzellen Maus Knochenmark Adhärent ja
    paju, von der menschlichen Neuralleiste stammende Zelllinie Menschen Gehirn Adhärent ja
    pac-1 Ratte Aorta Adhärent keine
    parp-/- Maus-Embryonalfibroblasten Maus Fibroblasten Suspension keine
    pci-13 Menschen Haut Adhärent keine
    pc 6 (Pheochromozytom-6) Ratte Glia Adhärent keine
    Pankreasinseln Ratte Bauchspeicheldrüse Adhärent ja
    Lymphozyten aus dem peripheren Blut Menschen Blut Beide ja
    pc-3 Menschen Prostata Beide keine
    pc-12 Ratte Gehirn Adhärent keine
    panc1 Menschen Bauchspeicheldrüse Adhärent keine
    per.c6®. Menschen Netzhaut Beide keine
    pa 317 oder pt67-Mausfibroblasten mit Herpes-Thymidin-Kinase (tk)-Gen Maus Fibroblasten Adhärent ja
    pam212, Maus-Keratinozyten Maus Keratinozyten Adhärent ja
    periphere mononukleäre Blutzellen (pbmc) Menschen Blut Suspension ja
    qt6 Wachtel Fibroblasten Adhärent keine
    pu5-1.8 Zellen Maus Makrophagen Suspension keine
    primäres lymphatisches Organ (oka) von Penaeus-Garnelen Krabben Lymphozyten Adhärent ja
    ps120, ein nhedefizienter Klon, der aus cc139-Zellen stammt Hamster Lunge Adhärent ja
    Phoenix-Eko-Zellen Menschen Embryo Adhärent keine
    Wachtel-Embryonen Wachtel Embryo Beide ja
    plb985 Menschen Blut Suspension keine
    pleurales Mesothel des Kaninchens Kaninchen Lunge Adhärent keine
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    r1 embryonale Stammzelle, es Maus Embryo Beide keine
    Kaninchen vsmc, vaskuläre glatte Muskelzellen Kaninchen Muskeln Adhärent ja
    raec, Aortenendothelzellen der Ratte Ratte Aorta Adhärent ja
    raji Menschen Lymphozyten Suspension keine
    Epithelzellen der Ratte Ratte Epithelial Adhärent ja
    rohe 264.7-Zellen, murine Makrophagen-Zellen Maus Makrophagen Adhärent ja
    ramos Menschen Lymphozyten Suspension keine
    hepatische Ito-Zellen der Ratte Ratte Leber Adhärent ja
    Rattenadipozyt Ratte Fettleibigkeit Adhärent ja
    Ratte c5, Gliomzellen Ratte Glia Adhärent ja
    Rat-1, Rattenfibroblasten Ratte Fibroblasten Adhärent ja
    Rat-2, Rattenfibroblasten Ratte Fibroblasten Adhärent ja
    glomeruläre mesangiale mc-Zellen der Ratte Ratte Niere Adhärent ja
    RAW-Zellen Ratte Bauchfell Suspension keine
    rat-6 (r6), Rattenembryo-Fibroblast Ratte Fibroblasten Adhärent ja
    hmec-1 Menschen Endothelial Adhärent ja
    hre h9 Kaninchen Gebärmutter Adhärent keine
    hmn 1 Maus Neuroblastom Adhärent ja
    ht-29 Menschen Kolon Adhärent keine
    hos Menschen Osteoblasten Adhärent keine
    hs68 Menschen Vorhaut Adhärent ja
    hmcb Menschen Haut Adhärent keine
    hs-578t Menschen Brust/Mammaria Adhärent keine
    hnscc Menschen Haut Adhärent keine
    hpb-all Menschen Lymphozyten Suspension keine
    hmvec-1 Menschen Lunge Adhärent keine
    hsy-eb Menschen Andere Adhärent keine
    huh 7 Menschen Leber Adhärent keine
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    htlm2 Maus Brust/Mammaria Adhärent ja
    Hut-78 Menschen Haut Suspension keine
    ht1080 Menschen Fibroblasten Adhärent keine
    huvec, huaec Menschen Umbilicus Adhärent ja
    htla230 Menschen Neuroblastom Adhärent ja
    Hybridom Maus Spleen Suspension keine
    ib3-1 Menschen Lunge Adhärent keine
    ht22 Maus Gehirn Adhärent ja
    menschlicher Skelettmuskel Menschen Muskeln Adhärent ja
    ht4 Menschen Hoden Adhärent ja
    hutu 80 Menschen Kolon Adhärent ja
    In-vivo -Mausgehirn Maus Knochen Beide ja
    In-vivo-Rattengehirn Ratte Gehirn Beide ja
    iec-6 rie Ratte Epithelial Adhärent keine
    imr-32 Menschen Neuroblastom Adhärent keine
    icl 1 Maus Hoden Adhärent keine
    imr-90 Menschen Lunge Adhärent keine
    in vivo Rattenlunge Ratte Lunge Beide ja
    in vivo Rattenleber Ratte Leber Beide ja
    ins-1 Ratte Bauchspeicheldrüse Adhärent keine
    in vivo Kaninchenauge Kaninchen Andere Beide ja
    In-vivo-Maus Maus Andere Beide ja
    imdf Maus Haut Adhärent keine
    in vivo Schwein Schwein Andere Beide ja
    caski Menschen Gebärmutterhals Adhärent keine
    Kleinhirn Maus Gehirn Adhärent ja
    cd34+ Monozyten Menschen Monozyten Suspension ja
    cfk2 Ratte Knochen Adhärent keine
    cem Menschen Blut Suspension keine
    catha, cath.a Maus Gehirn Beide keine
    ccl-16-b9 Hamster Lunge Adhärent keine
    ch12f3-2a Maus Lymphozyten Suspension keine
    cf2th Hund Thymus Adhärent keine
    Kardiomyozyten Menschen Herz Adhärent ja
    cg-4 Ratte Glia Adhärent keine
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    Zelle.220(b8) Menschen Standard Suspension keine
    Kardiomyozyten Ratte Herz Adhärent ja
    Fibroblasten von Kükenembryonen Huhn Embryo Adhärent ja
    Hühnersperma Huhn Sperma Adhärent ja
    cho k1 Hamster Eierstock Adhärent keine
    cho 58 Hamster Eierstock Adhärent keine
    cho-b7 Hamster Eierstock Adhärent keine
    Blastodermzellen von Kükenembryonen Huhn Embryo Adhärent ja
    cho -b53 Hamster Eierstock Adhärent ja
    Chondrozyten von Kükenembryonen Huhn Embryo Adhärent ja
    Chinesische Hamsterlunge Hamster Lunge Adhärent keine
    cho dg44 Hamster Eierstock Beide keine
    cho - b53 jf7 Hamster Eierstock Adhärent ja
    Hühnerhepatozyten Huhn Leber Adhärent ja
    cos-1 Primat - Nicht menschlich Niere Adhärent keine
    cho-lec 1 Hamster Eierstock Adhärent ja
    Klon a Menschen Kolon Adhärent keine
    cho-lec2 Hamster Eierstock Adhärent keine
    colo205 Menschen Kolon Adhärent keine
    chu-2 Menschen Epithelial Adhärent keine
    cmt-93 Maus Rektum Adhärent keine
    cho-s Hamster Eierstock Suspension keine
    cho-leu c2gnt Hamster Eierstock Adhärent keine
    cho-trvb Hamster Eierstock Adhärent keine
    Klon-13, mutierter b-Lymphoblastoid Menschen Lymphozyten Suspension keine
    cj7 Maus Embryo Adhärent keine
    glatte Muskelzellen (Aorta) Ratte Muskeln Adhärent ja
    Splenozyten Maus Spleen Suspension ja
    glatte Muskelzellen (vaskulär) Ratte Muskeln Adhärent ja
    sp1 Maus Brust/Mammaria Adhärent keine
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    Stamm Ratte Knochen Suspension ja
    spoc-1 Ratte Trachael Adhärent keine
    snbl9 Menschen Gehirn Adhärent keine
    Splenozyten (ruhende B-Zellen) Maus Spleen Suspension ja
    Splenozyten (B-Zellen t2) Maus Spleen Suspension ja
    svr Maus Bauchspeicheldrüse Adhärent keine
    Stammzellen Menschen Knochenmark Suspension ja
    glatte Muskelzellen (vaskulär) Menschen Muskeln Adhärent ja
    glatte Muskelzellen (vaskulär) Kaninchen Aorta Adhärent ja
    t3cho/at1a Hamster Eierstock Beide keine
    t-rex-cho Hamster Eierstock Adhärent keine
    t-rex-293 Menschen Niere Adhärent keine
    sw620 Menschen Kolon Adhärent keine
    T-Lymphozyten (T-Zellen) Maus Lymphozyten Adhärent ja
    zytotoxische T-Lymphozyten (ctl) Zellen Maus Lymphozyten Beide ja
    sw480 Menschen Kolon Adhärent keine
    T-Lymphozyten (T-Zellen) Menschen Lymphozyten Adhärent ja
    sw13 Menschen Nebenniere/Kortex Adhärent keine
    t47d,t-47d Menschen Brust/Mammaria Adhärent keine
    t24 Menschen Blase Adhärent keine
    T-Rex Hela Menschen Gebärmutterhals Adhärent keine
    tr2 Maus Gehirn Adhärent keine
    tig Menschen Fibroblasten Adhärent ja
    t98g Menschen Gehirn Adhärent keine
    tsa201 Menschen Embryo Adhärent keine
    Tabakprotoplasten Pflanze Andere Suspension ja
    thp-1 Menschen Blut Suspension ja
    tk.1 Maus Lymphozyten Suspension keine
    tib-90 Maus Fibroblasten Adhärent keine
    ta3 Maus Brust/Mammaria Adhärent keine
    Tyknu-Zellen Menschen Eierstock Adhärent keine
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    u-937 Menschen Makrophagen Suspension keine
    tgw-nu-1 Menschen Blase Adhärent keine
    b-lcl Menschen Blut Suspension keine
    b4.14 Primat - Nicht menschlich Niere Adhärent ja
    b82 m721 Maus Fibroblasten Adhärent keine
    b-tc3 Maus Bauchspeicheldrüse Adhärent keine
    b16-f10 Maus Melanom Adhärent keine
    b82 Maus Fibroblasten Adhärent keine
    as52 Hamster Eierstock Adhärent keine
    B-Lymphozyten Menschen Blut Suspension ja
    b35 Ratte Neuroblastom Adhärent ja
    b65 Ratte Neuroblastom Adhärent keine
    b11 Maus Spleen Suspension keine
    att-20 Maus Hypophyse Adhärent keine
    bcl-1 Maus Lymphozyten Adhärent keine
    bac Kuh Nebennierendrüse Adhärent ja
    balb/c 3t3, 3t3-a31 Maus Fibroblasten Adhärent keine
    be(2)-c Menschen Neuroblastom Adhärent keine
    bewo Menschen Andere Adhärent keine
    balb/mk Maus Epithelial Adhärent keine
    beas-2b Menschen Lunge Adhärent keine
    bewo Menschen Gebärmutter Adhärent ja
    baf3, ba/f3 Maus Lymphozyten Suspension keine
    bcec Menschen Gehirn Adhärent ja
    bc3h1 Maus Gehirn Adhärent ja
    baec Kuh Aorta Adhärent keine
    a10 Ratte Muskeln Adhärent keine
    a1.1 Maus Lymphozyten Adhärent ja
    a72 Hund Konnektiv Adhärent keine
    a549 Menschen Lunge Adhärent keine
    a204 Menschen Muskeln Adhärent ja
    a6 Frosch Niere Adhärent keine
    a875 Menschen Melanom Adhärent ja
    a498 Menschen Niere Adhärent keine
    a172 Menschen Gehirn Adhärent ja
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    a-431 Menschen Haut Adhärent keine
    a20 Maus Lymphozyten Suspension ja
    arpe-19 Menschen Netzhaut Adhärent keine
    alpha t3 Menschen Hypophyse Adhärent keine
    akr Maus Spleen Adhärent keine
    ar4-2j Ratte Bauchspeicheldrüse Adhärent keine
    Endothelzellen der Aorta Menschen Aorta Adhärent ja
    achn Menschen Niere Adhärent ja
    Adventitialfibroblasten Menschen Aorta Adhärent ja
    am12 Maus Blut Suspension keine
    Hypophysenvorderlappe n-Gonadotrope Menschen Hypophyse Adhärent ja
    ae-1 Maus Spleen Suspension keine
    ab1 Maus Embryo Adhärent keine
    anjou 65 Menschen Standard Beide keine
    crfk Katze Niere Adhärent keine
    d.mel-2 Insekt Embryo Beide keine
    ct26 Maus Kolon Beide ja
    Cowpea-Pflanzenembryonen Pilze Embryo Adhärent ja
    cos-7 Primat - Nicht menschlich Niere Adhärent keine
    crl6467 Maus Leber Adhärent keine
    cwr22rv 1 Menschen Prostata Adhärent keine
    ct60 Hamster Eierstock Adhärent keine
    cos-gs1 Primat - Nicht menschlich Niere Adhärent keine
    cos-m6 Primat - Nicht menschlich Niere Adhärent ja
    cv-1 Primat - Nicht menschlich Niere Adhärent keine
    ctll-2 Maus Lymphozyten Suspension keine
    d3 Embryonale Stammzellen Maus Embryo Adhärent keine
    du145 Menschen Prostata Adhärent keine
    do-11.10 Maus Lymphozyten Suspension keine
    daudi Menschen Lymphozyten Suspension keine
    d10 Maus Lymphozyten Suspension keine
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    dgz Pflanze Andere Adhärent ja
    Dictyostelium Amöbe Andere Suspension ja
    dt40 Huhn Bursa Suspension keine
    Drosophila kc Insekt Embryo Adhärent ja
    df1 Huhn Fibroblasten Adhärent keine
    dc 2.4 Zellen Maus Blut Beide keine
    daoy Menschen Andere Adhärent keine
    lovo Menschen Kolon Adhärent keine
    lncap Menschen Prostata Adhärent keine
    m21 Menschen Melanom Adhärent keine
    lsv5 Menschen Keratinozyten Adhärent keine
    ltk Maus Konnektiv Adhärent keine
    ml Ratte Embryo Adhärent keine
    m3z Menschen Brust/Mammaria Adhärent keine
    m21-1 Menschen Melanom Adhärent keine
    lymphoide Zelllinie Ratte Lymphozyten Suspension keine
    m-imcd Maus Niere Adhärent ja
    m12.4 Maus Lymphozyten Adhärent keine
    m21-14 Menschen Melanom Adhärent keine
    mat b iii Ratte Brust/Mammaria Adhärent keine
    mda-mb-453 Menschen Brust/Mammaria Adhärent keine
    mca-rh7777 Ratte Leber Adhärent keine
    ma104 Primat - Nicht menschlich Niere Adhärent keine
    magi-ccr5 Menschen Epithelial Adhärent keine
    mda-mb-231 Menschen Brust/Mammaria Adhärent keine
    mcf-10 Menschen Brust/Mammaria Adhärent keine
    mc3t3-e1 Maus Osteoblasten Adhärent keine
    mc ardle 7777 Ratte Leber Beide ja
    Makrophagen Maus Bauchfell Adhärent ja
    mcf-7 Menschen Brust/Mammaria Adhärent keine
    Makrophagen Menschen Blut Beide ja
    Maisprotoplasten Pflanze Andere Adhärent keine
    umr 106-01 Ratte Knochen Adhärent keine
    uc729-6 Menschen Lymphozyten Beide keine
    u9737 Menschen Lymphozyten Suspension keine
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    uok257 Menschen Niere Adhärent keine
    u373mg Menschen Astrozyten Adhärent keine
    wit49 Wilms-Tumor Menschen Lunge Beide ja
    vero Primat - Nicht menschlich Niere Adhärent keine
    u87, u87mg Menschen Astrozyten Adhärent keine
    umrc6 Menschen Niere Adhärent keine
    u251 Zellen Menschen Glia Adhärent keine
    u2os Menschen Knochen Adhärent keine
    Rinder-Chromaffin-Zellen Kuh Nebennierendrüse Adhärent ja
    bowes Melanomzellen Menschen Haut Adhärent keine
    Rüsselkäfer brl-ag-3c Insekt Andere Adhärent keine
    bm5 Insekt Eierstock Suspension keine
    bhk-21 Hamster Niere Beide keine
    bosc 23 Menschen Niere Adhärent ja
    bms-schwarze mexikanische süße Protoplasten Standard Standard Suspension ja
    bfc012 Maus Embryo Adhärent keine
    Knochenmarkzellen Maus Knochenmark Suspension ja
    Stromazellen aus dem Knochenmark Menschen Knochenmark Adhärent ja
    bs-c-1, bsc-1 Primat - Nicht menschlich Niere Adhärent keine
    bjab Menschen Lymphozyten Suspension keine
    bnl c1.2 (c12) Maus Leber Adhärent keine
    btm (tracheale Rinder-Myozyten) Kuh Muskeln Adhärent keine
    c2c12 Maus Muskeln Adhärent keine
    c3a Menschen Leber Adhärent keine
    c 1.39t Menschen Fibroblasten Adhärent keine
    bt-Zellen Kuh Fibroblasten Adhärent keine
    bsc-40 Primat - Nicht menschlich Niere Adhärent keine
    c33 Menschen Gebärmutterhals Adhärent keine
    c1c12 Maus Muskeln Adhärent keine
    c127 Maus Epithelial Adhärent keine
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    bt549 Menschen Brust/Mammaria Adhärent keine
    clr, hmy2.c1r Menschen Lymphozyten Adhärent ja
    c13-nj Menschen Glia Adhärent keine
    parietale Zellen des Magens beim Hund Hund Magen Adhärent ja
    calu-3 Menschen Lunge Adhärent ja
    cak Maus Fibroblasten Adhärent keine
    c57bl/6-Zellen Maus Herz Adhärent keine
    Caco-2-Zellen Menschen Kolon Adhärent keine
    c3h 10t1/2 Maus Fibroblasten Adhärent keine
    ca77 Ratte Schilddrüse Adhärent keine
    c6-Zellen Ratte Gehirn Adhärent keine
    calu-6 Menschen Lunge Adhärent keine
    capan-2 Menschen Bauchspeicheldrüse Adhärent keine
    c4-2 Menschen Prostata Adhärent keine
    143b Menschen Knochenmark Beide keine
    1064sk Menschen Vorhaut Adhärent ja
    16-9 Mensch-Hamster-Hybridzelllinie - transfiziert mit zwei menschlichen Genen Andere Adhärent keine
    2008 Menschen Eierstock Adhärent keine
    208f Ratte Fibroblasten Adhärent keine
    293-h Menschen Niere Beide keine
    293 Menschen Niere Beide keine
    293 ebna Menschen Niere Adhärent keine
    293t Menschen Niere Beide keine
    2pk3 Maus Lymphozyten Suspension keine
    293-f Menschen Niere Beide keine
    2780 Menschen Eierstock Adhärent keine
    293s Menschen Niere Beide keine
    2774 Menschen Eierstock Adhärent keine
    3y1 Ratte Fibroblasten Adhärent ja
    82-6 Menschen Fibroblasten Adhärent keine
    9hte Menschen Trachael Adhärent ja
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    3.12 Maus Lymphozyten Beide ja
    5637 Menschen Blase Adhärent keine
    4t1 Maus Brust/Mammaria Adhärent keine
    3t3-f442a Maus Andere Adhärent ja
    33.1.1 Maus Lymphozyten Suspension keine
    32d Maus Knochenmark Beide keine
    4de4 Maus Knochenmark Beide ja
    e1-ts20 Menschen Brust/Mammaria Adhärent ja
    embryonale Stammzellen Maus Embryo Adhärent ja
    E. Histolytica Amöbe Andere Suspension ja
    ef88 Maus Fibroblasten Adhärent ja
    el-4 Maus Thymus Suspension keine
    ebc-1 Menschen Lunge Adhärent keine
    Ente (in vivo) Ente Andere Suspension ja
    ecv Menschen Endothelium Adhärent keine
    ecr-293 Menschen Niere Adhärent keine
    e14tg2a Maus Embryo Adhärent keine
    e36 Hamster Lunge Adhärent keine
    Endothelzellen (Pulmonal-Aorta) Ratte Aorta Adhärent ja
    Endothelzellen (Aorta) Schwein Aorta Adhärent ja
    Ewing-Sarkom-Kohortenzellen Menschen Knochen Suspension keine
    f9 Maus Hoden Adhärent keine
    Fibroblasten (kardial) Ratte Fibroblasten Adhärent ja
    f442-a Maus Präadiopozyt Adhärent keine
    es-2 klarzelliges Adenokarzinom der Eierstöcke Menschen Eierstock Adhärent keine
    fötale Neuronen Ratte Gehirn Adhärent ja
    Epithelzellen (sra01/04) Menschen Epithelial Adhärent ja
    Fibroblasten (Embryo) Ratte Fibroblasten Adhärent ja
    fgc-4 Ratte Leber Adhärent ja
    fak -/- Maus Embryo Adhärent ja
    es-d3 Maus Embryo Adhärent keine
    epitheliale Zellen (rte) Ratte Trachael Adhärent ja
    Vorhautfibroblast Menschen Vorhaut Adhärent keine
    Name der Zelle Gewebetyp Gewebe Phänotyp Primäre Seite
    Flp-injurkat Menschen Lymphozyten Suspension keine
    Flop-in-Cho Hamster Eierstock Adhärent keine
    Fibroblasten (neonatale Dermis) Menschen Haut Adhärent ja
    flp-in 293 Menschen Niere Adhärent keine
    flp-in t-rex 293 Menschen Niere Adhärent keine
    flp-in cv-1 Primat - Nicht menschlich Niere Adhärent keine
    Fibroblasten Huhn Haut Adhärent ja
    Fibroblasten („gesund“) Menschen Fibroblasten Adhärent ja
    fl5.12 Maus Leber Suspension keine
    fm3a Maus Brust/Mammaria Adhärent keine
    fr Ratte Fibroblasten Adhärent keine
    nalm6 Menschen Andere Suspension keine
  • Wie oben beschrieben, wird der Zellkontext in Test- und Abfragezuständen weiter gestört, z. B. um einen Krankheitsphänotyp zu simulieren. In einigen Ausführungsformen handelt es sich bei der Störung um einen Umgebungsfaktor, der auf den Zellkontext angewendet wird, z. B. um die Zelle im Vergleich zu einer Referenzumgebung zu stören (z. B. ein Wachstumsmedium, das üblicherweise zur Kultivierung der betreffenden Zelle verwendet wird). In einigen Ausführungsformen umfasst der Zellkontext beispielsweise eine Komponente in einem Wachstumsmedium, die den Stoffwechsel der einen oder mehreren Zellen signifikant verändert, z. B. eine Verbindung, die für die eine oder mehreren Zellen toxisch ist, die den zellulären Stoffwechsel verlangsamt, die den zellulären Stoffwechsel erhöht, die einen Kontrollpunkt hemmt, die Mitose und/oder Meiose unterbricht oder die auf andere Weise ein Merkmal des zellulären Stoffwechsels verändert. Weitere Beispiele sind eine Veränderung der Osmolalität, der Leitfähigkeit, des pH-Werts oder anderer physikalischer Eigenschaften der Wachstumsumgebung oder die Zugabe eines Pathogens (z. B. eines Virus oder Mikroorganismus) oder eines anderen Zelltyps (z. B. einheimische oder manipulierte T-Zellen) als Störung.
  • In einigen Ausführungsformen umfasst die Störung eine Mutation im Genom der einen oder mehreren Zellen, z. B. eine menschliche Zelllinie, in der ein Gen mutiert oder deletiert wurde. In einigen Ausführungsformen ist ein Zellkontext eine Zelllinie, die eine oder mehrere dokumentierte strukturelle Veränderungen aufweist (z. B. einen dokumentierten Einzelnukleotid-Polymorphismus „SNP“, eine Inversion, eine Deletion, eine Insertion oder eine beliebige Kombination davon). In einigen Fällen handelt es sich bei der einen oder mehreren dokumentierten strukturellen Variationen um homozygote Variationen. In einigen Fällen handelt es sich bei der einen oder den mehreren dokumentierten strukturellen Variationen um heterozygote Variationen. Ein Beispiel für eine homozygote Variation in einem diploiden Genom ist ein SNP, bei dem beide Chromosomen das gleiche Allel für den SNP enthalten. Ein Beispiel für eine heterozygote Variation in einem diploiden Genom ist der SNP, bei dem ein Chromosom ein erstes Allel für den SNP aufweist und das komplementäre Chromosom ein zweites Allel für den SNP, wobei das erste und das zweite Allel unterschiedlich sind.
  • In einigen Ausführungsformen umfasst die Störung eine oder mehrere Nukleinsäuren (z. B. eine oder mehrere siRNA), die so konzipiert sind, dass sie die Expression eines oder mehrerer Gene in einem oder mehreren Zelltypen des Zellkontexts unterdrücken (z. B. Knock-down oder Knock-out). In einigen Ausführungsformen umfasst die Störung eine Vielzahl von Nukleinsäuren (z. B. eine Vielzahl von siRNA), die so konzipiert sind, dass sie die Expression desselben Gens in einem oder mehreren Zelltypen des Zellkontexts unterdrücken. Zum Beispiel 2, 3, 4, 5, 6, 7, 8, 9, 10 oder mehr siRNA-Moleküle, die auf unterschiedliche Sequenzen (z. B. überlappende und/oder nicht überlappende) desselben Gens abzielen. In einigen Ausführungsformen umfasst die Störung eine oder mehrere Nukleinsäuren (z. B. eine oder mehrere siRNA), die so konzipiert sind, dass sie die Expression mehrerer Gene, z. B. von 2, 3, 4, 5, 6, 7, 8, 9, 10 oder mehr Genen, unterdrücken. In einigen Ausführungsformen exprimiert die Vielzahl der Gene Proteine, die an einem gemeinsamen Weg (z. B. einem Stoffwechsel- oder Signalweg) in einem oder mehreren Zelltypen des Zellkontexts beteiligt sind. In einigen Ausführungsformen exprimiert die Vielzahl der Gene Proteine, die an verschiedenen Stoffwechselwegen in einem oder mehreren Zelltypen des Zellkontextes beteiligt sind. In einigen Ausführungsformen sind die verschiedenen Pfade teilweise redundante Pfade für eine bestimmte biologische Funktion, z. B. verschiedene Zellzyklus-Kontrollpunktpfade. In einigen Fällen unterdrückt die Störung die Expression eines Gens, von dem bekannt ist, dass es mit einer Krankheit in Verbindung steht (z. B. ein Checkpoint-Inhibitor-Gen, das mit Krebs in Verbindung steht). In einigen Ausführungsformen unterdrückt die Störung die Expression eines Gens, von dem bekannt ist, dass es mit einem zellulären Phänotyp in Verbindung steht (z. B. ein Gen, das einen metabolischen Phänotyp in kultivierten Zellen verursacht, wenn es unterdrückt wird). In einigen Fällen unterdrückt die Störung die Expression eines Gens, das bisher nicht mit einer Krankheit oder einem zellulären Phänotyp in Verbindung gebracht wurde.
  • In einigen Ausführungsformen wird ein Zellkontext gestört, indem eine kleine interferierende RNA (siRNA), z. B. ein doppelsträngiges RNA-Molekül mit einer Länge von 20-25 Basenpaaren, ausgesetzt wird, das die Expression eines bestimmten Gens mit einer komplementären Nukleotidsequenz stört, indem es die mRNA nach der Transkription abbaut und die Translation des Gens verhindert. Eine siRNA ist ein RNA-Duplex, der die Genexpression durch enzymatische Spaltung einer Ziel-mRNA, vermittelt durch den RNAinduzierten Silencing-Komplex (RISC), reduzieren kann. Eine siRNA ist in der Lage, zielgerichtete Gene mit hoher Spezifität zu hemmen. Siehe Agrawal et al. 2003, „RNA interference: biology, mechanism, and applications“, Microbiol Mol Biol Rev. 67: 657-85; und Reynolds et al. 2004, „Rational siRNA design for RNA interference“, Nature Biotechnology 22, 326-330, die hiermit durch Verweis einbezogen werden. In einigen dieser Ausführungsformen wird die Störung durch Transfektion der siRNA in eine oder mehrere Zellen, durch DNA-Vektor-vermittelte Produktion oder durch virenvermittelte siRNA-Synthese erreicht. Siehe z. B. Paddison et al. 2002, „Short hairpin RNAs (shRNAs) induce sequence-specific silencing in mammalian cells“, Genes Dev. 16:948-958; Sui et al. 2002, A DNA vector-based RNAi technology to suppress gene expression in mammalian cells, „ Proc Natl Acad Sci USA 99:5515-5520; Brummelkamp et al. 2002, „A system for stable expression of short interfering RNAs in mammalian cells,“ Science 296:550-553; Paddison et al. , 2004, „Short hairpin activated gene silencing in mammalian cells“, Methods Mol Biol 265:85-100; Wong et al. 2003, „CIITAregulated plexin-A1 affects T-cell-dendritic cell interactions“, Nat Immunol 2003, 4:891-898; Tomar et al, 2003, „Use of adeno-associated viral vector for delivery of small interfering RNA. Oncogene 22:5712-5715; Rubinson et al. 2003, „A lentivirus-based system to functionally silence genes in primary mammalian cells, stem cells and transgenic mice by RNA interference“, Nat Genet 33:401-406; Moore et al. 2005, „Stable inhibition of hepatitis B virus proteins by small interfering RNA expressed from viral vectors“, J Gene Med; und Tran et al. 2003, „Expressing functional siRNAs in mammalian cells using convergent transcription“, BMC Biotechnol 3:21, die hiermit durch Verweis einbezogen werden.
  • In einigen Ausführungsformen wird der Zellkontext durch die Exposition gegenüber einer short Hairpin-RNA (shRNA) gestört. Siehe Taxman et al., 2006, „Criteria for effective design, construction, and gene knockdown by shRNA vectors“, BMC Biotechnology 6:7 (2006), das hiermit durch Bezugnahme aufgenommen wird. In einigen dieser Ausführungsformen wird die Störung durch DNA-Vektor-vermittelte Produktion oder virenvermittelte siRNA-Synthese erreicht, wie allgemein in den oben zitierten Referenzen für siRNA erörtert.
  • In einigen Ausführungsformen wird ein Zellkontext gestört, indem er einer einzelnen Leit-RNA (sgRNA) ausgesetzt wird, die im Zusammenhang mit der palindromischen Wiederholungstechnologie (z. B. CRISPR) verwendet wird. Siehe Sander und Young, 2014, „CRISPR-Cas systems for editing, regulating and targeting genomes“, Nature Biotechnology 32, 347-355, hiermit durch Verweis einbezogen, bei dem ein katalytisch totes Cas9-Protein (gewöhnlich als dCas9 bezeichnet) ohne Endonuklease-Aktivität Gene auf RNA-geführte Weise reguliert. Die Zielspezifität wird durch die komplementäre Basenpaarung einer einzelnen Leit-RNA (sgRNA) mit den genomischen Loci bestimmt. Die sgRNA ist eine chimäre nichtcodierende RNA, die in drei Regionen unterteilt werden kann: eine 20-nt-Basenpaarungssequenz, eine 42-nt-dCas9-bindende Haarnadel und ein 40-nt-Terminator. In einigen Ausführungsformen wird beim Entwurf einer synthetischen sgRNA nur die 20-nt-Basenpaarungssequenz gegenüber der Gesamtvorlage verändert. In einigen dieser Ausführungsformen wird die Störung durch DNA-Vektor-vermittelte Produktion oder virenvermittelte sgRNA-Synthese erreicht.
  • In einigen Ausführungsformen wird ein Zellkontext gestört, indem er einem Nukleinsäurekonstrukt ausgesetzt wird, das die Überexpression eines Proteins steuert. In einigen Ausführungsformen wird das Nukleinsäurekonstrukt transient in den Zellkontext transfiziert. Siehe Longo, PA et al., 2013, „Transient Mammalian Cell Transfection with Polyethylenimine (PEI)“, Methods Enzymol. 529:227-240, hiermit durch Verweis einbezogen, in dem Plasmid-DNA unter Verwendung von Polyethylenimin (PEI) als Trägermolekül transient in Säugetierzellen transfiziert wird. In einigen Ausführungsformen wird das Nukleinsäurekonstrukt stabil in das Genom des Zellkontextes integriert, z. B. auf eine ortsgerichtete Weise. Siehe Lee, JS et al., 2015, „Site-specific integration in CHO cells mediated by CRISPR/Cas9 and homology-directed DNA repair pathway“, Sci Rep. 5:8572, hiermit durch Verweis einbezogen, in dem ein CRISPER/Cas9-Editiersystem verwendet wird, um eine 3,7 kb-Genexpressionskassette an drei verschiedenen Loci in CHO-Zellen zu integrieren. Andere Systeme zur ortsspezifischen Genom-Insertion sind ebenfalls bekannt, z. B. das Cre/loxP-System, das Flp/FRT-System und das phiC31/R4-Integrasesystem.
  • In einigen Ausführungsformen umfasst ein Zellkontext ein Gewebeorganoid-Konstrukt. Siehe Boehnke K et al., „Assay Establishment and Validation of a High-Throughput Screening Platform for Three-Dimensional Patient-Derived Colon Cancer Organoid Cultures“, 2016, J Biomol. Screen. 21(9):931-41, hiermit durch Bezugnahme aufgenommen, in der von Darmkrebs-Patienten stammende Tumorzellen verwendet werden, um organoide Kulturen für das Hochdurchsatz-Screening von Arzneimitteln zu etablieren. Beispielsweise umfassen in einigen Ausführungsformen die entsprechenden Kontrollzustände, Testzustände und Abfragezustände alle organoide Kulturen eines Zellkontextes, dessen Zellen optional im Kontrollzustand einer Kontrollstörung, im Testzustand einer Teststörung und im Abfragezustand sowohl der Teststörung als auch der Abfrage-Störung ausgesetzt sind.
  • In einigen Ausführungsformen verwenden die hier beschriebenen Screening-Methoden einen Einzelzellkontext, d. h. einen einzelnen Zelltyp, der in den Test- und Abfragezuständen gestört ist. Dementsprechend und unter Bezugnahme auf 4AC hat in einigen Ausführungsformen die entsprechende Vielzahl von Kontrollaliquots der Zellen der Gewinnung (4002) Zellen eines einzelnen Zelltyps, die entsprechende Vielzahl von Testaliquots der Zellen der Gewinnung (4034) hat Zellen des einzelnen Zelltyps, und die Vielzahl von Instanzen von Abfrage-Störungsaliquots der Zellen, die gemeinsam die jeweilige Teststörung und die Abfrage-Störung der Gewinnung (4050) darstellen, hat Zellen des einzelnen Zelltyps (4204). In ähnlicher Weise hat in einigen Ausführungsformen die entsprechende Vielzahl von Kontrollaliquots der Zellen jeder Instanz der Gewinnung (4002) Zellen eines einzelnen Zelltyps, die entsprechende Vielzahl von Testaliquots der Zellen jeder Instanz der Gewinnung (4034) hat Zellen des einzelnen Zelltyps, und die Vielzahl von Instanzen von Abfrage-Störungsaliquots der Zellen, die gemeinsam die jeweilige Teststörung und die Abfrage-Störung jeder Instanz der Gewinnung (4050) darstellen, hat Zellen des einzelnen Zelltyps (4206).
  • In einigen Ausführungsformen werden bei den hier beschriebenen Screening-Methoden mehrere unterschiedliche Zellkontexte verwendet. In einigen Ausführungsformen umfassen die verschiedenen Zellkontexte verschiedene Zelltypen, z. B. Zellen, die von verschiedenen Spezies stammen (z. B. menschliche Zellen und Affenzellen) und/oder Zellen, die von verschiedenen Geweben derselben Spezies stammen (z. B. menschliche Leber- und menschliche Nierenzellen). In einigen Ausführungsformen umfassen die verschiedenen Zellkontexte mindestens zwei Zellkontexte, die denselben Zelltyp enthalten (z. B. aus demselben Gewebe derselben Spezies). In einigen Ausführungsformen umfassen die verschiedenen Zellkontexte Zellen desselben Gewebes von verschiedenen Organismen derselben Spezies (z. B. Nierenzellen von verschiedenen Menschen mit unterschiedlichem Genom). In einigen Ausführungsformen umfassen die verschiedenen Zellkontexte Zellen desselben Gewebes, die aus demselben Organismus derselben Spezies stammen, wobei einer der Zellkontexte einem ersten Kontrollstörmittel ausgesetzt ist und ein anderer Zellkontext dem Kontrollstörmittel nicht ausgesetzt ist und/oder einem zweiten Kontrollstörmittel ausgesetzt ist. In einigen Ausführungsformen umfassen die verschiedenen Zellkontexte mehrere Zellkontexte, die z. B. denselben Zelltyp enthalten, aber auf unterschiedliche Weise gestört werden. In einigen Ausführungsformen umfassen zwei Zellkontexte beispielsweise denselben Zelltyp, werden aber mit verschiedenen siRNA-Molekülen gestört, die die Expression verschiedener Gene ausschalten.
  • Dementsprechend umfasst die Vielzahl der Zellkontexte in einigen Ausführungsformen zwei oder mehr Zelltypen. Ebenso umfasst die Vielzahl der Zellkontexte in einigen Ausführungsformen fünf oder mehr Zelltypen. Ebenso umfasst in einigen Ausführungsformen die Vielzahl von Zellkontexten zwei, drei, vier, fünf, sechs, sieben, acht, neun, zehn oder mehr Zelltypen. In einigen Ausführungsformen wird das Verfahren mit einem einzigen Zellkontext durchgeführt.
  • Ebenso und mit fortgesetzter Bezugnahme auf 4AC umfassen in einigen Ausführungsformen die entsprechenden Vertiefungen in der Vielzahl von Vertiefungen für die Vielzahl von Kontrollaliquoten der Zellen der Gewinnung (4002) eine erste Vielzahl von Vertiefungen, wobei jede Vertiefung in der ersten Vielzahl von Vertiefungen ein Aliquot eines anderen Zelltyps in einer entsprechenden Vielzahl von Zelltypen enthält, die entsprechenden Vertiefungen in der Vielzahl von Vertiefungen für die Vielzahl von Testaliquoten der Zellen der Gewinnung (4034) eine zweite Vielzahl von Vertiefungen enthalten, wobei jede Vertiefung in der zweiten Vielzahl von Vertiefungen ein Aliquot eines anderen Zelltyps in der entsprechenden Vielzahl von Zelltypen enthält, und die entsprechenden Vertiefungen in der Vielzahl von Vertiefungen für die Vielzahl von Abfrage-Störungs-Aliquots der Zellen der Gewinnung (4050) eine dritte Vielzahl von Vertiefungen enthält, wobei jede Vertiefung in der dritten Vielzahl von Vertiefungen ein Aliquot eines anderen Zelltyps in der entsprechenden Vielzahl von Zelltypen (4208) enthält. In einigen Ausführungsformen umfasst die Vielzahl von Zelltypen mindestens drei Zelltypen (4210).
  • Unter Bezugnahme auf 4AD umfassen in einigen Ausführungsformen (4212) die entsprechenden Vertiefungen in der Vielzahl von Vertiefungen für die Vielzahl von Kontrollaliquoten der Zellen in jedem Fall der Gewinnung (4002) eine entsprechende erste Vielzahl von Vertiefungen, wobei jede Vertiefung in der entsprechenden ersten Vielzahl von Vertiefungen ein Aliquot eines anderen Typs von Zellen in einer entsprechenden Vielzahl von Zelltypen umfasst, die entsprechenden Vertiefungen in der Vielzahl von Vertiefungen für die Vielzahl von Testaliquoten der Zellen in jedem Fall der Gewinnung (4034) eine entsprechende zweite Vielzahl von Vertiefungen umfassen, wobei jede Vertiefung in der entsprechenden zweiten Vielzahl von Vertiefungen ein Aliquot eines anderen Zelltyps in der entsprechenden Vielzahl von Zelltypen umfasst, und die entsprechenden Vertiefungen in der Vielzahl von Vertiefungen für die Vielzahl von Abfrage-Störungs-Aliquots der Zellen jeder Instanz der Gewinnung (4050) eine entsprechende dritte Vielzahl von Vertiefungen umfasst, wobei jede Vertiefung in der entsprechenden dritten Vielzahl von Vertiefungen ein Aliquot eines anderen Zelltyps in der entsprechenden Vielzahl von Zelltypen umfasst. In einigen Ausführungsformen umfasst die Vielzahl von Zelltypen mindestens drei Zelltypen.
  • In einigen Ausführungsformen umfassen die hier beschriebenen Screening-Verfahren einen separaten Kontrollzellkontext für jeden entsprechenden Testzellkontext. Beispielsweise umfasst in einigen Ausführungsformen ein Screening-Verfahren, das zwei jeweilige Testzustandskontexte verwendet, die Aliquots verschiedener Zelltypen (Zellen aus verschiedenen Geweben eines Organismus) enthalten, die beide durch Exposition gegenüber derselben Test-siRNA gestört werden, unterschiedliche Kontrollzustände für jeden Testzustand, z. B. die Aliquots der entsprechenden Zelltypen enthalten, die nicht durch die Test-siRNA gestört werden und optional mit Kontroll-siRNA gestört werden.
  • In einigen Ausführungsformen umfassen die hier beschriebenen Screening-Verfahren einen oder mehrere Kontrollzellkontexte, die einer Vielzahl von Testzellkontexten entsprechen. In einigen Ausführungsformen umfasst beispielsweise ein Screening-Verfahren, bei dem zwei jeweilige Testzustandskontexte verwendet werden, die Aliquots desselben jeweiligen Zelltyps enthalten, aber unterschiedlich gestört sind, z. B. durch Exposition gegenüber unterschiedlicher Test-siRNA, die auf dieselben oder unterschiedliche Gene abzielt, einen gemeinsamen Kontrollzustand für beide Testzustände, der z. B. Aliquots des jeweiligen Zelltyps enthält, der nicht durch Test-siRNA gestört ist und optional mit Kontroll-siRNA gestört ist.
  • In einigen Ausführungsformen handelt es sich bei dem in einem Testzustand und dem entsprechenden Abfragezustand verwendeten Störfaktor um ein Toxin, ein CRISPR-Reagens, ein Signalmolekül, ein Zytokin oder ein anderes Signalmolekül, ein Pathogen, eine exogene Überexpression (z. B., über einen transient transfizierten oder stabil integrierten Expressionsvektor wie ein Plasmid, ein Adenovirus-basiertes Konstrukt oder ein Lentivirusbasiertes Konstrukt), ein vorbestimmtes Medikament, eine siRNA, eine sgRNA, eine unterschiedliche Zellexposition gegenüber der Verbindung, ein Zelltyp von einem anderen Spender oder eine Zellkulturbedingung, z. B. wie weiter unten beschrieben.
  • In einigen Ausführungsformen ist ein Zellkontext für nicht-optische Messungen von Merkmalen optimiert, z. B. über RNASeq, L1000, Proteomics, Toxizitätstests, öffentlich verfügbare Bioassay-Daten, intern erstellte Bioassays, Microarrays oder chemische Toxizitätstests usw.
  • In einigen Ausführungsformen wird ein Zellkontext für einen Testzustand und einen entsprechenden Abfragezustand erzeugt, indem eine bestimmte Zelllinie mit einem Zytokin oder einer Mischung von Zytokinen gestört wird. Siehe Heike und Nakahata, 2002, „Ex vivo expansion of hematopoietic stem cells by cytokines“, Biochim Biophys Acta 1592, 313-321, das hiermit durch Bezugnahme aufgenommen wird. In einigen Ausführungsformen umfasst der Zellkontext Zytokine (z. B. Lymphokine, Chemokine, Interferone, Tumornekrosefaktoren usw.). In einigen Ausführungsformen umfasst ein Zellkontext Lymphokine (z. B. Interleukin 2, Interleukin 3, Interleukin 4, Interleukin 5, Interleukin 6, Granulozyten-Makrophagen-Kolonie-stimulierender Faktor, Interferon gamma usw.). In einigen Ausführungsformen umfasst ein Zellkontext Chemokine wie homöostatische Chemokine (z. B. CCL14, CCL19, CCL20, CCL21, CCL25, CCL27, CXCL12, CXCL13 usw.) und/oder entzündliche Chemokine (z. B. CXCL-8, CCL2, CCL3, CCL4, CCL5, CCL11, CXCL10). In einigen Ausführungsformen umfasst ein Zellkontext Interferone (IFN) wie ein IFN vom Typ I (z. B. IFN-α, IFN-β, IFN-ε, IFN-κ und IFN-ω), ein IFN vom Typ II (z. B. IFN-γ) oder ein IFN vom Typ III. In einigen Ausführungsformen umfasst ein Zellkontext Tumornekrosefaktoren wie TNFα oder TNF-alpha.
  • In einigen Ausführungsformen wird ein Zellkontext für einen Testzustand und einen entsprechenden Abfragezustand erzeugt, indem eine bestimmte Zelllinie mit einem Protein, wie z. B. einem Peptid-Aptamer, gestört wird. Peptid-Aptamere sind kombinatorische Proteinreagenzien, die mit hoher Spezifität und starker Affinität an Zielproteine binden. Auf diese Weise können sie die Funktion ihrer kognitiven Ziele modulieren. In einigen Ausführungsformen umfasst ein Peptid-Aptamer eine (oder mehrere) konformationsgebundene kurze variable Peptiddomänen, die an beiden Enden an ein Proteingerüst gebunden sind. In einigen Ausführungsformen wird ein Zellkontext mit Peptid-Aptameren gestört, die mit einer oder mehreren funktionellen Einheiten derivatisiert sind, die eine spezifische posttranslationale Modifikation ihrer Zielproteine bewirken oder die subzelluläre Lokalisierung der Ziele verändern können. Siehe z. B. Colas et al. 2000, „Targeted modification and transportation of cellular proteins“, Proc. Natl. Acad. Sci. USA. 97 (25): 13720-13725, der hiermit durch Bezugnahme einbezogen wird. In einigen Ausführungsformen wird ein Zellkontext mit einem Peptid gestört, das selektiv Protein-Protein-Wechselwirkungen innerhalb einer Einheit beeinflusst. In einigen dieser Ausführungsformen beeinflusst diese Protein-Protein-Wechselwirkung ein intrazelluläres Signalereignis. Siehe z. B. Souroujon und Mochly-Rosen, 1998, „Peptide modulators of protein-protein interactions in intracellular signaling“, Nature Biotechnology 16, 919-924, das hiermit durch Bezugnahme einbezogen wird. In einigen Fällen wird ein Zellkontext mit einem Antikörper oder einer anderen Form eines biologischen Stoffes gestört.
  • In einigen Ausführungsformen wird ein Zellkontext für einen Testzustand und einen entsprechenden Abfragezustand erzeugt, indem eine bestimmte Zelllinie mit einer Nukleinsäure, z. B. einem Nukleinsäure-Aptamer, gestört wird. Nukleinsäure-Aptamere sind kurze synthetische einzelsträngige Oligonukleotide, die spezifisch an verschiedene molekulare Ziele wie kleine Moleküle, Proteine, Nukleinsäuren und sogar Zellen und Gewebe binden. Siehe Ni et al., 2011, „Nucleic acid aptamers: clinical applications and promising new horizons“, Curr Med Chem 18(27), 4206, das hiermit durch Verweis einbezogen wird. In einigen Fällen werden Nukleinsäure-Aptamere aus einem Biopanning-Verfahren wie SELEX (Systematic Evolution of Ligands by Exponential enrichment) ausgewählt. Siehe Ellington und Szostak, 1990, „In vitro selection of RNA molecules that bind specific ligands“, Nature 346(6287), 818; und Tuerk und Gold, 1990, „Systematic evolution of ligands by exponential enrichment: RNA ligands to bacteriophage T4 DNA polymerase“, Science 249(4968), 505, die hiermit durch Verweis einbezogen werden. Die SELEX-Screening-Methode beginnt mit einer zufälligen Sequenzbibliothek von ssDNA oder ssRNA mit einer Länge von 20-100 Nukleotiden (nt). Die Randomisierung der Nukleinsäuresequenzen ergibt eine Diversität von 4n , wobei n der Anzahl der randomisierten Basen entspricht. Mit den SELEX-Methoden können in der Regel Diversitäten in der Größenordnung von ~1016 Aptameren erzeugt und überprüft werden. Jede zufällige Sequenzregion wird von konstanten Sequenzen flankiert, die zum Einfangen oder Priming verwendet werden. Um den Exonuklease-Abbau zu überwinden, können Aptamere chemisch synthetisiert und mit modifizierten oder invertierten Nukleotiden versehen werden, um den terminalen Abbau zu verhindern. Modifizierte Oligonukleotide können auch in das Aptamer eingebaut werden, entweder während oder nach der Selektion, um die Endonuklease-Stabilität zu erhöhen. Einige modifizierte Nukleotidtriphosphate, insbesondere 2'-O-modifizierte Pyrimidine, können von T7-RNA-Polymerasen effizient in Nukleinsäure-Aptamer-Transkripte eingebaut werden. Übliche chemische Modifikationen bei der Auswahl sind 2'-Aminopyrimidine und 2'-Fluorpyrimidine. Siehe Ni et al., 2011, „Nucleic acid aptamers: clinical applications and promising new horizons“, Curr Med Chem 18(27), 4206, das hiermit durch Verweis einbezogen wird.
  • In einigen Ausführungsformen wird ein Zellkontext für einen Testzustand und einen entsprechenden Abfragezustand erzeugt, indem eine bestimmte Zelllinie mit einem Zinkfinger-Transkriptionsfaktor gestört wird. In einigen dieser Ausführungsformen wird der Zinkfingerprotein-Transkriptionsfaktor in einen Vektor kodiert, der in die eine oder mehrere Zellen transformiert wird, wodurch die Kontrolle der Expression einer oder mehrerer Zielkomponenten innerhalb der einen oder mehreren Zellen bewirkt wird. In einigen dieser Ausführungsformen wird eine Sequenz, die mehreren (z. B. funktionell verwandten) Komponenten in der Einheit gemeinsam ist, von einer Störung in Form eines Zinkfingerproteins verwendet, um die Transkription all dieser Komponenten mit einer einzigen Störung in Form eines Zinkfinger-Transkriptionsfaktors zu steuern. In einigen Ausführungsformen zielt die Störung in Form eines Zinkfinger-Transkriptionsfaktors auf eine Familie verwandter Komponenten in einer Entität ab, indem sie die Expression der endogenen Transkriptionsfaktoren, die sie kontrollieren, anvisiert und moduliert. Siehe z. B. Doyon, 2008, „Heritable targeted gene disruption in zebrafish using designed zinc-finger nucleases“, Nature Biotechnology 26, 702-708, der hiermit durch Verweis einbezogen wird.
  • In einigen Ausführungsformen wird ein Zellkontext für einen Testzustand und einen entsprechenden Abfragezustand erzeugt, indem eine Mutation in das Genom einer Zelllinie eingeführt wird, z. B. eine Insertion, Deletion, Inversion, Transversion usw. Im Allgemeinen unterbricht die Mutation die Expression oder Funktion eines Zielgens.
  • Merkmale
  • Jede der charakteristischen Messungen 226, 230 und 234, die zur Ableitung der Merkmale verwendet werden, die die Grundlage der Elemente der Abfrage-Störungsdatenpunkte 276, 280 und 284 oder der entsprechenden Dimensionsreduktionskomponenten bilden, wird aus einer Vielzahl von gemessenen Merkmalen ausgewählt. In einigen Ausführungsformen umfassen die eine oder mehrere charakteristische Messungen eines oder mehrere morphologische Merkmale, Expressionsdaten, genomische Daten, epigenomische Daten, epigenetische Daten, proteomische Daten, metabolomische Daten, Toxizitätsdaten, Bioassay-Daten usw.
  • In einigen Ausführungsformen umfasst der entsprechende Satz von Elementen der einzelnen Abfrage-Störungsdatenpunkte 276, 280 und 284 zwischen 5 Testelementen und 100.000 Testelementen. Ebenso umfasst in einigen Ausführungsformen der entsprechende Satz von Elementen einen Bereich von Elementen, der in den oben diskutierten größeren Bereich fällt, z. B. von 100 bis 100.000, von 1000 bis 100.000, von 10.000 bis 100.000, von 5 bis 10.000, von 100 bis 10.000, von 1000 bis 10.000, von 5 bis 1000, von 100 bis 1000 und dergleichen. Im Allgemeinen gilt: Je mehr Elemente in den Datenpunkten enthalten sind, desto mehr Informationen stehen zur Verfügung, um die On-Target- und Off-Target-Effekte der Abfragestörungen zu unterscheiden. Andererseits steigt mit der Anzahl der Elemente im Datensatz auch der Rechenaufwand für die Verarbeitung der Daten und die Bearbeitung der mehrdimensionalen Vektoren.
  • In einigen Ausführungsformen ist jedes Merkmal, das zur Erzeugung der Merkmale verwendet wird, ein Merkmal, das optisch gemessen wird, z. B. unter Verwendung fluoreszierender Markierungen (z. B. Zellmalerei bzw. Cell Painting) oder unter Verwendung nativer Bildgebung, wie hierin beschrieben und dem Fachmann bekannt. In einigen Ausführungsformen kann, wenn jedes Merkmal optisch gemessen wird, ein einziger Bildsammlungsschritt (z. B. der ein einzelnes Bild oder eine Reihe von Bildern in mehreren Wellenbanden liefert) verwendet werden, um Bilddaten von mehreren Proben, z. B. einer ganzen Multiwell-Platte, zu sammeln. In einigen Ausführungsformen wird für jede Vertiefung in einer Multiwell-Platte eine Anzahl von Bildern erfasst. In einigen Ausführungsformen werden für jede Vertiefung mehrere Teilbilder erfasst, z. B. zwei, drei, vier, fünf, sechs oder mehr Bilder von verschiedenen Unterabschnitten jeder Vertiefung. Die Extraktion von Merkmalen und die Generierung von Merkmalen erfolgt dann elektronisch aus den gesammelten Bildern, wodurch die für die Extraktion von Merkmalen aus einer großen Anzahl von Zellkontexten und Verbindungen erforderliche Versuchszeit begrenzt wird.
  • In einigen Ausführungsformen wird eine erste Untergruppe der zur Ableitung der Merkmale verwendeten Merkmale optisch gemessen (z. B. unter Verwendung von Fluoreszenzmarkern, z. B. durch Zellmalerei bzw. Cell Painting), und eine zweite Untergruppe der zur Ableitung der Merkmale verwendeten Merkmale wird nicht optisch gemessen. Nicht einschränkende Beispiele für nicht-optische Merkmale sind Genexpressionswerte, Proteinwerte, einzelne Endpunkt-Bioassay-Daten, Metabolomdaten, Mikroumgebungsdaten, Mikrobiomdaten, Genomsequenz und zugehörige Merkmale (z. B. epigenetische Daten wie Methylierung, 3D-Genomstruktur, Chromatin-Zugänglichkeit usw.) sowie eine Beziehung und/oder Veränderung eines bestimmten Merkmals im Laufe der Zeit, z. B. innerhalb einer einzelnen Probe oder über eine Vielzahl von Proben in einer Zeitreihe. Weitere Einzelheiten zu diesen und anderen Arten von nicht-optischen Merkmalen sowie zur Erfassung von Daten im Zusammenhang mit diesen Merkmalen werden im Folgenden beschrieben.
  • In einigen Ausführungsformen wird jedes Merkmal nicht-optisch gemessen. Weitere Einzelheiten über diese und andere Arten von nicht-optischen Merkmalen sowie über die Erfassung von Daten im Zusammenhang mit diesen Merkmalen werden weiter unten beschrieben. So werden in einigen Ausführungsformen für jede Instanz (z. B. Replikat) eines jeweiligen Zellkontextes, der einer jeweiligen Verbindung ausgesetzt ist, mehrere Assays durchgeführt, z. B. werden sowohl ein Nukleinsäure-Microarray-Assay als auch ein Bioassay von verschiedenen Instanzen eines jeweiligen Zellkontextes durchgeführt, der einer jeweiligen Verbindung ausgesetzt ist.
  • In einigen Ausführungsformen werden eines oder mehrere der Merkmale anhand eines nicht zellbasierten Assays bestimmt. Das heißt, in einigen Ausführungsformen werden bei der Konstruktion der hier beschriebenen mehrdimensionalen Vektoren Daten verwendet, die aus In-vitro-Experimenten in Abwesenheit einer Zelle gewonnen wurden.
  • Optisch gemessene Merkmale
  • In einigen Ausführungsformen stellen eines oder mehrere der Merkmale, die zur Ableitung der Merkmale verwendet werden, morphologische Merkmale einer Zelle oder eines aufgezählten Teils einer Zelle bei Exposition einer entsprechenden Verbindung im Zellkontext dar. Zu den Beispielmerkmalen gehören unter anderem die Zellfläche, der Zellumfang, das Zellseitenverhältnis, der Aktingehalt, die Aktinstruktur, die Festigkeit der Zelle, die Zellausdehnung, die Zellkernfläche, der Zellkernumfang, das Zellkernseitenverhältnis und durch den Algorithmus definierte Merkmale (z. B. latente Merkmale). In einigen Ausführungsformen umfassen die Beispielmerkmale unter anderem alle Merkmale, die in Tabelle S2 der Referenz Gustafsdottir SM, et al., PLoS ONE 8(12): e80999. doi:10.1371/journal.pone.0080999 (2013) zu finden sind, die hiermit durch Verweis einbezogen wird.
  • In einigen Ausführungsformen werden solche morphologischen Merkmale mit dem Softwareprogramm Cellprofiler gemessen und erfasst. Siehe Carpenter et al., 2006, „CellProfiler: image analysis software for identifying and quantifying cell phenotypes,“ Genome Biol. 7, R100 PMID: 17076895; Kamentsky et al., 2011, „Improved structure, function, and compatibility for CellProfiler: modular high-throughput image analysis software,“ Bioinformatics 2011/doi. PMID: 21349861 PMCID: PMC3072555; und Jones et al., 2008, CellProfiler Analyst: data exploration and analysis software for complex imagebased screens, BMC Bioinformatics 9(1):482/doi: 10.1186/1471-2105-9-482. PMID: 19014601 PMCID: PMC261443, die hiermit durch Verweis einbezogen werden.
  • In einigen Ausführungsformen werden von jeder Vertiefung ein oder mehrere zweidimensionale Pixelbilder aufgenommen, und die optisch gemessenen Merkmale werden aus den Pixelwerten des einen oder mehreren Bildern abgeleitet. In einigen Ausführungsformen werden von jeder Vertiefung mehrere zweidimensionale Bilder aufgenommen. In einigen Ausführungsformen, in denen jedes Bild einen Teil der Vertiefung erfasst, werden die Merkmale über alle Bilder der Vertiefung gemessen.
  • In einigen Ausführungsformen werden ein oder mehrere dreidimensionale Pixelbilder von jeder Vertiefung erstellt und optisch gemessene Merkmale aus den Pixelwerten des einen oder mehreren Bildern abgeleitet. In einigen Ausführungsformen werden beispielsweise mehrere zweidimensionale Bilder (z. B. konfokale Bilder) von der Vertiefung mit unterschiedlichen Brennweiten aufgenommen, und die Bilder werden in der jeweiligen Reihenfolge der Brennweiten der Bilder übereinander gestapelt (z-Stapelung), um ein dreidimensionales Bild zu erzeugen.
  • In einigen Ausführungsformen werden ein oder mehrere vierdimensionale Pixelbilder von jeder Vertiefung aufgenommen, und die optisch gemessenen Merkmale werden aus den Pixelwerten des einen oder der mehreren Bilder abgeleitet. In einigen Ausführungsformen werden beispielsweise mehrere zweidimensionale Bilder (z. B. konfokale Bilder) der Vertiefung mit unterschiedlichen Brennweiten aufgenommen und die Bilder in der jeweiligen Reihenfolge der Brennweiten der Bilder übereinander gestapelt (z-Stapelung), um ein dreidimensionales Bild zu erzeugen, und mehrere dieser dreidimensionalen Bilder werden im Laufe der Zeit gesammelt, um ein vierdimensionales Bild der Vertiefung zu erzeugen.
  • Einen Überblick über technologische Überlegungen zu Bildgebungsplattformen für Hochdurchsatz-Screening-Methoden findet sich in Shumate und Hoffman, 2009, „Instrumental Considerations in High Content Screening“, Combinatorial Chemistry & High Throughput Screening, 12(9):888-98, das hiermit durch Bezugnahme aufgenommen wird.
  • In einigen Ausführungsformen ist die Messung eines oder mehrerer Merkmale eine Fluoreszenzmikroskopie-Messung. In einigen Ausführungsformen handelt es sich bei der einen oder den mehreren optisch emittierenden Verbindungen um Farbstoffe, und der Vektor für eine Verbindung aus der Vielzahl von Verbindungen umfasst entsprechende Messungen von Merkmalen, die zur Ableitung von Merkmalen aus der Vielzahl von Merkmalen für den Zellkontext in Gegenwart von mindestens drei verschiedenen Farbstoffen verwendet werden. In einigen Ausführungsformen handelt es sich bei der einen oder mehreren optisch emittierenden Verbindungen um Farbstoffe, und die Datenpunkte 276, 280 und 284 umfassen entsprechende Messungen von Merkmalen in der Vielzahl von Merkmalen für den Zellkontext in Gegenwart von jeweils mindestens fünf verschiedenen Farbstoffen.
  • Dementsprechend werden in einigen Ausführungsformen ein oder mehrere Merkmale gemessen, nachdem der Zellkontext der Verbindung und einer Reihe von Fluoreszenzfarbstoffen ausgesetzt wurde, die bei verschiedenen Wellenlängen emittieren, wie Concanavalin A/Alexa Fluor 488 Konjugat (Invitrogen, Kat. Nr. C11252), Hoechst 33342 (Invitrogen, Kat.-Nr. H3570), SYTO 14 grün fluoreszierender Nukleinsäure-Farbstoff (Invitrogen, Kat.-Nr. S7576), Phalloidin/Alexa Fluor 568-Konjugat (Invitrogen, Kat.-Nr. A12380) und/oder MitoTracker Deep Red (Invitrogen, Kat.-Nr. M22426). In einigen Ausführungsformen gehören zu den gemessenen Merkmalen eine oder mehrere Färbungsintensitäten, Texturmuster, Größe und Form der markierten zellulären Strukturen sowie Korrelationen zwischen Färbungen über Kanäle hinweg und Nachbarschaftsbeziehungen zwischen Zellen und zwischen intrazellulären Strukturen. In einigen Ausführungsformen werden zwei, drei, vier, fünf, sechs, sieben, acht, neun, zehn oder mehr als zehn fluoreszierende Färbungen, die in zwei, drei, vier, fünf, sechs, sieben oder acht Kanälen abgebildet werden, zur Messung von Merkmalen einschließlich verschiedener zellulärer Komponenten und/oder Kompartimente verwendet.
  • In einigen Ausführungsformen werden ein oder mehrere Merkmale an einzelnen Zellen, Zellgruppen und/oder einem Sichtfeld gemessen. In einigen Ausführungsformen werden die Merkmale an einem Kompartiment oder einer Komponente (z. B. Zellkern, endoplasmatisches Retikulum, Nukleoli, zytoplasmatische RNA, F-Actin-Zytoskelett, Golgi, Plasmamembran, Mitochondrien) einer einzelnen Zelle gemessen. In einigen Ausführungsformen umfasst jeder Kanal eines Bildgebungsgeräts, das zur Aufnahme von Bildern der Zellen verwendet wird, (i) einen Anregungswellenlängenbereich und (ii) einen Filterwellenlängenbereich, um die Emission eines bestimmten Farbstoffs aus der Gruppe der Farbstoffe zu erfassen, denen die Zelle vor der Messung ausgesetzt war. Ein Beispiel für den verwendeten Farbstoff und die Art der zellulären Komponente, die als Merkmal für fünf geeignete Kanäle gemessen wird, ist in der nachstehenden Tabelle 4aufgeführt, die der Tabelle 1 von Bray et al. 2016, „Cell Painting, a high-content imagebased assay for morphological profiling using multiplexed fluorescent dyes“, Nature Protocols, 11, S. 1757-74, entnommen ist, die hiermit durch Bezugnahme aufgenommen wird. Tabelle 4 - Beispielkanäle für die Messung von Merkmalen
    Kanal Farben Filter (Anregung; nm) Filter (Emission; nm) Entitätskomponente oder -kompartiment
    1 Hoechst 33342 387/11 417-477 Nukleus
    2 Concanavalin A/Alexa Fluor 488-Konjugat 472/30a 503-538a Endoplasmatisches Retikulum
    3 SYTO 14 grün fluoreszierender Nukleinsäure-Farbstoff 531/40 573-613 Nukleoli, zytoplasmatische RNAb
    4 Phallo idin/Alexa Fluor 568-Konjugat, Weizenkeim-Agglutinin/Alexa Fluor 555-Konjugat 562/40 622-662c F-Actin-Zytoskelett, Golgi, Plasmamembran
    5 MitoTracker Tiefrot 628/40 672-712 Mitochondrien
  • Cell Painting und verwandte Varianten des Cell Painting sind eine weitere vielversprechende Form der Bildgebungstechnik. Cell Painting ist ein Test zur Erstellung eines morphologischen Profils, bei dem sechs Fluoreszenzfarbstoffe im Multiplexverfahren in fünf Kanälen abgebildet werden, um acht allgemein relevante zelluläre Komponenten oder Organellen zu erkennen. Die Zellen werden in Multiwell-Platten plattiert, mit den zu prüfenden Behandlungen gestört, gefärbt, fixiert und mit einem Hochdurchsatzmikroskop abgebildet. Anschließend identifiziert eine automatisierte Bildanalysesoftware einzelne Zellen und misst eine beliebige Anzahl von einem bis zu Zehntausenden (meist jedoch etwa 1.000) morphologischer Merkmale (verschiedene Maße für Größe, Form, Textur, Intensität usw. verschiedener ganzer Zellen und subzellulärer Komponenten), um ein Profil zu erstellen, das sich für den Nachweis selbst subtiler Phänotypen eignet. Profile von Zellpopulationen, die mit verschiedenen experimentellen Störungen behandelt wurden, können verglichen werden, um viele Ziele zu erreichen, wie z. B. die Ermittlung der phänotypischen Auswirkungen chemischer oder genetischer Störungen, die Gruppierung von Verbindungen und/oder Genen in funktionelle Pfade und die Ermittlung von Signaturen von Krankheiten. Siehe Bray et al., 2016, Nature Protocols 11, 1757-1774, die hiermit durch Verweis einbezogen wird.
  • In einigen Ausführungsformen ist die Messung eines Merkmals eine markierungsfreie Bildgebungsmessung des Merkmals. In einigen Ausführungsformen werden ein oder mehrere Merkmale durch die markierungsfreie Bildgebungstechnik gemessen, nachdem der Zellkontext einer Verbindung ausgesetzt wurde. Es sind nicht-invasive, markierungsfreie Bildgebungsverfahren entwickelt worden, die die Anforderungen an eine minimale Zellmanipulation für zellbasierte Assays in einem High-Content-Screening-Kontext erfüllen. Zu diesen markierungsfreien Techniken gehört die digitale holografische Mikroskopie (Rappaz et al., 2015 Automated multi-parameter measurement of cardiomyocytes dynamics with digital holographic microscopy, „ Opt. Express 23, 13333-13347), sie liefert quantitative Informationen, die für die Endpunkt- und Zeitrafferbildgebung unter Verwendung von 96- und 384-Well-Platten automatisiert werden. Siehe z. B. Kuhn, J. 2013, et al. „Label-free cytotoxicity screening assay by digital holographic microscopy“, Assay Drug Dev. Technol. 11, 101-107; Rappaz et al., 2014 „Digital holographic microscopy: a quantitative label-free microscopy technique for phenotypic screening“, Comb. Chem. High Throughput Screen 17, 80-88; und Rappaz et al., 2015 in Label-Free Biosensor Methods in Drug Discovery (ed. Fang, Y.) 307-325, Springer Science+Business Media). Die Lichtblatt-Fluoreszenzmikroskopie (Light Sheet Fluorescence Microscopy, LSFM) ist vielversprechend für die Analyse einer großen Anzahl von Proben in hoher 3D-Auflösung und mit schneller Aufnahmegeschwindigkeit bei minimaler photoinduzierter Zellschädigung. Die LSFM erfreut sich zunehmender Beliebtheit in verschiedenen Forschungsbereichen, darunter in den Neurowissenschaften, der Pflanzen- und Entwicklungsbiologie, der Toxikologie und der Entdeckung von Arzneimitteln, obwohl sie noch nicht an ein automatisiertes HTS angepasst ist. Siehe Pampaloni et al., 2014, „Tissue-culture light sheet fluorescence microscopy (TC-LSFM) allows long-term imaging of three-dimensional cell cultures under controlled conditions“, Integr. Biol. (Camb.) 6, 988-998; Swoger et al., 2014, „Imaging cellular spheroids with a single (selective) plane illumination microscope,“ Cold Spring Harb. Protoc., 106-113; und Pampaloni et al., 2013, „High-resolution deep imaging of live cellular spheroids with light-sheet-based fluorescence microscopy,“ Cell Tissue Res. 352, 161-177, die hiermit alle durch Verweis einbezogen werden.
  • In einigen Ausführungsformen ist die Messung eines oder mehrerer Merkmale eine Hellfeldmessung des Merkmals. In einigen Ausführungsformen werden ein oder mehrere Merkmale durch Hellfeldmikroskopie gemessen, nachdem der Zellkontext einer Verbindung ausgesetzt wurde. Im Gegensatz zu Messungen mittels Fluoreszenzmikroskopie, bei denen der Zellkontext einem oder mehreren Fluoreszenzfarbstoffen ausgesetzt werden muss, ist bei der Hellfeldmikroskopie keine Verwendung von Farbstoffen erforderlich, was die Phototoxizität verringert und die Bildgebung vereinfacht. Obwohl das Fehlen von Färbemitteln den Kontrast von Hellfeldbildern im Vergleich zu Fluoreszenzbildern verringert, wurden verschiedene Techniken entwickelt, um die zelluläre Bildgebung auf diese Weise zu verbessern. Die quantitative Phasenmikroskopie beispielsweise beruht auf der Schätzung einer Phasenkarte, die aus Bildern mit unterschiedlichen Brennweiten erstellt wird. Siehe z. B. Curl CL, et al., Cytometry A 65:88-92 (2005), auf die hier verwiesen wird. In ähnlicher Weise kann eine Phasenkarte durch digitale Tiefpassfilterung und anschließende Segmentierung einzelner Zellen gemessen werden. Siehe z. B. Ali R., et al., Proc. 5th IEEE International Symposium on Biomedical Imaging: From Nano to Macro, ISBI: 181-84 (2008), auf das hier verwiesen wird. Die Texturanalyse, bei der z. B. nach der Segmentierung die Zellkonturen extrahiert werden, kann auch in Verbindung mit der Hellfeldmikroskopie verwendet werden. Siehe z. B. Korzynska A, et al., Pattern Anal Appl 10:301-19 (2007). Es gibt jedoch auch andere Techniken, die den Einsatz der Hellfeldmikroskopie erleichtern, wie z. B. auf Z-Projektion basierende Methoden. Siehe z. B. Selinummi J., et al., PLoS One, 4(10):e7497 (2009), der hiermit durch Bezugnahme aufgenommen wird.
  • In einigen Ausführungsformen ist die Messung eines oder mehrerer Merkmale eine Phasenkontrastmessung des Merkmals. In einigen Ausführungsformen werden ein oder mehrere Merkmale durch Phasenkontrastmikroskopie gemessen, nachdem der Zellkontext einer Verbindung ausgesetzt wurde. Die durch Phasenkontrast- oder Differenzialinterferenzkontrastmikroskopie (DIC) gewonnenen Bilder können digital rekonstruiert und quantifiziert werden. Siehe Koos, 2015, „DIC image reconstruction using an energy minimization framework to visualize optical path length distribution“, Sci. Rep. 6, 30420, das hiermit durch Bezugnahme aufgenommen wird.
  • Obwohl hier bestimmte bildgebende Verfahren speziell beschrieben werden, können die hier beschriebenen Methoden unter Verwendung von Merkmalen durchgeführt werden, die mit einer beliebigen Anzahl von Mikroskopmodalitäten gemessen werden.
  • In einigen Ausführungsformen wird jedes Merkmal aus einer Kombination von messbaren Merkmalen abgeleitet, die aus einer Farbe, Textur und Größe des Zellkontexts oder eines aufgezählten Teils des Zellkontexts ausgewählt werden. Zu den Beispielmerkmalen gehören unter anderem Zellfläche, Zellumfang, Zellseitenverhältnis, Aktingehalt, Aktintextur, Zellfestigkeit, Zellausdehnung, Zellkernfläche, Zellkernumfang und Zellkernseitenverhältnis. In einigen Ausführungsformen umfassen die Beispielcharakteristika unter anderem die Charakteristika in Tabelle S2 der Referenz Gustafsdottir SM, et al., PLoS ONE 8(12): e80999. doi:10.1371/journal.pone.0080999 (2013), die hiermit durch Bezugnahme aufgenommen wird.
  • In einigen Ausführungsformen handelt es sich bei einem oder mehreren der gemessenen Merkmale um latente Merkmale, z. B. um Merkmale, die aus einem mathematischen Modell der direkt aus den Vertiefungen gemessenen Daten bestimmt werden. In einer Ausführungsform wird jede entsprechende Instanz der Vielzahl von Instanzen des Zellkontextes abgebildet, um ein entsprechendes zweidimensionales Pixelbild mit einer entsprechenden Vielzahl von nativen Pixelwerten zu bilden, und wobei ein Merkmal in der Vielzahl von Merkmalen ein Ergebnis einer Faltung oder einer Reihe von Faltungen und Pooling-Operatoren umfasst, die gegen native Pixelwerte in der Vielzahl von nativen Pixelwerten des entsprechenden zweidimensionalen Pixelbildes ausgeführt werden. Dies ist zwar ein Beispiel für ein latentes Merkmal, das aus einem Bild abgeleitet werden kann, aber es können auch andere latente Merkmale und mathematische Kombinationen latenter Merkmale verwendet werden. Ein nicht einschränkendes Beispiel für die Verwendung latenter Merkmale bei der bildbasierten Erstellung von Profilen der Zellstruktur findet sich in Ljosa, V., et al., J Biomol. Screen. 18(10):10.1177/1087057113503553 (2013), das hier durch Bezugnahme aufgenommen wird.
  • Nicht-optisch gemessene Merkmale
  • In einigen Ausführungsformen umfassen eines oder mehrere der gemessenen Merkmale Expressionsdaten, die z. B. mit einem Whole Transcriptome Shotgun Sequencing (RNA-Seq)-Test gewonnen werden, der die Genexpression von Zellen (z. B. einer einzelnen Zelle) anhand der Anzahl von Transkript-Reads quantifiziert, die auf Genkonstrukte abgebildet werden. In einigen Ausführungsformen zielen RNA-Seq-Experimente auf die gleichzeitige Rekonstruktion aller mRNA-Transkripte in voller Länge aus Millionen von kurzen Reads ab. RNA-Seq erleichtert die Untersuchung von alternativen gespleißten Transkripten, posttranskriptionellen Modifikationen, Genfusionen, Mutationen/SNPs und Veränderungen der Genexpression im Laufe der Zeit oder Unterschiede in der Genexpression in verschiedenen Gruppen oder Behandlungen. Siehe z. B. Maher et al., 2009, „Transcriptome sequencing to detect gene fusions in cancer“, Nature. 458 (7234): 97-101, der hiermit durch Verweis einbezogen wird. Zusätzlich zu mRNA-Transkripten kann RNA-Seq einzelne Mitglieder verschiedener RNA-Populationen bewerten und quantifizieren, einschließlich Gesamt-RNA, mRNA, miRNA, IncRNA, snoRNA oder tRNA innerhalb von Entitäten. In einigen Ausführungsformen ist eines oder mehrere der gemessenen Merkmale eine individuelle Menge einer bestimmten RNA-Spezies, die mit RNA-Seq-Techniken bestimmt wird. In einigen Ausführungsformen erzeugen RNA-Seq-Experimente Zählungen von Komponenten (z. B. digitale Zählungen von mRNA-Lesungen), die sowohl durch biologische als auch technische Variationen beeinflusst werden. In einigen Ausführungsformen wird die RNA-Seq-Zusammensetzung unter Verwendung der Techniken durchgeführt, die in Li et al. 2008, „IsoLasso: A LASSO Regression Approach to RNA-Seq Based Transcriptome Assembly“, Cell 133, 523-536, offengelegt sind und hiermit durch Bezugnahme aufgenommen werden.
  • In einigen Ausführungsformen werden eines oder mehrere der gemessenen Merkmale mit Hilfe von Transkriptions-Profiling-Methoden wie einem L1000-Panel ermittelt, das eine Reihe informativer Transkripte misst. Bei einem solchen Ansatz wird die ligationsvermittelte Amplifikation (LMA), gefolgt vom Einfangen der Amplifikationsprodukte auf fluoreszenzadressierten Mikrokügelchen, zu einer Multiplexreaktion (z. B. einer 1000-Plex-Reaktion) erweitert. So werden z. B. Zellen, die in 384-Well-Platten wachsen, lysiert und mRNA-Transkripte auf Oligo-dT-beschichteten Platten aufgefangen. cDNAs werden aus den aufgefangenen Transkripten synthetisiert und einer LMA unter Verwendung von ortsspezifischen Oligonukleotiden unterzogen, die eine einzigartige 24-mer-Barcode-Sequenz und eine 5'-Biotin-Markierung enthalten. Die biotinylierten LMA-Produkte werden durch Hybridisierung an Polystyrol-Mikrokügelchen (Beads) unterschiedlicher Fluoreszenzfarbe nachgewiesen, die jeweils an ein zu einem Barcode komplementäres Oligonukleotid gekoppelt sind, und dann mit Streptavidin-Phycoerythrin angefärbt. Auf diese Weise kann jedes Kügelchen sowohl auf seine Farbe (zur Kennzeichnung der Identität der Landmarken) als auch auf die Fluoreszenzintensität des Phycoerythrin-Signals (zur Kennzeichnung der Häufigkeit der Landmarken) untersucht werden. Siehe Subramanian et al., „A Next Generation Connectivity Map: L1000 Platform and the First 1,000,000 Profiles“, Cell 171(6), 1437, der hiermit durch Bezugnahme einbezogen wird. In einigen Ausführungsformen werden zwischen 500 und 1500 verschiedene informative Transkripte mit diesem Assay gemessen.
  • In einigen Ausführungsformen werden eines oder mehrere der gemessenen Merkmale mit Hilfe von Microarrays ermittelt. Ein Microarray (auch als DNA-Chip oder Biochip bezeichnet) ist eine Sammlung mikroskopisch kleiner Nukleinsäurepunkte, die auf einer festen Oberfläche angebracht sind und zur gleichzeitigen Messung der Expression einer großen Anzahl von Genen verwendet werden können. Jeder Nukleinsäurepunkt enthält Pikomol einer spezifischen Nukleinsäuresequenz, die als Sonden (oder Reporter oder Oligos) bezeichnet werden. Dabei kann es sich um einen kurzen Abschnitt eines Gens oder eines anderen Nukleinsäureelements handeln, der zur Hybridisierung einer cDNA- oder cRNA-Probe (auch Anti-Sense-RNA genannt) (dem so genannten Target) unter hochstringenten Bedingungen verwendet wird. Als nicht einschränkendes Beispiel werden in einigen Ausführungsformen Microarrays wie der Affymetrix GeneChip Microarray, ein Oligonukleotid-Genexpressionsarray hoher Dichte, verwendet. Jedes Gen auf einem Affymetrix-Mikroarray GeneChip wird in der Regel durch einen Sondensatz repräsentiert, der aus 11 verschiedenen Paaren von 25-bp-Oligos besteht, die Teile der transkribierten Region dieses Gens abdecken. Jedes Paar besteht aus einem Perfect Match (PM) und einem Mismatch (MM) Oligonukleotid. Die PM-Sonde stimmt genau mit der Sequenz eines bestimmten Standardgenotyps überein, häufig eines Elternteils einer Kreuzung, während sich die MM-Sonde durch eine einzige Substitution in der zentralen 13. Base unterscheidet. Die MM-Sonde ist so konzipiert, dass sie das durch unspezifische Hybridisierung verursachte Rauschen von dem spezifischen Hybridisierungssignal unterscheidet. Siehe Jiang, 2008, „Methods for evaluating gene expression from Affymetrix microarray datasets“, BMC Bioinformatics 9, 284, der hiermit durch Verweis einbezogen wird.
  • In einigen Ausführungsformen werden eine oder mehrere der gemessenen Eigenschaften mithilfe von ChIP-Seq-Daten ermittelt. Siehe z. B. Quigley und Kintner, 2017, „Rfx2 Stabilizes Foxj1 Binding at Chromatin Loops to Enable Multiciliated Cell Gene Expression“, PLoS Genet 13, e1006538, die hiermit durch Bezugnahme aufgenommen wird. In einigen Ausführungsformen wird ChIP-seq verwendet, um festzustellen, wie Transkriptionsfaktoren und andere Chromatin-assoziierte Proteine phänotyp-beeinflussende Mechanismen in Entitäten (z. B. Zellen) beeinflussen. Spezifische DNA-Stellen, die in direkter physischer Wechselwirkung mit Transkriptionsfaktoren und anderen Proteinen stehen, können durch Chromatin-Immunpräzipitation isoliert werden. Bei der ChIP wird eine Bibliothek von Ziel-DNA-Stellen erstellt, die in vivo an ein Protein von Interesse (Komponente) gebunden sind. Parallele Sequenzanalysen werden dann in Verbindung mit Ganzgenom-Sequenzdatenbanken verwendet, um das Interaktionsmuster eines beliebigen Proteins mit der DNA zu analysieren (Johnson et al., 2007, „Genome-wide mapping of in vivo protein-DNA interactions“, Science. 316: 1497-1502, das hiermit durch Verweis einbezogen wird) oder das Muster epigenetischer Chromatinveränderungen. Dies kann auf die Gruppe der ChIP-fähigen Proteine und Modifikationen angewendet werden, wie Transkriptionsfaktoren, Polymerasen und Transkriptionsmaschinen, Strukturproteine, Proteinmodifikationen und DNA-Modifikationen.
  • ChIP reichert selektiv DNA-Sequenzen an, die von einem bestimmten Protein (Bestandteil) in lebenden Zellen (Entitäten) gebunden werden. Beim ChIP-Verfahren werden spezifische vernetzte DNA-Protein-Komplexe mit Hilfe eines Antikörpers gegen das Protein (die Komponente) von Interesse angereichert. Anschließend werden Oligonukleotid-Adaptoren zu den kleinen DNA-Abschnitten hinzugefügt, die an das Protein von Interesse gebunden waren, um eine massiv parallele Sequenzierung zu ermöglichen. Nach der Größenselektion werden alle resultierenden ChIP-DNA-Fragmente gleichzeitig mit einem Genomsequenzer sequenziert. In einem einzigen Sequenzierungslauf kann mit hoher Auflösung nach genomweiten Assoziationen gesucht werden, was bedeutet, dass die Bindung genau auf den Chromosomen lokalisiert werden kann. Es können verschiedene Sequenzierungsmethoden verwendet werden. In einigen Ausführungsformen werden die Sequenzen unter Verwendung der Cluster-Amplifikation von Adapter-ligierten ChIP-DNA-Fragmenten auf einem festen Fließzellensubstrat analysiert, um Cluster von klonalen Kopien zu erzeugen. Die daraus resultierende hochdichte Anordnung von Template-Clustern auf der Fließzellenoberfläche wird mit einem Genomanalyseprogramm sequenziert. Jeder Template-Cluster wird parallel einer Sequenzierung durch Synthese unter Verwendung fluoreszenzmarkierter reversibler Terminator-Nukleotide unterzogen. Bei jedem Lesevorgang werden die Templates Base für Base sequenziert. Anschließend gleicht die Datenerfassungs- und Analysesoftware die Probensequenzen mit einer bekannten genomischen Sequenz ab, um die ChIP-DNA-Fragmente zu identifizieren.
  • In einigen Ausführungsformen werden eines oder mehrere der gemessenen Merkmale mithilfe von ATAC-seq (Assay for Transposase-Accessible Chromatin using sequencing) ermittelt, einer Technik, die in der Molekularbiologie zur Untersuchung der Chromatinzugänglichkeit verwendet wird. Siehe Buenrostro et al., 2013, „Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position“, Nature Methods 10, 1213-1218, das hiermit durch Bezugnahme aufgenommen wird. In einigen Ausführungsformen macht ATAC-seq von der Wirkung der Transposase Tn5 auf die genomische DNA einer Entität Gebrauch. Siehe z. B. Buenrostro et al. 2015, „ATAC-seq: A Method for Assaying Chromatin Accessibility Genome-Wide“, Current Protocols in Molecular Biology: 21.29.1-21.29.9, das hiermit durch Bezugnahme einbezogen wird. Transposasen sind Enzyme, die die Bewegung von Transposons an andere Stellen im Genom katalysieren. Während natürlich vorkommende Transposasen eine geringe Aktivität aufweisen, wird bei ATAC-seq eine mutierte hyperaktive Transposase verwendet. Die hohe Aktivität ermöglicht ein hocheffizientes Schneiden der freiliegenden DNA und die gleichzeitige Ligation spezifischer Sequenzen, sogenannter Adapter. Die mit Adaptern ligierten DNA-Fragmente werden dann isoliert, durch PCR amplifiziert und für die Sequenzierung der nächsten Generation verwendet. Siehe Buenrostro et al., 2013, „Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position“, Nature Methods 10, 1213-1218, das hiermit durch Bezugnahme aufgenommen wird.
  • Ohne sich auf eine bestimmte Theorie beschränken zu wollen, geht man davon aus, dass sich Transposons bevorzugt in Genomregionen einnisten, die frei von Nukleosomen sind (nukleosomfreie Regionen), oder allgemein in Abschnitten mit freiliegender DNA. Die Anreicherung von Sequenzen aus bestimmten Loci im Genom deutet also auf das Fehlen von DNA-bindenden Proteinen oder Nukleosomen in dieser Region hin. Bei einem ATAC-seq-Experiment werden in der Regel Millionen von Sequenziersequenzen der nächsten Generation erzeugt, die erfolgreich auf das Referenzgenom abgebildet werden können. Nach der Eliminierung von Duplikaten zeigt jeder Sequenzier-Read auf eine Position im Genom, an der während des Experiments ein Transpositions- (oder Schnitt-) Ereignis stattgefunden hat. Man kann dann für jede Genomposition einen Cut Count zuordnen und ein Signal mit Basenpaarauflösung erzeugen. Dieses Signal wird in einigen Ausführungsformen der vorliegenden Offenlegung als Merkmal verwendet. Regionen des Genoms, in denen die DNA während des Experiments zugänglich war, enthalten deutlich mehr Sequenzierungs-Reads (da die Transposase dort bevorzugt wirkt) und bilden Peaks im ATAC-seq-Signal, die mit Peak-Calling-Tools nachgewiesen werden können. In einigen Ausführungsformen werden solche Peaks und ihre Positionen im Genom als Merkmale verwendet. In einigen Ausführungsformen werden diese Regionen durch die Integration weiterer genomischer und epigenomischer Daten wie Informationen über Histonmodifikationen oder Hinweise auf eine aktive Transkription weiter in die verschiedenen Typen regulatorischer Elemente (z. B. Promotoren, Enhancer, Isolatoren usw.) kategorisiert. Innerhalb der Regionen, in denen das ATAC-seq-Signal angereichert ist, kann man auch Unterregionen mit verringertem Signal beobachten. Diese Unterregionen, die in der Regel nur wenige Basenpaare lang sind, werden als „Fußabdrücke“ von DNA-bindenden Proteinen betrachtet. In einigen Ausführungsformen werden solche Fußabdrücke bzw. ihr Vorhandensein oder Fehlen als Merkmale verwendet.
  • In einigen Ausführungsformen werden Durchflusszytometrieverfahren unter Verwendung von Luminex-Beads verwendet, um Werte für eines oder mehrere der gemessenen Merkmale zu erhalten. Siehe z. B. Süsal et al., 2013, Transfus Med Hemother 40, 190-195, die hiermit durch Bezugnahme aufgenommen wird. Der Luminex-gestützte Einzelantigen-Bead-Test (L-SAB) ermöglicht beispielsweise die Charakterisierung der Spezifität von Antikörpern gegen menschliche Leukozytenantigene (HLA). Bei einer solchen durchflusszytometrischen Methode werden mit rekombinanten Einzelantigen-HLA-Molekülen beschichtete Mikrobeads verwendet, um die Antikörperreaktivität in zwei Reaktionsgefäßen gegen 100 verschiedene HLA-Klasse-I- und 100 verschiedene HLA-Klasse-II-Allele zu differenzieren. Ein Näherungswert für die Stärke der Antikörperreaktivität wird aus der mittleren Fluoreszenzintensität (MFI) abgeleitet und dient in einigen Ausführungsformen als Kenngröße für die vorliegende Offenlegung. Neben der Antikörperreaktivität gegen die HLA-A-, -B-, -C-, -DR- und -DQB-Antigene ist L-SAB in der Lage, Antikörper gegen die HLA-DQA-, -DPA- und -DPB-Antigene nachzuweisen. In einigen Ausführungsformen werden andere Luminex-Kits zum Nachweis von Nicht-HLA-Antikörpern verwendet, um Werte für ein oder mehrere Merkmale für Entitäten gemäß der vorliegenden Offenlegung abzuleiten. In einigen Ausführungsformen werden beispielsweise Antikörper gegen den Haupthistokompatibilitätskomplex der Klasse I (MICA) und gegen menschliche Neutrophile sowie Kits verwendet, die anstelle von rekombinanten HLA-Molekülen affinitätsgereinigte gepoolte humane HLA-Moleküle, die aus mehreren Zelllinien gewonnen wurden (Screening-Test zum Nachweis des Vorhandenseins von HLA-Antikörpern ohne weitere Spezifizierung), oder Phänotyp-Panels, bei denen jede Bead-Population entweder HLA-Klasse-I- oder HLA-Klasse-II-Proteine einer Zelllinie trägt, die von einem einzelnen Individuum stammt (Panel-Reaktivität, PRA-Test), verwendet werden, um den Wert für Merkmale für Entitäten gemäß einer Ausführungsform der vorliegenden Offenbarung zu bestimmen.
  • In einigen Ausführungsformen werden durchflusszytometrische Verfahren, wie z. B. das Barcoding fluoreszierender Zellen, verwendet, um Werte für eines oder mehrere der gemessenen Merkmale zu erhalten. Die Barcodierung fluoreszierender Zellen (FCB) ermöglicht eine Durchflusszytometrie mit hohem Durchsatz, z. B. eine Durchflusszytometrie mit hohem Gehalt, indem Proben von Entitäten vor der Färbung und Erfassung im Zytometer gemultiplext werden. Einzelne Zellproben (Entitäten) werden mit einem Barcode versehen oder mit eindeutigen Signaturen von Fluoreszenzfarbstoffen markiert, so dass sie zusammengemischt, gefärbt und als eine einzige Probe analysiert werden können. Durch das Mischen der Proben vor dem Färben wird der Antikörperverbrauch in der Regel um das 10-bis 100-fache reduziert. Darüber hinaus wird die Robustheit der Daten durch die Kombination von Kontroll- und behandelten Proben erhöht, wodurch Pipettierfehler, Färbungsschwankungen und die Notwendigkeit einer Normalisierung minimiert werden. Und schließlich wird die Geschwindigkeit der Datenerfassung verbessert, so dass große Profiling-Experimente mit Standard-Zytometer-Hardware durchgeführt werden können. Siehe z. B. Krutzik, 2011, „Fluorescent Cell Barcoding for Multiplex Flow Cytometry“, Curr Protoc Cytom Chapter 6: Unit 6.31, das hiermit durch Verweis einbezogen wird.
  • In einigen Ausführungsformen wird die Metabolomik verwendet, um Werte für eines oder mehrere der Merkmale zu erhalten. Metabolomik ist eine systematische Auswertung kleiner Moleküle, um biochemische Erkenntnisse über Krankheitswege zu gewinnen. In einigen Ausführungsformen umfasst eine solche Metabolomik die Bewertung der Plasmametabolomik bei Diabetes (Newgard et al., 2009, „A branched-chain amino acidrelated metabolic signature that differentiates obese and lean humans and contributes to insulin resistance,“ Cell Metab 9: 311-326, 2009) und ESRD (Wang, 2011, „RE: Metabolite profiles and the risk of developing diabetes,“ Nat Med 17: 448-453). In einigen Ausführungsformen wird die Urinmetabolomik verwendet, um Werte für eines oder mehrere der Merkmale zu erhalten. Die Urinmetabolomik bietet ein breiteres Spektrum an messbaren Metaboliten, da die Niere für die Anreicherung einer Vielzahl von Metaboliten und deren Ausscheidung im Urin verantwortlich ist. Darüber hinaus kann die Urinmetabolomik direkte Einblicke in biochemische Stoffwechselwege bieten, die mit Nierenfunktionsstörungen verbunden sind. Siehe z. B. Sharma, 2013, „Metabolomics Reveals Signature of Mitochondrial Dysfunction in Diabetic Kidney Disease“, J Am Soc Nephrol 24, 1901-12, der hiermit durch Bezugnahme aufgenommen wird.
  • In einigen Ausführungsformen wird die Massenspektrometrie verwendet, um Werte für eines oder mehrere der gemessenen Merkmale zu erhalten. Beispielsweise wird in einigen Ausführungsformen die Protein-Massenspektrometrie verwendet, um Werte für eines oder mehrere der gemessenen Merkmale zu erhalten. Insbesondere wird in einigen Ausführungsformen die biochemische Fraktionierung von nativen makromolekularen Einheiten innerhalb von Entitäten, gefolgt von Tandem-Massenspektrometrie, verwendet, um Werte für eines oder mehrere der gemessenen Merkmale zu erhalten. Siehe z. B. Wan et al. 2015, „Panorama of ancient metazoan macromolecular complexes“, Nature 525, 339-344, das hiermit durch Verweis einbezogen wird. Die Tandem-Massenspektrometrie, auch bekannt als MS/MS oder MS2, umfasst mehrere Stufen der massenspektrometrischen Auswahl, wobei zwischen den Stufen eine Form der Fragmentierung stattfindet. In einem Tandem-Massenspektrometer werden Ionen in der Ionenquelle gebildet und in der ersten Stufe der Massenspektrometrie (MS1) nach dem Masse-Ladungs-Verhältnis getrennt. Ionen eines bestimmten Masse-Ladungs-Verhältnisses (Vorläufer-Ionen) werden ausgewählt, und Fragment-Ionen (Produkt-Ionen) werden durch stoßinduzierte Dissoziation, Ionen-Molekül-Reaktion, Photodissoziation oder andere Prozesse erzeugt. Die resultierenden Ionen werden dann getrennt und in einer zweiten Stufe der Massenspektrometrie (MS2) nachgewiesen. In einigen Ausführungsformen dient der Nachweis und/oder das Vorhandensein solcher Ionen als eines oder mehrere der gemessenen Merkmale.
  • In einigen Ausführungsformen handelt es sich bei den Merkmalen, die für eine Entität oder eine Vielzahl von Entitäten beobachtet werden, um posttranslationale Modifikationen, die die Aktivität von Proteinen in einer Zelle modulieren. In einigen dieser Ausführungsformen werden massenspektrometrische Peptidsequenzierungs- und Analysetechnologien verwendet, um solche posttranslationalen Modifikationen zu erkennen und zu identifizieren. In einigen Ausführungsformen werden Isotopenmarkierungsstrategien in Kombination mit der Massenspektrometrie verwendet, um die Dynamik der Modifikationen zu untersuchen, die als gemessenes Merkmal dient. Siehe z. B. Mann und Jensen, 2003 „Proteomic analysis of post-translational modifications“, Nature Biotechnology 21, 255-261, das hiermit durch Bezugnahme einbezogen wird. In einigen Ausführungsformen wird die Massenspektrometrie verwendet, um Spleißvarianten in Entitäten zu bestimmen, zum Beispiel Spleißvarianten von Komponenten innerhalb von Entitäten, und solche Spleißvarianten und der Nachweis solcher Spleißvarianten dienen als gemessene Merkmale. Siehe z. B. Nilsen und Graveley, 2010, „Expansion of the eukaryotic proteome by alternative splicing, 2010, Nature 463, 457-463, das hiermit durch Verweis einbezogen wird.
  • In einigen Ausführungsformen wird die bildgebende Zytometrie verwendet, um Werte für eines oder mehrere der gemessenen Merkmale zu erhalten. Die bildgebende Durchflusszytometrie kombiniert die statistische Aussagekraft und Fluoreszenzempfindlichkeit der Standard-Durchflusszytometrie mit der räumlichen Auflösung und quantitativen Morphologie der digitalen Mikroskopie. Siehe z. B. Basiji et al., 2007, „Cellular Image Analysis and Imaging by Flow Cytometry“, Clinics in Laboratory Medicine 27, 653-670, die hiermit durch Bezugnahme einbezogen wird.
  • In einigen Ausführungsformen wird die Elektrophysiologie verwendet, um Werte für eine oder mehrere der gemessenen Eigenschaften zu erhalten. Siehe z. B. Dunlop et al. 2008, „High-throughput electrophysiology: an emerging paradigm for ion-channel screening and physiology“, Nature Reviews Drug Discovery 7, 358-368, das hiermit durch Verweis einbezogen wird.
  • In einigen Ausführungsformen wird die proteomische Bildgebung/3D-Bildgebung verwendet, um Werte für eines oder mehrere der gemessenen Merkmale zu erhalten. Siehe z. B. die US-Patentveröffentlichung Nr. 24186) 276686 A1 mit dem Titel „Single Molecule Peptide Sequencing“, die hiermit durch Verweis einbezogen wird. Solche Verfahren können für die groß angelegte Sequenzierung einzelner Peptide in einer Mischung aus einer Entität oder einer Vielzahl von Entitäten auf Einzelmolekülebene verwendet werden.
  • Assay-Parameter
  • Wie hier unter Bezugnahme auf 3 beschrieben, wird in einigen Ausführungsformen jede charakteristische Messung als Wiederholung durchgeführt, d. h. jede Bedingung (z. B. jeder Kontrollzustand, Prüfzustand und/oder Abfragezustand) wird mehr als einmal ausgeführt, und jede charakteristische Messung wird aus jedem Fall der Bedingung gewonnen. In einigen Ausführungsformen werden charakteristische Messungen von mindestens 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 75, 100, 500 oder mehr Instanzen jeder Bedingung erhalten, d. h. die Versuchsbedingungen werden in zwei oder mehr Wiederholungen hergestellt. In anderen Ausführungsformen werden die charakteristischen Messungen aus einem einzigen Fall jeder Bedingung gewonnen.
  • In ähnlicher Weise, wie hier unter Bezugnahme auf 3 beschrieben, wird in einigen Ausführungsformen jede Abfrage-Störung (z. B. Verbindung) jedem Zellkontext in einer Vielzahl von Konzentrationen ausgesetzt. In einigen Ausführungsformen wird jede Abfragestörung (z. B. Verbindung) jedem Zellkontext mit mindestens 2, 3, 4, 5, 6, 7, 8, 9, 10 oder mehr Konzentrationen ausgesetzt. In ähnlicher Weise wird in einigen Ausführungsformen jede charakteristische Messung bei jeder Konzentration in Wiederholung durchgeführt. In anderen Ausführungsformen wird jede Abfragestörung (z. B. eine Verbindung) jedem Zellkontext in einem einzigen Fall ausgesetzt.
  • Hinsichtlich der Konzentrationen der Verbindungen, die für eine bestimmte Abfragestörung verwendet werden, weiß der erfahrene Fachmann, wie die Konzentration für eine bestimmte Verbindung zu wählen ist. In einigen Ausführungsformen wird jede Verbindung in derselben Konzentration verwendet. In einigen Ausführungsformen werden verschiedene Verbindungen in unterschiedlichen Konzentrationen verwendet, z. B. auf der Grundlage einer oder mehrerer bekannter oder erwarteter Eigenschaften der Verbindung, wie Molekulargewicht, Löslichkeit, Vorhandensein oder bestimmte funktionelle Gruppen, bekannte oder erwartete Wechselwirkungen, bekannte oder erwartete Toxizität, usw. Wenn beispielsweise bekannt ist, dass eine bestimmte Verbindung für einen Zelltyp, der in einem bestimmten Zellkontext verwendet wird, toxisch ist, kann in einigen Ausführungsformen die Konzentration der Verbindung angepasst werden, z. B. im Verhältnis zu der für andere Verbindungen verwendeten Konzentration. Im Allgemeinen wird bei den hier beschriebenen Verfahren eine Verbindung in einer Konzentration zwischen 1 nM und 1 mM verwendet. In einigen Ausführungsformen wird eine Verbindung in einer Konzentration von 10 nM bis 100 µM verwendet. In einigen Ausführungsformen wird eine Verbindung in einer Konzentration von 100 nM bis 10 µM verwendet. Der erfahrene Fachmann weiß jedoch, wann eine Verbindung in einer Konzentration außerhalb dieses Bereichs verwendet werden sollte.
  • In einigen Ausführungsformen, in denen die Verbindungen in mehreren Konzentrationen getestet werden, erstrecken sich die mehreren Konzentrationen über mindestens einen zweifachen Konzentrationsbereich, z. B. 100 nM bis 200 nM. In einigen Ausführungsformen umfassen die Mehrfachkonzentrationen mindestens eine Größenordnung, z. B. 100 nM bis 1 µM. In einigen Ausführungsformen erstrecken sich die Mehrfachkonzentrationen über mindestens zwei Größenordnungen, z. B. 100 nM bis 10 µM. In einigen Ausführungsformen überspannen die Mehrfachkonzentrationen mindestens drei Größenordnungen, z. B. 100 nM bis 100 µM.
  • Im Allgemeinen wird die Zeit, in der ein Zellkontext einer Verbindung ausgesetzt wird, von dem jeweiligen Merkmal, das gemessen wird, und/oder dem jeweiligen Assay, aus dem die Merkmalsdaten gewonnen werden, beeinflusst. Wenn der verwendete Assay beispielsweise ein Phänomen misst, das nach der Exposition des Zellkontexts gegenüber der Verbindung schnell auftritt, muss der Zellkontext vor der Messung des Merkmals nicht über einen langen Zeitraum der Verbindung ausgesetzt werden. Wird dagegen mit dem Test ein Phänomen gemessen, das langsam oder mit erheblicher Verzögerung auftritt, nachdem der Zellkontext der Verbindung ausgesetzt wurde, sollte vor der Messung des Merkmals eine längere Inkubationszeit verwendet werden.
  • In einigen Ausführungsformen, z. B. wenn latente Merkmale aus einem Zellkontext extrahiert werden, wird die Zeit, in der der Zellkontext vor der Messung einer Verbindung ausgesetzt wird, stochastisch bestimmt. In einigen Fällen wird die Zeit, in der der Zellkontext vor der Messung einer Verbindung ausgesetzt wird, auf der Grundlage von Erfahrung oder Versuch und Irrtum mit einem bestimmten Assay oder Phänomen bestimmt. In einer Ausführungsform wird die Menge der jeweiligen Verbindung dem Zellkontext mindestens eine Stunde lang ausgesetzt, bevor die Messung durchgeführt wird. In einigen Ausführungsformen wird die Messung durch zelluläre Bildgebung, z. B. unter Verwendung von Fluoreszenzmarkem (z. B. Zellmalerei bzw. Cell Painting) oder durch native Bildgebung, wie hierin beschrieben und dem Fachmann bekannt, durchgeführt. In einigen Ausführungsformen wird die Menge der jeweiligen Verbindung dem Zellkontext mindestens eine Stunde lang ausgesetzt, bevor ein Bild aufgenommen wird.
  • In einigen Ausführungsformen werden charakteristische Daten unter Verwendung eines automatisierten zellulären Bildgebungssystems (z. B. ImageXpress Micro, Molecular Devices) erfasst, bei dem Zellkontexte in Multiwell-Platten (z. B. 384-Well-Platten) angeordnet wurden, nachdem sie mit einer Reihe von Farbstoffen angefärbt wurden, die bei verschiedenen diskreten Wellenlängen emittieren (z. B. Hoechst 33342, Alexa Fluor 594 Phalloidin usw.) und einer Störung ausgesetzt wurden. In einigen Ausführungsformen werden die Zellkontexte mit einer Belichtungszeit abgebildet, die auf der Grundlage des verwendeten Markerfarbstoffs bestimmt wird (z. B. kann eine Belichtungszeit, die zur Abbildung der Hoechst-Färbung verwendet wird, kürzer sein als eine Belichtungszeit, die zur Abbildung der Phalloidin-Färbung verwendet wird). In einigen Ausführungsformen wird der optimale Fokus für jede Vertiefung mithilfe der Laser-Autofokussierung auf einen bestimmten Farbstoffkanal (z. B. den Hoechst-Kanal) gefunden. In einigen Ausführungsformen wird das automatisierte Mikroskop dann so programmiert, dass es einen z-Stapel von Bildern aufnimmt (z. B. 32 Bilder, wobei z = 0 in der optimalen Fokusebene, 16 Bilder oberhalb der Fokusebene und 16 Bilder unterhalb der Fokusebene), z. B. mit einem Abstand von 2 µm zwischen den Schnitten.
  • In einigen Ausführungsformen enthält jede Vertiefung mehrere tausend Zellen, so dass jede von einer Kamera aufgenommene digitale Darstellung einer Vertiefung (z. B. ein einzelnes Bild oder ein zusammengesetztes Bild aus mehreren Teilbildern der Vertiefung) mehrere tausend Zellen in jeder der verschiedenen Vertiefungen darstellt. In einigen Ausführungsformen wird eine Segmentierungssoftware verwendet, um einzelne Zellen in den digitalen Bildern und darüber hinaus verschiedene Komponenten (z. B. zelluläre Komponenten) innerhalb einzelner Zellen zu identifizieren. Sobald die zellulären Komponenten segmentiert und identifiziert sind, werden mathematische Transformationen an diesen Komponenten durchgeführt, um die Messungen der Merkmale zu erhalten.
  • Normalisierung
  • In einigen Ausführungsformen werden die charakteristischen Messungen, z. B. aus einer oder mehreren Multiwell-Platten, wie in 3 dargestellt, und/oder aus den charakteristischen Messungen abgeleitete Merkmale gegen eine oder mehrere Hintergrundinstanzen normalisiert, z. B. um den Hintergrund in der charakteristischen Messung zu berücksichtigen, was vor oder nach der Konstruktion eines mehrdimensionalen Datenpunkts (276, 280 und 284) durchgeführt werden kann. In einigen Ausführungsformen sind die eine oder mehreren Hintergrundinstanzen Zellkontexte, die keiner Kontrollstörung ausgesetzt sind. So wird in einigen Ausführungsformen jedes Element eines Vektors, der ein von einem gemessenen Merkmal abgeleitetes Merkmal repräsentiert, durch einen unabhängigen Normalisierungsprozess unter Verwendung von Messungen derselben zugrunde liegenden Merkmale aus dem Hintergrundsatz (z. B. der Hintergrundinstanz) bestimmt. Mit anderen Worten: Die Werte eines ersten Merkmals, die gemeinsam (z. B. als Mittelwert oder als ein anderes Maß für die zentrale Tendenz dieser Werte) als erstes Element in einem Datenpunkt dienen, werden auf eine Weise normalisiert, die unabhängig von der Art und Weise ist, wie die Werte eines zweiten Merkmals, das als zweites Element in einem Datenpunkt dient, normalisiert werden. Bei einer solchen Normalisierung werden im Allgemeinen die Werte für das entsprechende Merkmal aus den Hintergrundinstanzen verwendet.
  • Dementsprechend enthält in einigen Ausführungsformen eine Teilmenge der Vertiefungen in der Vielzahl von Vertiefungen in jeder Multiwell-Platte ein Aliquot von Zellen des Zellkontextes, die keiner Kontrollstörung, einer Teststörung oder einer Abfrage-Störung ausgesetzt waren, und die Messung des jeweiligen Merkmals aus dem Kontrollzustand, dem Testzustand und/oder dem Abfragezustand wird durch eine oder mehrere Instanzen der Vertiefungen normalisiert, die den Hintergrundzustand enthalten, z. B. durch einen Mittelwert des über die Hintergrundinstanzen gemessenen Merkmals.
  • In einigen Ausführungsformen wird die Normalisierung des gemessenen Merkmals unter Verwendung der Standardabweichung des über die Hintergrundinstanzen gemessenen Merkmals erreicht, indem die Messung des Merkmals über die Vielzahl der Instanzen des Kontrollzustands, des Testzustands und/oder des Abfragezustands durch eine Standardabweichung, zwei Standardabweichungen oder drei Standardabweichungen des über die Instanzen des Hintergrundzustands gemessenen Merkmals geteilt wird.
  • In einigen Ausführungsformen wird die Normalisierung des Merkmals unter Verwendung eines Maßes für die Streuung des Merkmals erreicht, das über die Instanzen des Hintergrundzustands gemessen wird, indem die Messung des Merkmals über die mehreren Instanzen des Kontrollzustands, des Testzustands und/oder des Abfragezustands durch das Maß für die Streuung des Merkmals über die Instanzen des Hintergrundzustands geteilt wird. In einigen dieser Ausführungsformen ist dieses Streuungsmaß eine mittlere Abweichung, eine Standardabweichung, eine Varianz oder eine Multiplikation davon (z. B. 2 x mittlere Abweichung, 2 x Standardabweichung, 2 x Varianz usw.).
  • Reduzierung der Dimensionen
  • In einigen Ausführungsformen, insbesondere wenn eine große Anzahl von Merkmalen aus gemessenen Merkmalen abgeleitet wird und/oder eine große Anzahl von Zellkontexten verwendet wird, sind die resultierenden mehrdimensionalen Datenpunkte, die für das Screening von Abfragestörungen verwendet werden, sehr groß, was die anschließende Analyse rechenaufwändig macht. Um den Rechenaufwand zu verringern, werden in einigen Ausführungsformen die mehrdimensionalen Datenpunkte mit Hilfe eines in der Technik bekannten statistischen Merkmalsauswahl- oder Merkmalsextraktionsverfahrens dimensioniert, z. B. Hauptkomponentenanalyse, nicht-negative Matrixfaktorisierung, Kernel-PCA, graphbasierte Kernel-PCA, UMAP, lineare Diskriminanzanalyse, verallgemeinerte Diskriminanzanalyse. In ähnlicher Weise wird in einigen Ausführungsformen ein maschinelles Lernverfahren verwendet, um die Anzahl der Dimensionen der mehrdimensionalen Datenpunkte zu reduzieren, z. B. ein neuronales Netz, ein neuronales Faltungsnetz, ein Autoencoder, eine Support Vector Machine, ein Bayes'sches Netz oder ein genetischer Algorithmus. Dies wiederum verringert den Rechenaufwand für die Analyse des Datensatzes, indem die Daten komprimiert werden, um die Methode rechnerisch effizienter zu machen, z. B. indem der Computer einen Algorithmus auf den kleineren Datensatz (die dimensionsreduzierten Datenpunkte) statt auf den vollständigen Datensatz (die ursprünglichen mehrdimensionalen Datenpunkte) anwenden kann.
  • Die Hauptkomponentenanalyse (PCA) reduziert die Dimensionalität eines mehrdimensionalen Datenpunktes, indem sie die Vielzahl von Elementen (z. B. abgeleitet aus den gemessenen Merkmalen 226, 230 und/oder 234) in einen neuen Satz von Variablen (Hauptkomponenten) umwandelt, die die Merkmale des Trainingssatzes zusammenfassen. Siehe z. B. Jolliffe, 1986, Principal Component Analysis, Springer, New York, das hiermit durch Bezugnahme einbezogen wird. Die PCA wird auch in Draghici, 2003, Data Analysis Tools for DNA Microarrays, Chapman & Hall/CRC, beschrieben, das hiermit durch Verweis einbezogen wird. Die Hauptkomponenten (PC) sind unkorreliert und werden so geordnet, dass die k-te PC die k-te größte Varianz unter den PC über die beobachteten Daten für die Merkmale aufweist. Die k-te PC kann als die Richtung interpretiert werden, die die Variation der Projektionen der Datenpunkte maximiert, so dass sie orthogonal zu den ersten k-1 PC ist. Die ersten paar PC erfassen den größten Teil der Variation in den beobachteten Daten. Im Gegensatz dazu wird oft angenommen, dass die letzten PCs nur das restliche „Rauschen“ in den beobachteten Daten erfassen. So können die aus der PCA abgeleiteten Hauptkomponenten als Grundlage für Vektoren dienen, die gemäß der vorliegenden Offenlegung verwendet werden.
  • Die Faktorisierung nicht-negativer Matrizen und die Approximation nicht-negativer Matrizen reduzieren die Dimensionalität einer mehrdimensionalen Matrix durch Faktorisierung der Matrix in zwei Matrizen, die jeweils eine deutlich geringere Dimensionalität aufweisen, aber ein Produkt mit der gleichen oder annähernd der gleichen Dimensionalität wie die ursprüngliche höherdimensionale Matrix ergeben. Siehe z. B. Lee und Seung, „Learning the parts of objects by non-negative matrix factorization“, Nature, 401(6755):788-91 (1999), der hiermit durch Verweis einbezogen wird. Siehe auch Dhillon und Sra, „Generalized Nonnegative Matrix Approximations with Bregman Divergences“, Advances in Neural Information Processing Systems 18 (NIPS 2005), das hiermit durch Verweis einbezogen wird.
  • Die Kernel-PCA ist eine Erweiterung der PCA, bei der N Elemente eines Vektors mit Hilfe einer nicht-trivialen, beliebigen Funktion auf einen N-dimensionalen Raum abgebildet werden, wodurch Projektionen der Elemente auf Hauptkomponenten entstehen, die in einem niedrigeren dimensionalen Unterraum liegen. Auf diese Weise ist die Kern-PCA besser geeignet als die PCA, um die Dimensionalität nichtlinearer Daten zu reduzieren. Siehe z. B. Schölkopf, „Nonlinear Component Analysis as a Kernel Eigenvalue Problem“, Neural Computation, 10: 1299-1319 (198), das hiermit durch Bezugnahme aufgenommen wird.
  • Die lineare Diskriminanzanalyse (LDA) reduziert wie die PCA die Dimensionalität eines mehrdimensionalen Vektors, indem sie die Vielzahl der Elemente (z. B. gemessene Elemente) in einen neuen Satz von Variablen (Hauptkomponenten) umwandelt, die die Merkmale der Trainingsmenge zusammenfassen. Im Gegensatz zur PCA ist LDA jedoch eine überwachte Methode zur Merkmalsextraktion, die (i) die Varianz zwischen den Klassen berechnet, (ii) die Varianz innerhalb der Klassen berechnet und dann (iii) eine niedrigere dimensionale Darstellung konstruiert, die die Varianz zwischen den Klassen maximiert und die Varianz innerhalb der Klassen minimiert. Siehe z. B. Tharwat, A., et al., „Linear discriminant analysis: A detailed tutorial,“ AI Communications, 30:169-90 (2017), das hiermit durch Verweis einbezogen wird.
  • Die verallgemeinerte Diskriminanzanalyse (GDA), die der Kern-PCA ähnelt, bildet nichtlineare Eingangselemente mehrdimensionaler Vektoren in einem höherdimensionalen Raum ab, um lineare Eigenschaften der Elemente zu erhalten, die dann mit der klassischen linearen Diskriminanzanalyse analysiert werden können. Auf diese Weise ist die GDA besser als die LDA in der Lage, die Dimensionalität nichtlinearer Daten zu reduzieren. Siehe zum Beispiel Baudat und Anouar, „Generalized Discriminant Analysis Using a Kernel Approach“, Neural Comput. 12(10):2385-404 (2000).
  • Autoencoder sind künstliche neuronale Netze, die zum Erlernen effizienter Datenkodierungen in einem unüberwachten Lernalgorithmus verwendet werden, der Backpropagation anwendet. Autoencoder bestehen aus zwei Teilen, einem Encoder und einem Decoder. Der Encoder liest einen Eingangsvektor und komprimiert ihn zu einem niedrigeren Vektor, und der Decoder liest den komprimierten Vektor und stellt den Eingangsvektor wieder her. Siehe z. B. Kapitel 14 von Goodfellow et al. „Deep Learning“, MIT Press (2016), das hiermit durch Verweis einbezogen wird.
  • Die hier beschriebenen Verfahren können jedoch auch auf andere im Fachgebiet bekannte Dimensionsreduzierungstechniken angewendet werden. In einigen Ausführungsformen wird beispielsweise eine Untergruppe von Merkmalen zur Aufnahme in eine dimensionsreduzierte Darstellung eines Datenpunkts ausgewählt, während andere Merkmale verworfen werden, z. B. auf der Grundlage eines Optimalitätskriteriums in der linearen Regression. Siehe z. B. Draper und Smith, „Applied Regression Analysis“, 2d Edition, New York: John Wiley & Sons, Inc. (1981), die hiermit durch Bezugnahme einbezogen wird. In ähnlicher Weise werden in einigen Ausführungsformen diskrete Methoden verwendet, bei denen Merkmale entweder ausgewählt oder verworfen werden, z. B. ein „leaps and bounds“-Verfahren. Siehe z. B. Furnival und Wilson, „Regressions by Leaps and Bounds“, Technometrics, 16(4):499-511 (1974), das hiermit durch Bezugnahme einbezogen wird. Ebenso wird in einigen Ausführungsformen die lineare Regression durch Vorwärtsselektion, Rückwärtselimination oder bidirektionale Elimination verwendet. Siehe z. B. Draper und Smith, „Applied Regression Analysis“, 2d Edition, New York: John Wiley & Sons, Inc. (1981). In anderen Ausführungsformen werden Schrumpfungsmethoden verwendet, z. B. Methoden, die redundante oder irrelevante Merkmale auf kontinuierlichere Weise reduzieren/schrumpfen, z. B. Ridge-Regression, Lasso und abgeleitete Eingangsrichtungsmethoden (z. B. PCR, PLS).
  • Korrelationsentfernung und Varianzstandardisierung
  • In einigen Ausführungsformen, wenn die Hauptkomponentenanalyse verwendet wird, stellt jedes Element der hier beschriebenen mehrdimensionalen Datenpunkte eine andere Hauptkomponente dar. Der sich daraus ergebende dimensionsreduzierte Vektor enthält Hauptkomponenten, die nicht normalisiert sind, und daher haben die anfänglichen Hauptkomponenten, die notwendigerweise die größte Menge an Variation beschreiben, größere Werte als die nachfolgenden Hauptkomponenten. Genau diese nachfolgenden Hauptkomponenten können jedoch eine biologische Bedeutung haben. Daher werden in einigen Ausführungsformen der vorliegenden Offenlegung die Verbindungen geweißt („whitened“), um alle Hauptkomponenten auf den gleichen Wert zu bringen. Beispielsweise wird in einigen Ausführungsformen jede jeweilige Hauptkomponente in der Vielzahl der Hauptkomponenten mit einem entsprechenden Eigenwert assoziiert, und jede jeweilige Hauptkomponente in der Vielzahl der Hauptkomponenten wird durch die Quadratwurzel des entsprechenden Eigenwerts normalisiert, bevor die Vielzahl der Hauptkomponenten verwendet wird, um jeden jeweiligen Vektor in der Vielzahl der Vektoren neu auszudrücken. Auf diese Weise übergewichten die anfänglichen Hauptkomponenten den Vergleich der Vektoren nicht. Generell kann jede Whitening-Transformation verwendet werden, d. h. eine lineare Transformation, die einen Vektor von Zufallsvariablen (hier die Hauptkomponenten) mit einer bekannten Kovarianzmatrix in eine Menge neuer Variablen transformiert, deren Kovarianz die Identitätsmatrix ist. Dementsprechend gibt es viele mögliche Whitening-Verfahren, einschließlich, ohne Einschränkung, Whitening auf der Grundlage der Hauptkomponentenanalyse, der Cholesky-Matrixzerlegung und der Nullphasen-Komponentenanalyse. Siehe z. B. Kessy A. et al., „Optimal Whitening and Decorrelation“, The American Statistician, DOI: 10.1080/00031305.2016.1277159 (2018), das hiermit durch Bezugnahme aufgenommen wird.
  • Beispiele
  • Beispiel 1 - Identifizierung von Therapien für Ataxia Telangiectasia
  • Ataxia telangiectasia (A-T) ist eine seltene genetisch bedingte neurodegenerative Erkrankung, die durch fortschreitende Schwierigkeiten bei der motorischen Kontrolle und Bewegungskoordination (Ataxie) gekennzeichnet ist und bereits in der frühen Kindheit beginnt. Darüber hinaus entwickeln Patienten mit A-T Schleimhaut- und Hautläsionen aufgrund von Blutgefäßanomalien (Teleangiektasien), vermehrte Infektionen aufgrund von Immunstörungen und ein erhöhtes Risiko für Lymphome. Die Betroffenen sterben oft schon im zweiten oder dritten Lebensjahrzehnt an den Folgen von Infektionen oder Krebserkrankungen.
  • A-T betrifft eine von 40.000 Personen weltweit und wird durch Mutationen im DNA-Reparaturgen ATM verursacht, einem Gen, das im menschlichen Körper ubiquitär vorkommt. Die A-T verursachenden Mutationen führen zu einer gestörten Funktion des ATM-Proteins und zu Defekten im DNA-Schadensreaktionsweg. Die Krankheit befällt aus unbekannten Gründen bevorzugt Zellen des Kleinhirns, des Immunsystems und des Gefäßsystems. A-T ist eine verheerende Krankheit, und es gibt derzeit keine von der FDA zugelassenen Behandlungen, die das Fortschreiten der Krankheit aufhalten könnten. Aufgrund von Zufallsfunden, bei denen sich die Symptome von A-T-Patienten nach der zufälligen Einnahme von Glukokortikoiden verbesserten, wurden jedoch mehrere Humanstudien zur systematischen Bewertung ihrer therapeutischen Wirksamkeit eingeleitet. Betamethason wurde in einer Studie mit 6 Patienten getestet, und es wurde festgestellt, dass es die neurologischen Manifestationen verbessert (Pignata et al. 2011). Eine andere Gruppe, die mit dem Verabreichungsweg von Glukokortikoiden experimentierte, entwickelte eine zellbasierte Therapie, die die Infusion von patienteneigenen Erythrozyten mit Dexamethason beinhaltet. Die Ergebnisse einer Studie an 22 Patienten mit intra-erythrozytärem Dexamathason zeigten eine signifikante Verbesserung der neurologischen Symptome (Magnani et al. 2014; Pignata et al. 2010). Somit stellen Glukokortikoide derzeit eine der fortschrittlichsten Behandlungen für A-T dar.
  • Die 9A, 9B, 9C und 9D zeigen die Ergebnisse von Screens zur Identifizierung von Arzneimittelkandidaten für A-T aus einer Bibliothek mit zahlreichen (z. B. 2000) kleinen Molekülen. Die Treffer wurden algorithmisch auf der Grundlage ihrer Wirkung ausgewählt und in einem Tertiärscreening mit einer höheren Anzahl von Wiederholungen überprüft. Wie in der Legende 905 in 9A dargestellt, sind die Ergebnisse eines Tertiärscreens der wirksamsten Verbindungen (Kreise und Fünfecke, meist in Region 906) in Bezug auf ATM-defiziente Kontrollen (Quadrate, meist in Region 904) und nicht erkrankte Kontrollen (Diamanten, meist in Region 902) aufgetragen. In Bezug auf 9A kann zusätzlich oder alternativ die Farbe und/oder Schattierung der aufgezeichneten Elemente verwendet werden. Glucocorticoide sind durch das gestrichelte Polygon 901 gekennzeichnet. Ein weiteres, aufgrund seiner Wirkung im Screening sehr attraktives Molekül mit geringem bis gar keinem Nebenwirkungsprofil, Verbindung 1, wirkte auf ein neuartiges Target für A-T. 9B zeigt Seite an Seite die Auswirkungen von Mometason und dem neuen Medikament REC-3926 aus 9A auf die zwanzig wichtigsten phänotypischen Krankheitsmerkmale. Die Länge der breiteren Balken, wie z. B. Balken 910, steht für Veränderungen bei einzelnen Merkmalen mit zunehmendem oder abnehmendem Ausmaß, die die ATM-Krankheitssignatur am besten darstellen. Die Auswirkung jedes Medikaments auf einzelne Merkmale wird in einem zweiten, schmaleren Balken überlagert, z. B. in Balken 911. Medikamentenklasse 2 rettet alle 20 Merkmale, die die Krankheitssignatur für ATM-Mangel umfassen, während Mometason eine Untergruppe von Merkmalen rettet (gekennzeichnet durch die Klammer „Wirksamkeit“). Die Reihenfolge der Merkmale wurde zwischen den einzelnen Diagrammen randomisiert, und die Beschriftung der einzelnen Merkmale wurde weggelassen. In einigen Ausführungsformen kann der Farbton der dargestellten Form (und/oder Farbe) für einen bestimmten Datenpunkt umgekehrt proportional zur Varianz der Merkmalsmessung sein. Zum Beispiel können in 9B in einigen Ausführungsformen die breiten Balken (wie Balken 910) grün schattiert sein, während die schmaleren Balken (wie Balken 911) rot schattiert sein können; und die Schattierung von Grün oder Rot (oder einer anderen ausgewählten Farbe(n)) ist umgekehrt proportional zur Varianz der Merkmalsmessungen. In ähnlicher Weise kann z. B. in 9A ein Farbton wie Grün oder Rot verwendet werden, um ein Symbol in einer Weise zu schattieren, die umgekehrt proportional zur Varianz der Merkmalsmessungen ist. Die 9C und 9D veranschaulichen die Wirkung von Glukokortikoid-Treffern auf Signalwege, die mit ATM-Mangel assoziiert sind, wie durch Western Blot getestet. siRNA-transfizierte A549-Zellen (9C) und primäre Fibroblasten von einem Patienten mit AT (9D) wurden mit H2O2 und den angegebenen Medikamenten behandelt. Western Blots wurden auf ATM und phosphoryliertes Chk2 untersucht. Alle Glukokortikoide mit Ausnahme von Dexamethason retteten die mit dem ATM-Mangel verbundene Chk2-Phosphorylierung in dem Zellmodell. Mometason zeigte darüber hinaus eine dosisabhängige Rettung der Chk2-Phosphorylierung in primären, von Patienten stammenden Zellen. Die unteren Diagramme zeigen die Quantifizierung von phosphoryliertem Chk2 aus dem Western Blot, n=3. H= gesund; * bedeutet p<0,05, zweiseitiger t-Test für gepaarte Verhältnisse.
  • Zur Identifizierung von Wirkstoffkandidaten für A-T wurde ein starker Cell-Painting™-Phänotyp (Bray et al. 2016) in Verbindung mit ATM-Mangel in A549-Zellen festgestellt (z. B. quadratische „Krankheits“-Proben gegenüber rautenförmigen „gesunden Kontroll“-Proben, wie in 9A dargestellt). Die niedermolekularen Verbindungen wurden dann am A-T-Krankheitsmodell mit den hier beschriebenen Screening-Methoden getestet. In einem Ausführungsbeispiel wurden aus etwa 2.000 Verbindungen, darunter von der FDA zugelassene Verbindungen und andere hochgradig übertragbare Moleküle, starke Klasseneffekte bei mehreren Medikamenten identifiziert. Insbesondere die Glukokortikoide zeigten eine starke Anreicherung bei der Auswahl für die Wirksamkeit im Screening, wobei alle Kandidaten hochdimensionale Krankheitsphänotypen bei minimaler Zunahme der Nebenwirkungen retteten (9A). Unter den Glukokortikoiden zeigte das Screening zwei verschiedene Gruppen, die sich anhand ihres Nebenwirkungsprofils unterscheiden ließen. Die Gruppe mit stärkeren Nebenwirkungen umfasste Betamethason und andere Glukokortikoide, während die zweite Gruppe unter anderem das Glukokortikoid Mometason enthielt ( 9A). Bemerkenswert ist, dass neben den Steroiden eine zweite Wirkstoffklasse mit einem starken Wirksamkeitssignal und einem geringeren Nebenwirkungsprofil im Screening identifiziert wurde (9A, Wirkstoff 1). Die Bewertung der Auswirkungen von Glukokortikoiden auf den A-T-Phänotyp ergab eine starke Reduzierung der Merkmale, die zum zellulären Phänotyp beitragen (9B).
  • Um diese Verbindungen weiter zu validieren, wurden krankheitsspezifische Studien durchgeführt. Als Reaktion auf DNA-Schäden stimuliert ATM die Phosphorylierung einer Vielzahl von Zielproteinen, darunter die Checkpoint-Kinase Chk2. Wie erwartet wurde beobachtet, dass die siRNA-vermittelte Ausschaltung der ATM-mRNA in der A549-Modellzelllinie die Phosphorylierung von Chk2 nach H2O2-Behandlung unterdrückte. Darüber hinaus stellten die meisten getesteten Glukokortikoide die Chk2-Phosphorylierung auf fast 50 % des Kontrollniveaus wieder her, wobei Betamethason und Dexamethason die geringste Rettung zeigten (9C). Angesichts des attraktiven phänotypischen Profils (Nebenwirkungen und Krankheitswert) von Mometason im Screening und der überlegenen P-Chk2-Rettung in der Modellzelllinie haben wir die Wirkung von Mometason auf die Phosphorylierung von Chk2 in primären Fibroblasten, die von einem Patienten mit A-T stammen, weiter validiert. Auch in diesen Studien wurde ein dosisabhängiger Anstieg der Chk2-Phosphorylierung beobachtet (9D), was darauf hindeutet, dass die Screening-Plattform hochgradig übertragbare Treffer identifizieren und differenzieren kann.
  • Zusammenfassend lässt sich sagen, dass die hier beschriebene Screening-Methode signifikante Klasseneffekte unter den Glukokortikoiden für A-T identifiziert und darüber hinaus die Fähigkeit des besten Moleküls im Screening hervorgehoben hat, einen krankheitsrelevanten Biomarker in von Patienten stammenden Zellen zu retten. Bemerkenswert ist, dass die am wenigsten wirksamen Verbindungen, die auf der Plattform identifiziert wurden, bereits in Studien mit Patienten mit A-T Wirksamkeit gezeigt haben. Diese Ergebnisse unterstreichen den hier beschriebenen Ansatz zur schnellen Entdeckung klinisch relevanter Therapien und ermöglichen eine weitere sensible Differenzierung potenzieller Best-in-Class-Moleküle.
  • Beispiel 2 - Identifizierung von Therapien für spinale Muskelatrophie
  • Spinale Muskelatrophie (SMA) ist eine verheerende genetische Krankheit, die durch fortschreitende Muskelschwäche und Lähmung infolge der Degeneration der unteren motorischen Neuronen im Rückenmark und in den Hirnstammkernen gekennzeichnet ist. Die Krankheit beginnt bereits vor der Geburt und kann bis ins junge Erwachsenenalter andauern. SMA ist eine der häufigsten genetisch bedingten Todesursachen bei Kindern. Die Inzidenz und die Trägerhäufigkeit werden auf 1 zu 10.000 bzw. 1 zu 50 geschätzt.
  • Mutationen im Gen SMN1 (survival motor neuron 1) verursachen SMA. Menschen tragen ein zweites Gen für überlebende Motoneuronen, SMN2, und es ist bekannt, dass eine Erhöhung der Kopienzahl von SMN2 den klinischen Schweregrad der SMA verringert. Eine wichtige therapeutische Strategie konzentriert sich daher auf Wirkstoffe, die die Transkription von SMN2 erhöhen oder die Funktionalität des Genprodukts durch Modulation der Spleißmaschinerie steigern. Die Genprodukte der SMN-Gene scheinen an der Biogenese und Funktion kleiner nukleärer Ribonukleoproteine (snRNP) (Fischer et al. (1997), Liu et al. (1997), Pellizzoni et al. (1998)) und an U2-abhängigen Spleißvorgängen in Motoneuronen beteiligt zu sein (Huo et al. 2014). Derzeit gibt es keine von der FDA zugelassenen kleinen Moleküle für die Behandlung von SMA, und eine Therapie auf der Basis von Antisense-Oligonukleotiden wurde erst kürzlich zugelassen (FDA).
  • Unter den kleinen Molekülen wurden HDAC-Inhibitoren bei spinaler Muskelatrophie ausgiebig untersucht (Übersicht in Mohseni et al. (2013)). Valproinsäure (VPA) war einer der ersten HDAC-Inhibitoren, die bei SMA klinisch vielversprechend waren. Das Medikament erhöht das SMN-Protein in voller Länge in zellbasierten Assays und bei Patienten und zeigte in einigen klinischen Studien eine bescheidene klinische Verbesserung (Darbar et al. (2011), Swoboda et al. (2010) und Piepers et al. (2011)). Studien haben gezeigt, dass viele Wirkstoffe dieser Klasse die Produktion des SMN-Proteins erhöhen, obwohl bisher nur VPA und Phenylbuttersäure (PBA) in klinischen Studien untersucht wurden (Mohseni et al. (2013)). Angesichts des in diesen Studien nachgewiesenen therapeutischen Potenzials bleibt die Identifizierung selektiver, potenter und ZNS-aktiver Wirkstoffe dieser Klasse ein wichtiges Ziel.
  • Die 10A, 10B, 10C und 10D zeigen die De-novo-Identifizierung von Wirkstoffen, die einen hochdimensionalen Phänotyp im Zusammenhang mit SMA-Mangel retten. Diese Figuren veranschaulichen die Ergebnisse von Screens zur Identifizierung von Arzneimittelkandidaten für SMA. 10A zeigt repräsentative Bilder aus einem zellulären Imaging-Assay, wie hier beschrieben, nach Knockdown von SMN1/2 in HUVEC-Zellen. 10B ist ein Diagramm der On-Target- und On-Target-Effekte verschiedener Substanzen, die aufgrund ihrer Fähigkeit, den SMN1/2-Mangelphänotyp zu retten, identifiziert wurden. Gesunde „Vertiefungen, SMN1-siRNA-behandelte „kranke“ Vertiefungen und medikamentenbehandelte kranke Vertiefungen sind in den Gruppen der Rauten 1002, Quadrate 1004 bzw. Kreise 1006 dargestellt. Aus diesem Screening wurden zwei Zielklassen angereichert, darunter HDAC-Inhibitoren, die durch ein repräsentatives Medikament (Pfeil 1007) angezeigt werden. 10C zeigt die Rettung der phänotypischen SMN1/2-Merkmale durch den in 10B identifizierten HDAC-Inhibitor, wobei die relative Fold-Änderung der Genexpression als breitere äußere Kästchen (z. B. Kästchen 1010) und die Wirkung des Inhibitors auf die Fold-Änderung der Expression durch die überlagerten schmaleren inneren Kästchen (z. B. Kästchen 1011) dargestellt sind. In 10C können die Farben und Farbschattierungen der Kästchen 1010 und 1011 verwendet werden, um die Varianz der Merkmalsmessungen zu veranschaulichen. 10D zeigt, dass die HDAC-Inhibitoren den SMNl/2-Mangel durch Erhöhung der Produktion des SMN1/2-Proteins beheben.
  • Ein robuster Phänotyp, der mit SMN1/2-Mangel in HUVEC verbunden ist, wurde identifiziert (10A), und es wurde, wie hier beschrieben, ein Screening auf kleine Moleküle durchgeführt, um Verbindungen zu finden, die diesen Phänotyp retten. Dabei wurden mehrere vielversprechende Treffer erzielt, darunter HDAC-Inhibitoren, eine Wirkstoffklasse, die intensiv für die Behandlung von SMA untersucht wurde. Es wird angenommen, dass die HDAC-Inhibition die Transkription des SMN2-Gens durch anhaltende Acetylierung des SMN2-Promotors direkt erhöht. Zwar konnte kein Wirkstoff den SMA-Phänotyp vollständig heilen, aber zu den wirksamsten Treffern im Modell gehört ein HDAC-Inhibitor im klinischen Stadium (10B), der die fünf zellulären Merkmale, die am stärksten zur Krankheitssignatur beitragen, rettete (10C). Folgestudien haben gezeigt, dass dieser Wirkstoff den SMN1/2-Mangel durch eine erhöhte Produktion des SMN1/2-Proteins, wahrscheinlich durch eine Wirkung auf SMN2, behebt.
  • Zusammenfassend kann gesagt werden, dass signifikante Klasseneffekte zwischen mehreren Zielklassen, einschließlich HDACs, als potenzielle Behandlungsmöglichkeiten für SMA identifiziert wurden. Dieses Ergebnis zeigt, dass die hier beschriebene Screening-Methode in der Lage ist, verschiedene Klassen von therapeutischen Wirkungen zu erkennen und schnell günstige Behandlungen aufzudecken, die direkt auf das Ziel wirken können.
  • Beispiel 3 - Identifizierung von Therapien für Neurofibromatose Typ 2
  • Spinale Muskelatrophie (SMA) ist eine verheerende genetische Krankheit, die durch fortschreitende Muskelschwäche und Lähmung infolge der Degeneration der unteren motorischen Neuronen im Rückenmark und in den Hirnstammkernen gekennzeichnet ist. Die Krankheit beginnt bereits vor der Geburt und kann bis ins junge Erwachsenenalter andauern. SMA ist eine der häufigsten genetisch bedingten Todesursachen bei Kindern. Die Inzidenz und die Trägerhäufigkeit werden auf 1 zu 10.000 bzw. 1 zu 50 geschätzt.
  • Neurofibromatose Typ 2 ist ein autosomal dominantes Krebssyndrom, das durch eine Veranlagung zu wiederkehrenden Tumoren im zentralen Nervensystem gekennzeichnet ist. Am häufigsten entwickeln Patienten mit NF2 bilaterale Schwannome (ein klinisches Merkmal), Meningiome und Ependymome, die zwar gutartig sind, aber zu Hörverlust, Lähmungen und frühem Tod führen können (Martuza et al. 1988). Zwar laufen derzeit Studien zur Erforschung neuer medizinischer Behandlungsmöglichkeiten für NF2, doch beschränkt sich die Standardbehandlung derzeit auf die chirurgische Entfernung oder Radioablation von Tumoren und die unterstützende Behandlung von Symptomen, die durch die Krankheit entstehen. Die Krankheit betrifft schätzungsweise 1 von 25.000 Lebendgeborenen und weist bis zum Alter von 60 Jahren eine nahezu vollständige Penetranz auf (Asthagiri et al. (2009)).
  • NF2 wird durch Funktionsverlust-Mutationen im NF2-Gen verursacht, das für das Tumorsuppressorprotein NF2 kodiert. Zusätzlich zu seiner Rolle bei der Neurofibromatose wurde eine somatische Inaktivierung von NF2 bei 60 % der sporadischen Meningeome nachgewiesen, einem Tumor, der etwa 30 % der intrakraniellen Neoplasien ausmacht (Perry et al. (2004), Ruttledge et al. (1994)). Eine wichtige Herausforderung bei der Entwicklung von Therapien für NF2 ist die Charakterisierung der komplexen biochemischen Wege, über die das Protein seine Funktionen ausübt. Während jüngste Ergebnisse mehrere mutmaßliche Ziele für medizinische Interventionen entlang krankheitsrelevanter Signalwege identifiziert haben, bleibt es eine wichtige Herausforderung für das Feld, das am besten geeignete molekulare Ziel für therapeutische Interventionen zu verstehen (Evans et al. 2009).
  • Um neuartige und wirksame Behandlungen für NF2 zu identifizieren, wird ein Funktionsverlustmodell der Krankheit in primären menschlichen Zellen verwendet und nach Molekülen gesucht, die den krankheitsspezifischen Phänotyp retten. Betrachten wir z. B. eine Ausführungsform, bei der 2000 kleine Moleküle gescreent wurden und die hier beschriebene Screening-Methode 6 Zielklassen mit Rettungsaktivität ergab, einschließlich neuartiger Ziele, die in der Literatur noch nicht beschrieben wurden.
  • Die 11A, 11B und 11C zeigen, dass Inhibitoren von mTOR, VEGF und EGFR/Her2 einen hochdimensionalen Phänotyp retten, der mit NF2-Mangel verbunden ist. Diese Figuren zeigen die Ergebnisse einer Reihe von primären Wirkstoff-Screens zur Identifizierung von Wirkstoffkandidaten für NF2 aus einer Bibliothek von etwa 2000 kleinen Molekülen. Die Diagramme zeigen die Ergebnisse für Kontrollstörungen (größtenteils in Region 1102), Teststörungen (größtenteils in Region 1104) und Abfrage-Störungen (größtenteils in Region 1106). Eine kleine Anzahl von Treffern wurde auf der Grundlage ihrer Auswirkungen im Assay algorithmisch ausgewählt und für weitere Untersuchungen verwendet. Die Verbindungsklassen 1107 (1107-A bis 1107-0 in den 11A-11C) mit bekannter Wirksamkeit sind in den Panels gekennzeichnet, um die Erkennung von phänotypischer Rettung auf der Plattform zu demonstrieren: 11A = mTOR-Inhibitoren (das Sternchen 1108-A kennzeichnet ein alternatives potenzielles Best-in-Class-Molekül); 11B = VEGF-Inhibitoren (der Pfeil 1109 zeigt Sunitinib an, das Sternchen 1108-B kennzeichnet ein alternatives potenzielles Best-in-Class-Molekül); 11C = EGFR/Her2-Inhibitoren (das Sternchen 1108-C kennzeichnet ein potenzielles Best-in-Class-Molekül).
  • Bislang befinden sich drei wichtige Target-Klassen für NF2 in der klinischen Entwicklung: mTOR-Inhibitoren, VEGF-Inhibitoren und EGFR/Her2-Inhibitoren. Der Verlust von NF2 führt zu einer konstitutiven Aktivierung des mTOR-Komplexes 1 (mTORC1), weshalb der mTORC1-Inhibitor Everolimus auf seine klinische Wirksamkeit bei dieser Krankheit untersucht wurde. Während in einer Phase-2-Studie mit Everolimus keine Wirksamkeit nachgewiesen werden konnte (Allen et al. (2014)), wird derzeit eine Phase-2-Studie mit dem neuartigen, hochselektiven mTOR-Inhibitor AZD2014 durchgeführt (NCT02831257). Bei den hier beschriebenen Screening-Methoden zeigte Everolimus nur eine minimale Wirksamkeit und wurde nicht in sekundäre Screens aufgenommen. AZD2014 zeigte jedoch eine starke Rettung, wenn auch mit einem erhöhten Nebenwirkungsprofil im Vergleich zu einem anderen hochselektiven mTOR-Inhibitor (11A, Sternchen).
  • Die Blockade des vaskulären endothelialen Wachstumsfaktors (VEGF) wurde ebenfalls als therapeutischer Ansatz für NF2 untersucht. Der VEGF-Rezeptor-Tyrosinkinase-Inhibitor Sunitinib hat kürzlich in einer Phase-2-Studie bei rezidivierenden, refraktären Meningeomen, einschließlich Patienten mit NF2-Loss-of-Function-Mutationen, Wirkung gezeigt (Omuro et al. (2015)). Ein zweiter VEGF-Inhibitor, Axitinib, befindet sich derzeit in Phase 2 für NF2 (NCT02129647). In dem hier beschriebenen primären Screening zeigte Axitinib keine ausreichende Wirksamkeit, um in Folgetests aufgenommen zu werden. Sunitinib zeigte jedoch eine moderate Rettung von NF2-Phänotypen mit Funktionsverlust bei minimalem Anstieg des Nebenwirkungsprofils (11B, Pfeilspitze). Wie bei den mTOR-Inhibitoren konnte mit den hier beschriebenen Screening-Methoden ein Wirkstoff mit einem auffälligeren Wirksamkeitsprofil identifiziert werden, der eine vollständige Rettung des Krankheitsphänotyps mit minimalen Nebenwirkungen bewirkte (11B, Sternchen 1108-B).
  • Die Rolle des endothelialen Wachstumsfaktors (EGFR) und der Her2/ErbB2-Signalübertragung bei NF2 ist in der Literatur gut dokumentiert, und die Blockade dieses Signalwegs mit EGFR/Her2-Inhibitoren verringert die Proliferation von NF2-defizienten Gliazellen (Houshmandi et al. (2009)). Vor kurzem wurde eine Phase-2-Studie mit dem EGFR/ErbB2-Inhibitor Lapatinib bei Patienten mit NF2 durchgeführt. Die Studie ergab, dass Lapatinib gut vertragen wurde und bei einer Untergruppe von Patienten mit NF2 eine antitumorale Wirkung zeigte (Allen et al. 2012). Während Lapatinib in den hier beschriebenen primären Screens nicht spezifisch untersucht wurde, konnten mehrere EGFR/ErbB2-Inhibitoren die NF2-Phänotypen mit Funktionsverlust retten, wobei ein Medikament dieser Klasse eine robuste Rettung bewirkte (11C), was ein weiterer Beweis dafür ist, dass die hier beschriebene Screening-Methode schnell und empfindlich klinisch relevante Medikamentenklassen identifizieren kann.
  • Beispiel 4 - Identifizierung von Therapien für hereditäre hämorrhagische Telangiektasie
  • Die hereditäre hämorrhagische Teleangiektasie (HHT) ist eine autosomaldominante Erbkrankheit, die durch wiederkehrende Epistaxis (Nasenbluten) und ein erhöhtes Auftreten von arteriovenösen Malformationen (AVM) gekennzeichnet ist. Die Krankheit verursacht eine abnorme Bildung von Blutgefäßen in der Haut, den Schleimhäuten und häufig auch in Organen wie Lunge, Leber und Gehirn. Normalerweise verbinden die Kapillaren Hochdruckarterien mit Niederdruckvenen. Bei HHT führt die Fehlbildung in den Kapillarbetten jedoch zu einer direkten Verbindung zwischen den Hochdruckarterien und den schwachen Venen, was zum Platzen der Venen und damit zu inneren Blutungen führen kann.
  • Die 12A, 12B, 12C, 12D und 12E zeigen die Ergebnisse von Screens von VEGFR-Inhibitoren zur Identifizierung von Arzneimittelkandidaten für die Behandlung von HHT unter Verwendung eines ACVRL1-Knockdown-Modells. 12A zeigt Zellen im Testzustand (1220) im Vergleich zum Kontrollzustand (1230) und die Abfrage von Störungen 1240, 1250 und 1260, die zunehmende Mengen eines Inh-1-Wirkstoffkandidaten enthalten (untere Felder, von links nach rechts). 12B zeigt die On-Target- und Off-Target-Modellkurven für eine Reihe von Inh-1-Konzentrationen. 12C zeigt die mittleren On-Target- und Off-Target-Modellkurven für VEGFR-Inhibitoren, die im Screening wirksam waren (oberes Feld) und VEGFR-Inhibitoren, die im Screening unwirksam waren (unteres Feld). 12D zeigt den prozentualen Anteil der gesamten Kinasen, die von VEGFR-Inhibitoren betroffen waren, die im Screening unwirksam waren (links drei) und die im Screening wirksam waren (rechts vier). 12E schließlich zeigt die Verringerung von Blutungen, die durch die Verabreichung von Inh-1 an ACVRL1-GI blutende Mäusemodelle verursacht werden.
  • Eine Strategie, die für die Behandlung von HHT untersucht wird, ist die Verabreichung von anti-angiogenen Wirkstoffen, wie z. B. Tyrosinkinase-Inhibitoren des vaskulären endothelialen Wachstumsfaktorrezeptors (VEGFR). Um neuartige und wirksame Behandlungsmethoden für HHT zu identifizieren, wurde ein Modell der Krankheit, das auf dem Knock-down der ACVRL1-Translation basiert, mit den hier beschriebenen bildbasierten Methoden auf VEGFR-Inhibitoren untersucht, die den krankheitsspezifischen Phänotyp in der Zellkultur retten. Wie in 12A zu sehen ist, verursacht das ACVRL1 -Knockdown-Modell einen länglichen zellulären Phänotyp (oberes linkes Feld), verglichen mit dem runden Zellphänotyp der gesunden Kontrollzellen (oberes rechtes Feld). Erhöhte Konzentrationen von Inh-1 (untere Felder, von links nach rechts ansteigend) retten den länglichen Krankheitsphänotyp.
  • Die On-Target- und Off-Target-Werte für Inh-1 wurden dann über eine 1×106fache Titration des Medikaments bestimmt und wie hier beschrieben berechnet. Wie in 12B gezeigt, gibt es ein 100-faches therapeutisches Fenster, bei dem Inh-1 den Krankheitsphänotyp in den zellulären Assays rettet (dargestellt durch Kurve 1202), ohne wesentliche Off-Target-Effekte zu verursachen (dargestellt durch Kurve 1204). Wie in 12C gezeigt, ist die Fähigkeit von Inh-1, den ACVRLl-Knockdown-Phänotyp zu retten, nicht einfach ein VEGFR-Inhibitor-Effekt, da nur eine Untergruppe von VEFR-Inhibitoren in diesem Modell aktiv ist. Konkret wurden On-Target- (1212 und 1216) und Off-Target-Effekte (1214 und 1218) für verschiedene VEGFR-Inhibitoren in einem 5×104-fachen Konzentrationsbereich bestimmt. Das obere Feld in 12C zeigt die Medianwerte für VEGFR-Inhibitoren, die im Modell aktiv waren, während das untere Feld die Medianwerte für VEGFR-Inhibitoren zeigt, die im Modell inaktiv waren. Weitere Experimente, wie in 12D gezeigt, ergaben, dass Polyphamakologie notwendig sein könnte, um den ACVRL1-Knockdown-Phänotyp zu retten, da die VEGFR-Inhibitoren, die in dem Modell aktiv waren, mehrere Kinasen mit einer IC50 < 1 µM hemmten. Im Gegensatz dazu hemmten die VEGFR-Inhibitoren, die im Modell inaktiv waren, deutlich weniger Kinase-Inhibitoren. Die Ergebnisse für Inh-1 sind durch den gestrichelten Kasten gekennzeichnet.
  • Die In-vivo-Wirkung von Inh-1 wurde durch Verabreichung des Wirkstoffs an ein ACVRL1-GI-Blutungsmausmodell getestet. Wie in 12E dargestellt, zeigt die Sektion und Visualisierung von GI-Gewebe in diesen Mäusen eine statistisch signifikante Verringerung der Blutungen (p < 0,0001 (oberes Diagramm); p < 0,001 (unteres Diagramm)) bei den mit Inh-1 behandelten Tieren im Vergleich zu den mit DMSO behandelten Kontrollmäusen.
  • Kurze Beschreibungen verschiedener Aspekte und Ausführungsformen
  • Einige der hier beschriebenen Aspekte und Ausführungsformen sind in der folgenden, nicht abschließenden Kurzbeschreibung verschiedener Aspekte und Ausführungsformen zusammengefasst:
    1. 1. Ein Computersystem zur Auswertung einer Abfrage-Störung in einem zellbasierten Assay, der einen Testzustand darstellt, wobei:
      • der zellbasierte Test umfasst eine Vielzahl von Vertiefungen in einer oder mehreren Platten, wobei das Computersystem Folgendes umfasst:
        • einen oder mehrere Prozessoren;
        • einen Speicher; und
        • ein oder mehrere Programme, wobei das eine oder die mehreren Programme in dem Speicher gespeichert sind und so konfiguriert sind, dass sie von dem einen oder den mehreren Prozessoren ausgeführt werden, wobei das eine oder die mehreren Programme Anweisungen enthalten, um:
          • (A) Erhalten eines entsprechenden Kontrolldatenpunkts für jede jeweilige Kontrollstörung in einem Satz von Kontrollstörungen, wodurch eine Vielzahl von Kontrolldatenpunkten erhalten wird, wobei jeder entsprechende Kontrolldatenpunkt eine Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz eines anderen Merkmals in einer Vielzahl von Merkmalen darstellt, das über eine entsprechende Vielzahl von Kontrollaliquoten von Zellen in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen bestimmt wird, die die jeweilige Kontrollstörung darstellen;
          • B) Erhalten eines entsprechenden Testdatenpunkts für jede jeweilige Teststörung in einem Satz von einer oder mehreren Teststörungen, wodurch eine Vielzahl von Testdatenpunkten erhalten wird, wobei jeder entsprechende Testdatenpunkt die Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen eine Messung der zentralen Tendenz eines anderen Merkmals in der Vielzahl von Merkmalen umfasst, die über eine entsprechende Vielzahl von Testaliquoten der Zellen bestimmt wird, die die jeweilige Teststörung in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen darstellen;
          • (C) Berechnen eines zusammengesetzten Testvektors, wobei der zusammengesetzte Testvektor zwischen (i) einem ersten Punkt, der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Kontrolldatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, und (ii) einem zweiten Punkt, der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Testdatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, liegt;
          • (D) Erhalten einer Vielzahl von Abfragestörungsdatenpunkten, wobei jeder entsprechende Abfragestörungsdatenpunkt die Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz eines anderen Merkmals in der Vielzahl von Merkmalen umfasst, das über eine Vielzahl von Instanzen von Abfragestörungsaliquots der Zellen bestimmt wird, die eine jeweilige Teststörung in der Vielzahl von Teststörungen und eine erste Menge der Abfragestörung in einer entsprechenden Teilmenge der Vielzahl von Vertiefungen darstellen;
          • (E) Berechnen eines Abfrage-Störungsvektors zwischen (i) dem ersten Punkt und (ii) einem jeweiligen Maß der zentralen Tendenz über die Vielzahl von AbfrageStörungsdatenpunkten für jede Dimension in der Vielzahl von Dimensionen;
          • (F) Berechnung eines On-Target-Werts für die Abfrage-Störung als Projektion des Abfrage-Störungsvektors auf den zusammengesetzten Testvektor;
          • (G) Berechnen eines Off-Target-Werts für die Abfrage-Störung als Ablehnung des Abfrage-Störungsvektors gegenüber dem zusammengesetzten Testvektor; und
          • (H) Bewertung des Off-Target-Werts für die Abfrage-Störung und damit Bewertung der Abfrage-Störung.
    2. 2. Das Computersystem von Ausführungsform 1, wobei das eine oder die mehreren Programme ferner Anweisungen zum Wiederholen des Erhaltens (D), Berechnens (E), Berechnens (F), und Berechnen (G) für jede Abfragestörung in einer Vielzahl von Abfragestörungen enthalten, und wobei das Auswerten (H) das Auftragen jeder jeweiligen Abfragestörung in der Vielzahl von Abfragestörungen auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für die jeweilige Abfragestörung als eine Koordinate in einer ersten Dimension des zweidimensionalen Diagramms und des Off-Target-Werts für die jeweilige Abfragestörung als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms umfasst.
    3. 3. Das Computersystem nach Ausführungsform 2, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten für:
      • Berechnen eines entsprechenden Kontrollvektors zwischen (i) dem ersten Punkt und (ii) einem zweiten Punkt, der durch ein Maß der zentralen Tendenz über die Kontrolldatenpunkte, die mit der jeweiligen Kontrollstörung verbunden sind, für jede Dimension in der Vielzahl von Dimensionen definiert ist, für jede jeweilige Kontrollstörung in der Vielzahl von Kontrollstörungen, wodurch eine Vielzahl von Kontrollvektoren berechnet wird; und
      • Berechnen eines On-Target-Werts für jede Kontrollstörung als Projektion des entsprechenden Kontrollvektors aus der Vielzahl der Kontrollvektoren auf den zusammengesetzten Testvektor;
      • Berechnen eines Off-Target-Werts für jede Kontrollstörung als Ablehnung des entsprechenden Kontrollvektors gegenüber dem zusammengesetzten Testvektor; und wobei das Auswerten (H) ferner das Auftragen jeder Kontrollstörung in der Vielzahl von Kontrollstörungen auf dem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für die jeweilige Kontrollstörung als eine Koordinate in der ersten Dimension und des Off-Target-Werts für die jeweilige Kontrollstörung als eine Koordinate in der zweiten Dimension des zweidimensionalen Diagramms umfasst.
    4. 4. Das Computersystem nach Ausführungsform 2, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten für:
      • Berechnen eines entsprechenden Kontrollvektors zwischen (i) dem ersten Punkt für jede Dimension in der Vielzahl von Dimensionen und (ii) einem zweiten Punkt, der durch einen Wert des entsprechenden Merkmals in der Vielzahl von Merkmalen definiert ist, der aus der jeweiligen Vertiefung bestimmt wurde, für jede entsprechende Vertiefung in der Vielzahl von Vertiefungen, die eine Kontrollstörung in der Vielzahl von Kontrollstörungen darstellt, wodurch eine Vielzahl von Kontrollvektoren berechnet wird; und
      • (F)(1) Berechnen eines On-Target-Werts für jeden entsprechenden Kontrollvektor in der Vielzahl der Kontrollvektoren als Projektion des entsprechenden Kontrollvektors auf den zusammengesetzten Testvektor;
      • (G)(1) Berechnen eines Off-Target-Werts für jeden jeweiligen Kontrollvektor in der Vielzahl von Kontrollvektoren als eine Ablehnung des jeweiligen Kontrollvektors gegenüber dem zusammengesetzten Testvektor; und wobei die Auswertung (H) ferner das Auftragen jedes jeweiligen Kontrollvektors in der Vielzahl von Kontrollvektoren auf dem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für den jeweiligen Kontrollvektor als eine Koordinate in der ersten Dimension und des Off-Target-Werts für den jeweiligen Kontrollvektor als eine Koordinate in der zweiten Dimension des zweidimensionalen Diagramms umfasst.
    5. 5. Das Computersystem nach einer der Ausführungsformen 2 bis 4, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten, um:
      • Berechnen, für jede jeweilige Teststörung in der Vielzahl von Teststörungen, eines entsprechenden Testvektors zwischen (i) dem ersten Punkt für jede Dimension in der Vielzahl von Dimensionen und (ii) einem zweiten Punkt, der durch ein Maß der zentralen Tendenz über die Testdatenpunkte definiert ist, die mit der jeweiligen Teststörung verbunden sind, wodurch eine Vielzahl von Testvektoren berechnet wird;
      • Berechnen eines On-Target-Werts für jede Teststörung als Projektion des entsprechenden Testvektors in der Vielzahl von Testvektoren auf den zusammengesetzten Testvektor; und
      • Berechnen einer Off-Target-Werts für jede Teststörung als Ablehnung des entsprechenden Testvektors gegenüber dem zusammengesetzten Testvektor; und wobei das Auswerten (H) ferner das Auftragen jeder Teststörung in der Vielzahl von Teststörungen auf dem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für die jeweilige Teststörung als eine Koordinate in der ersten Dimension und des Off-Target-Werts für die jeweilige Teststörung als eine Koordinate in der zweiten Dimension des zweidimensionalen Diagramms umfasst.
    6. 6. Das Computersystem nach einer der Ausführungsformen 2 bis 4, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten, um:
      • Berechnen eines entsprechenden Testvektors zwischen (i) dem ersten Punkt für jede Dimension in der Vielzahl von Dimensionen und (ii) einem zweiten Punkt, der durch eine Messung des entsprechenden Merkmals in der Vielzahl von Merkmalen in der jeweiligen Vertiefung definiert ist, für jede entsprechende Vertiefung in der Vielzahl von Vertiefungen, die eine Teststörung in der Vielzahl von Teststörungen darstellt, wodurch eine Vielzahl von Testvektoren berechnet wird, und
      • (F)(2) Berechnen eines On-Target-Werts für jeden entsprechenden Testvektor in der Vielzahl der Testvektoren als Projektion des entsprechenden Testvektors auf den zusammengesetzten Testvektor;
      • G)(2) Berechnen Off-Target-Werts für jeden jeweiligen Testvektor in der Vielzahl von Testvektoren als eine Ablehnung des jeweiligen Testvektors gegenüber dem zusammengesetzten Testvektor; und wobei das Auswerten (H) ferner das Auftragen jedes jeweiligen Testvektors in der Vielzahl von Testvektoren auf dem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für den jeweiligen Testvektor als eine Koordinate in der ersten Dimension und des Off-Target-Werts für den Testvektor als eine Koordinate in der zweiten Dimension des zweidimensionalen Diagramms umfasst.
    7. 7. Das Computersystem nach Ausführungsform 5 oder 6, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten für:
      • Einfärben des Plots jedes einzelnen Testvektors aus der Vielzahl der Testvektoren in der zweidimensionalen Darstellung mit einer ersten Farbe;
      • Einfärben des Plots jedes jeweiligen Kontrollvektors in der Vielzahl von Kontrollvektoren in dem zweidimensionalen Plot mit einer zweiten Farbe; und
      • Einfärben des Plots jeder Abfragestörung in der Vielzahl von Abfragestörungen in der zweidimensionalen Darstellung mit einer dritten Farbe.
    8. 8. Das Computersystem der Ausführungsform 5, wobei das eine oder die mehreren Programme ferner Anweisungen zur Größenbestimmung des Plots jedes jeweiligen Testvektors in der Vielzahl von Testvektoren in dem zweidimensionalen Diagramms als Funktion einer Varianz des Maßes der zentralen Tendenz des zweiten Punktes, der zur Konstruktion des jeweiligen Testvektors verwendet wird, enthalten.
    9. 9. Das Computersystem der Ausführungsform 3, wobei das eine oder die mehreren Programme ferner Anweisungen zur Größenbestimmung des Plots jedes jeweiligen Kontrollvektors in der Vielzahl von Kontrollvektoren in dem zweidimensionalen Diagramms als Funktion einer Varianz des Maßes der zentralen Tendenz des zweiten Punktes, der zur Konstruktion des jeweiligen Kontrollvektors verwendet wird, enthalten.
    10. 10. Das Computersystem nach einer der Ausführungsformen 2-9, wobei das eine oder die mehreren Programme ferner Anweisungen zur Größenbestimmung des Plots jeder jeweiligen Abfragestörung in der Vielzahl von Abfragestörungen in dem zweidimensionalen Diagramm als Funktion einer Varianz des jeweiligen Maßes der zentralen Tendenz der Vielzahl von Abfragestörungsdatenpunkten für jede Dimension in der Vielzahl von Dimensionen für die jeweilige Abfragestörung enthalten.
    11. 11. Das Computersystem nach einer der Ausführungsformen 1-10, wobei der Satz von Kontrollstörungen aus einer Vielzahl von Kontroll-siRNA besteht, die die Expression eines mit dem Testzustand verbundenen Gens nicht direkt beeinflussen.
    12. 12. Das Computersystem der Ausführungsform 11, wobei die Vielzahl von Kontroll-siRNA aus zwischen 10 und 50 verschiedenen Kontroll-siRNA besteht.
    13. 13. Das Computersystem nach einer der Ausführungsformen 1-12, wobei der Satz von Teststörungen aus einer Vielzahl von Ziel-siRNA besteht, die direkt die Expression eines mit dem Testzustand verbundenen Gens beeinflussen.
    14. 14. Das Computersystem nach Ausführungsform 13, wobei die Vielzahl von Ziel-siRNA aus zwischen 4 und 12 verschiedenen Ziel-siRNA besteht.
    15. 15. Das Computersystem nach einer der Ausführungsformen 1-14, wobei das Maß der zentralen Tendenz des unterschiedlichen Merkmals, das über die entsprechende Vielzahl von Kontrollaliquots der Zellen, die die jeweilige Kontrollstörung darstellen, bestimmt wird, ein arithmetisches Mittel, ein gewichtetes Mittel, ein mittlerer Bereich, ein Midhinge, ein Trimean, ein geometrisches Mittel, ein geometrischer Median, ein winsorisiertes Mittel, ein Median oder ein Modus des unterschiedlichen Merkmals über zwei bis zwanzig Kontrollaliquots der Zellen, die die jeweilige Kontrollstörung darstellen, in zwei bis zwanzig entsprechenden Vertiefungen der Vielzahl von Vertiefungen ist.
    16. 16. Das Computersystem nach einer der Ausführungsformen 1-15, wobei das Maß der zentralen Tendenz des unterschiedlichen Merkmals über die entsprechende Vielzahl von Testaliquots der Zellen, die die jeweilige Teststörung darstellen, ein arithmetisches Mittel, ein gewichtetes Mittel, ein mittlerer Bereich, ein Midhinge, ein Trimean, ein geometrisches Mittel, ein geometrischer Median, ein winsorisiertes Mittel, ein Median oder ein Modus des unterschiedlichen Merkmals über zwei bis zwanzig Testaliquots der Zellen bei der Exposition ist, die die jeweilige Teststörung in zwei bis zwanzig entsprechenden Vertiefungen in der Vielzahl von Vertiefungen darstellen.
    17. 17. Das Computersystem nach einer der Ausführungsformen 1-16, wobei das Maß der zentralen Tendenz des unterschiedlichen Merkmals über die entsprechende Vielzahl von Abfragestörungsaliquots der Zellen, die gemeinsam die jeweilige Teststörung und die Abfragestörung repräsentieren, ein arithmetisches Mittel, ein gewichtetes Mittel, ein mittlerer Bereich, ein Midhinge, Trimean, geometrisches Mittel, geometrischer Median, winsorisiertes Mittel, Median oder Modus des unterschiedlichen Merkmals über zwei bis zwanzig Abfrage-Störungsaliquots der Zellen, die gemeinsam die jeweilige Teststörung und die Abfrage-Störung in zwei bis zwanzig entsprechenden Vertiefungen in der Vielzahl von Vertiefungen darstellen.
    18. 18. Das Computersystem nach einer der Ausführungsformen 1-17, wobei jedes Merkmal aus einer Kombination von messbaren Eigenschaften abgeleitet wird, die aus einer Farbe, einer Textur und einer Größe des Zellkontexts oder eines aufgezählten Teils des Zellkontexts ausgewählt werden.
    19. 19. Das Computersystem nach einer der Ausführungsformen 1-18, wobei das Erhalten (A) das Abbilden einer entsprechenden Vertiefung in der Vielzahl von Vertiefungen umfasst, um ein entsprechendes zweidimensionales gepixeltes Bild mit einer entsprechenden Vielzahl von nativen Pixelwerten zu bilden, und wobei ein anderes Merkmal in der Vielzahl von Merkmalen des Erhaltens (A) als Ergebnis einer Faltung oder einer Reihe von Faltungen und Pooling-Operatoren entsteht, die gegen native Pixelwerte in der entsprechenden Vielzahl von nativen Pixelwerten des entsprechenden zweidimensionalen gepixelten Bildes ausgeführt werden.
    20. 20. Das Computersystem nach einer der Ausführungsformen 1-19, wobei die jeweilige Vielzahl von Kontrollaliquots der Zellen der jeweiligen Kontrollstörung mindestens eine Stunde lang ausgesetzt wird, bevor die Messung von Merkmalen erhalten wird, die zur Ableitung jedes Merkmals in der Vielzahl von Merkmalen über die Vielzahl von Kontrollaliquots verwendet werden.
    21. 21. Das Computersystem nach einer der Ausführungsformen 1-20, wobei die Vielzahl von Testaliquoten der Zellen der jeweiligen Teststörung oder mindestens eine Stunde, zwei Stunden, drei Stunden, einen Tag, zwei Tage, drei Tage, vier Tage oder fünf Tage ausgesetzt wird, bevor die Messung von Merkmalen erhalten wird, die zur Ableitung jedes Merkmals in der Vielzahl von Merkmalen über die Vielzahl von Testaliquoten verwendet werden.
    22. 22. Das Computersystem nach einer der Ausführungsformen 1 bis 21, wobei die mehreren Abfrage-Störungs-Aliquots der Zellen der jeweiligen Teststörung und der Abfrage-Störung mindestens eine Stunde, zwei Stunden, drei Stunden, einen Tag, zwei Tage, drei Tage, vier Tage oder fünf Tage lang ausgesetzt werden, bevor die Messung von Merkmalen erhalten wird, die zur Ableitung jedes Merkmals aus den mehreren Merkmalen über die mehreren Abfrage-Störungs-Aliquots verwendet werden.
    23. 23. Das Computersystem nach einer der Ausführungsformen 1-22, wobei die Vielzahl der Dimensionen zwischen 5 Dimensionen und 100.000 Dimensionen liegt.
    24. 24. Das Computersystem nach einer der Ausführungsformen 1-23, wobei:
      • die Vielzahl von Merkmalen umfasst eine Vielzahl von Dimensionsreduktionskomponenten; und
      • jede Dimensionsreduktionskomponente in der Vielzahl der Dimensionsreduktionskomponenten ist eine durch Hauptkomponentenanalyse abgeleitete Hauptkomponente.
    25. 25. Das Computersystem nach einer der Ausführungsformen 1 bis 24, wobei jedes Merkmal in der Vielzahl der Merkmale anhand eines optisch gemessenen Merkmals bestimmt wird.
    26. 26. Das Computersystem nach einer der Ausführungsformen 1-25, wobei eine erste Teilmenge der Vielzahl von Merkmalen aus optisch gemessenen Merkmalen bestimmt wird; und eine zweite Teilmenge der Vielzahl von Merkmalen aus nicht optisch gemessenen Merkmalen bestimmt wird.
    27. 27. Das Computersystem nach einer der Ausführungsformen 1 bis 24, wobei jedes Merkmal in der Vielzahl von Merkmalen ein Merkmal ist, das aus einem Merkmal bestimmt wird, das nicht optisch gemessen wird.
    28. 28. Das Computersystem der Ausführungsform 1, wobei:
      • die entsprechende Vielzahl von Kontrollaliquots der Zellen der Gewinnung (A) aus Zellen eines einzelnen Zelltyps besteht,
      • die entsprechende Vielzahl von Testaliquots der Zellen der Gewinnung (B) aus Zellen des einzelnen Zelltyps besteht, und
      • die Vielzahl von Instanzen von Abfrage-Störungs-Aliquots der Zellen, die gemeinsam die jeweilige Test-Störung und die Abfrage-Störung der Gewinnung (D) darstellen, aus Zellen des einzelnen Zelltyps besteht.
    29. 29. Das Computersystem der Ausführungsformen 2-27, wobei:
      • die entsprechende Vielzahl von Kontrollaliquots der Zellen jedes Falles der Gewinnung (A) aus Zellen eines einzelnen Zelltyps besteht,
      • die entsprechende Vielzahl von Testaliquots der Zellen jedes Falles der Gewinnung (B) aus Zellen des einzelnen Zelltyps besteht, und
      • die mehreren Instanzen von Abfrage-Störungs-Aliquots der Zellen gemeinsam die jeweilige Test-Störung darstellen und die Abfrage-Störung jeder Instanz des Erhaltens (D) aus Zellen des einzelnen Zelltyps besteht.
    30. 30. Das Computersystem nach einer der Ausführungsformen 1-29, wobei das Ermitteln (D), Berechnen (E), Berechnen (F) und Berechnen (G) für jeden Zelltyp in einer Vielzahl von Zelltypen wiederholt wird.
    31. 31. Das Computersystem der Ausführungsform 30, wobei die Vielzahl der Zelltypen drei Zelltypen umfasst.
    32. 32. Das Computersystem von Ausführungsform 30, wobei die Vielzahl von Zelltypen einen ersten Zelltyp und einen zweiten Zelltyp umfasst, der der erste Zelltyp ist, nachdem er eine genetische Veränderung erfahren hat.
    33. 33. Das Computersystem nach Ausführungsform 32, wobei die genetische Veränderung mindestens eine genetische Deletion oder Insertion umfasst.
    34. 34. Das Computersystem nach einer der Ausführungsformen 1-33, wobei die entsprechenden Vertiefungen in der Vielzahl von Vertiefungen für die Vielzahl von Kontrollaliquots der Zellen des Erhaltens (A) eine erste Vielzahl von Vertiefungen umfasst, wobei jede Vertiefung in der ersten Vielzahl von Vertiefungen ein Aliquot eines anderen Zelltyps in einer entsprechenden Vielzahl von Zelltypen umfasst, die entsprechenden Vertiefungen in der Vielzahl von Vertiefungen für die Vielzahl von Testaliquots der Zellen der Gewinnung (B) eine zweite Vielzahl von Vertiefungen umfasst, wobei jede Vertiefung in der zweiten Vielzahl von Vertiefungen ein Aliquot eines anderen Zelltyps in der entsprechenden Vielzahl von Zelltypen umfasst, und die entsprechenden Vertiefungen in der Vielzahl von Vertiefungen für die Vielzahl von Abfrage-Störungs-Aliquots der Zellen des Erhaltens (D) eine dritte Vielzahl von Vertiefungen umfasst, wobei jede Vertiefung in der dritten Vielzahl von Vertiefungen ein Aliquot eines anderen Zelltyps in der entsprechenden Vielzahl von Zelltypen umfasst.
    35. 35. Das Computersystem der Ausführungsform 34, wobei die Vielzahl der Zelltypen drei Zelltypen umfasst.
    36. 36. Das Computersystem nach einer der Ausführungsformen 2-33, wobei die entsprechenden Vertiefungen in der Vielzahl von Vertiefungen für die Vielzahl von Kontrollaliquots der Zellen in jedem Fall der Gewinnung (A) eine entsprechende erste Vielzahl von Vertiefungen umfassen, wobei jede Vertiefung in der entsprechenden ersten Vielzahl von Vertiefungen ein Aliquot eines anderen Zelltyps in einer entsprechenden Vielzahl von Zelltypen umfasst, die entsprechenden Vertiefungen in der Vielzahl von Vertiefungen für die Vielzahl von Testaliquoten der Zellen jedes Falles der Gewinnung (B) eine entsprechende zweite Vielzahl von Vertiefungen umfasst, wobei jede Vertiefung in der entsprechenden zweiten Vielzahl von Vertiefungen ein Aliquot eines anderen Zelltyps in der entsprechenden Vielzahl von Zelltypen umfasst, und die entsprechenden Vertiefungen in der Vielzahl von Vertiefungen für die Vielzahl von Abfrage-Störungs-Aliquots der Zellen jedes Falles des Erhaltens (D) eine entsprechende dritte Vielzahl von Vertiefungen umfasst, wobei jede Vertiefung in der entsprechenden dritten Vielzahl von Vertiefungen ein Aliquot eines anderen Zelltyps in der entsprechenden Vielzahl von Zelltypen umfasst.
    37. 37. Das Computersystem der Ausführungsform 36, wobei die Vielzahl der Zelltypen drei Zelltypen umfasst.
    38. 38. Das Computersystem nach einer der Ausführungsformen 1-37, wobei:
      • die Vielzahl von Merkmalen umfasst eine Vielzahl von Dimensionsreduktionskomponenten; und
      • jede Dimensionsreduktionskomponente in der Vielzahl der Dimensionsreduktionskomponenten wird durch ein Teilmengenauswahlverfahren oder ein diskretes Verfahren abgeleitet.
    39. 39. Das Computersystem nach einer der Ausführungsformen 1 bis 38, wobei eine Kontrollstörung in dem Satz von Kontrollstörungen eine vorbestimmte naive Zelllinie, eine Zelllinie, die einer nicht wirkenden siRNA ausgesetzt ist, eine Zelllinie, der ein modifizierendes Mittel zugesetzt wurde, um sicherzustellen, dass sie sich in einem vorbestimmten Zustand befindet, oder Zellen, die vor dem Ausplattieren unter Verwendung einer Sortiertechnologie auf einen oder mehrere vorbestimmte Biomarker gefiltert wurden, ist.
    40. 40. Das Computersystem nach einer der Ausführungsformen 1-39, wobei der Satz von Kontrollstörungen zehn Kontrollstörungen umfasst.
    41. 41. Das Computersystem nach einer der Ausführungsformen 1-40, wobei der Satz von Teststörungen zehn Teststörungen umfasst.
    42. 42. Das Computersystem nach einer der Ausführungsformen 1-41, wobei der Satz von Kontrollstörungen ein Toxin, ein CRISPR-Reagenz, ein Signalmolekül, ein Zytokin, ein vorbestimmtes Medikament, eine siRNA, eine sgRNA, eine Zellkulturbedingung oder eine genetische Veränderung umfasst.
    43. 43. Das Computersystem nach Ausführungsform 42, wobei der Satz Teststörungen ein Toxin, ein CRISPR-Reagenz, ein Signalmolekül, ein Zytokin, ein vorbestimmtes Medikament, eine siRNA, eine sgRNA, eine Zellkulturbedingung oder eine genetische Modifikation, die sich von einer Kontrollstörung unterscheidet, umfasst.
    44. 44. Das Computersystem nach einer der Ausführungsformen 1-43, wobei die entsprechende Vielzahl von Abfrage-Störungsaliquots der Zellen gemeinsam der jeweiligen Teststörung und der Abfrage-Störung für mindestens eine Stunde, zwei Stunden, drei Stunden, einen Tag, zwei Tage, drei Tage, vier Tage oder fünf Tage vor dem Erhalt der Messung der Vielzahl von Merkmalen beim Erhalt (D) ausgesetzt wird.
    45. 45. Das Computersystem nach einer der Ausführungsformen 1-44, wobei das eine oder die mehreren Programme ferner Anweisungen zum Wiederholen des Erhaltens (D), Berechnens (E), Berechnens (F) und Berechnens (G) für jede jeweilige Menge der Abfragestörung in einer Vielzahl von jeweiligen Mengen der Abfragestörung enthalten, wobei jede jeweilige Menge der Abfragestörung in der Vielzahl von jeweiligen Mengen der Abfragestörung als eine entsprechende Konzentration der Abfragestörung in der entsprechenden Teilmenge der Vielzahl von Vertiefungen ausgedrückt wird, wodurch ein On-Target-Wert und ein Off-Target-Wert bei jeder Konzentration in einer Vielzahl von Konzentrationen für die Abfrage-Störung erhalten wird, und wobei die Auswertung (H) das Auftragen der Abfrage-Störung bei jeder jeweiligen Konzentration in der Vielzahl von Konzentrationen auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für die Abfrage-Störung bei der jeweiligen Konzentration als eine Koordinate in einer ersten Dimension des zweidimensionalen Diagramms und des Off-Target-Werts für die Abfrage-Störung bei der jeweiligen Konzentration als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms umfasst.
    46. 46. Das Computersystem nach einer der Ausführungsformen 1-44, wobei das eine oder die mehreren Programme ferner Anweisungen zum Wiederholen des Erhaltens (D), Berechnens (E), Berechnens (F) und Berechnens (G) für jede jeweilige Menge der Abfragestörung in einer Vielzahl von jeweiligen Mengen der Abfragestörung enthalten, wobei:
      • jede jeweilige Menge der Abfrage-Störung in der Vielzahl der jeweiligen Mengen der Abfrage-Störung als eine entsprechende Konzentration der Abfrage-Störung in der entsprechenden Teilmenge der Vielzahl von Vertiefungen ausgedrückt wird, wodurch ein On-Target-Wert und ein Off-Target-Wert bei jeder Konzentration in einer Vielzahl von Konzentrationen für die Abfrage-Störung erhalten wird,
      • das Auswerten (H) das Auftragen der Abfrage-Störung bei jeder jeweiligen Konzentration in der Vielzahl von Konzentrationen auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für die Abfrage-Störung bei der jeweiligen Konzentration als eine Koordinate in einer ersten Dimension des zweidimensionalen Diagramms und der jeweiligen Konzentration als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms umfasst, wodurch eine On-Target-Kurve für die Abfrage-Störung erhalten wird, und
      • das Auswerten (H) ferner das Auftragen der Abfrage-Störung bei jeder jeweiligen Konzentration in der Vielzahl von Konzentrationen auf dem zweidimensionalen Diagramm unter Verwendung des Off-Target-Werts für die Abfrage-Störung bei der jeweiligen Konzentration als eine Koordinate in der ersten Dimension des zweidimensionalen Diagramms und der jeweiligen Konzentration als eine Koordinate in der zweiten Dimension des zweidimensionalen Diagramms umfasst, wodurch eine Off-Target-Kurve für die Abfrage-Störung erhalten wird.
    47. 47. Computersystem nach Ausführungsform 46, wobei das eine oder die mehreren Programme ferner Anweisungen zur Verwendung der On-Target-Kurve und der Off-Target-Kurve zur Quantifizierung eines therapeutischen Fensters für die Abfrage-Störung enthalten, wobei das therapeutische Fenster durch eine Fläche einer geschlossenen zweidimensionalen Form bestimmt wird, die begrenzt ist durch (i) eine Amplitude der On-Target-Kurve zwischen einer ersten Position auf der On-Target-Kurve, die einen maximalen On-Target-Wert in der On-Target-Kurve darstellt, und einer zweiten Position, die einen Schnittpunkt der On-Target-Kurve und der Off-Target-Kurve darstellt, (ii) eine Amplitude der Off-Target-Kurve zwischen dem zweiten Punkt und einer dritten Position auf der Off-Target-Kurve, die einen maximalen Off-Target-Wert in der Off-Target-Kurve darstellt, und (iii) eine zwischen der ersten Position und der dritten Position gezogene Linie.
    48. 48. Das Computersystem nach Ausführungsform 47, wobei die Fläche nach dem geringsten Abstand zwischen der zweiten Position und der zwischen der ersten Position und der dritten Position gezogenen Linie gewichtet wird.
    49. 49. Das Computersystem nach Ausführungsform 47, wobei die Fläche durch die Konzentration der Abfragestörung an der zweiten Position gewichtet wird.
    50. 50. Computersystem nach Ausführungsform 46, wobei das eine oder die mehreren Programme ferner Anweisungen zur Verwendung der On-Target-Kurve und der Off-Target-Kurve zur Quantifizierung einer Rettungsqualität für die Abfrage-Störung enthalten, wobei die Rettungsqualität durch Integration einer Differenz zwischen (a) der Amplitude der ersten Position und (b) des maximalen On-Target-Werts bei jeder jeweiligen Konzentration in der Vielzahl von Konzentrationen bestimmt wird, wobei der maximale On-Target-Wert bei jeder jeweiligen Konzentration in der Vielzahl von Konzentrationen den größten On-Target-Wert aus der On-Target-Kurve und der Off-Target-Kurve bei der jeweiligen Konzentration ist.
    51. 51. Das Computersystem der Ausführungsform 46, wobei das eine oder die mehreren Programme ferner Anweisungen zur Verwendung der On-Target-Kurve und der Off-Target-Kurve enthalten, um eine Rettungsqualität für die Abfrage-Störung zu quantifizieren, wobei i = [ a ] [ b ] max ( Ph a ¨ notyp ( c i ) , Seite ( c i ) ) log ( c i Gewicht ) c i d c
      Figure DE112020002936T5_0016
      wobei:
      • ci ist eine i-te-Konzentration der Verbindung in der Vielzahl von Konzentrationen für die Verbindung,
      • i ist ein Index für jede Konzentration der Verbindung in der Vielzahl von Konzentrationen,
      • [a] ist eine der niedrigsten und höchsten Konzentrationen der Verbindung in der Vielzahl von Konzentrationen,
      • [b] ist die jeweils andere der niedrigsten und der höchsten Konzentration der Verbindung in der Vielzahl von Konzentrationen,
      • Phönotyp(ci) ist der On-Target-Wert für die Verbindung bei der Konzentration ci in der Phänotypkurve,
      • Seite(ci) der On-Target-Wert für die Verbindung bei der Konzentration ci in der Nebenwirkungskurve, und
      • Gewicht ist ein numerisches Gewicht.
    52. 52. Das Computersystem nach einer der Ausführungsformen 1-51, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten für:
      • (I) Berechnen einer Vielzahl von Testvektoren, wobei jeder jeweilige Testvektor in der Vielzahl von Testvektoren zwischen (i) dem ersten Punkt und (ii) einem zweiten Punkt liegt, der durch einen jeweiligen Testdatenpunkt in dem Satz von Testdatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist;
      • (J) Berechnen einer Vielzahl von Kontrollzustandsvektoren, wobei jeder jeweilige Kontrollzustandsvektor in der Vielzahl von Kontrollzustandsvektoren zwischen (i) dem ersten Punkt und (ii) einem dritten Punkt liegt, der durch einen jeweiligen Kontrolldatenpunkt in dem Satz von Kontrolldatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist,
      • (K) Berechnen eines On-Target-Werts für jeden jeweiligen Testvektor in der Vielzahl der Testvektoren als Projektion des jeweiligen Testvektors auf den zusammengesetzten Testvektor;
      • (L) Berechnen eines Off-Target-Werts für jeden jeweiligen Testvektor in der Vielzahl der Testvektoren als Ablehnung des jeweiligen Testvektors gegenüber dem zusammengesetzten Testvektor;
      • (M) Berechnen eines On-Target-Werts für jeden jeweiligen Kontrollvektor in der Vielzahl der Kontrollvektoren als Projektion des jeweiligen Kontrollvektors auf den zusammengesetzten Testvektor;
      • (N) Berechnen eines Off-Target-Werts für jeden jeweiligen Kontrollvektor in der Vielzahl der Kontrollvektoren als Ablehnung des jeweiligen Kontrollvektors gegenüber dem zusammengesetzten Testvektor;
      • (O) Aufzeichnen jedes jeweiligen Testvektors in der Vielzahl von Testvektoren auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für den jeweiligen Testvektor als eine Koordinate in einer ersten Dimension des zweidimensionalen Diagramms und des Off-Target-Werts für den jeweiligen Testvektor als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms, wodurch eine Vielzahl von Testzustandsdatenpunkten erhalten wird;
      • (P) Auftragen jedes jeweiligen Kontrollvektors in der Vielzahl von Kontrollvektoren auf dem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für den jeweiligen Kontrollvektor als eine Koordinate in der ersten Dimension und des Off-Target-Werts für den jeweiligen Kontrollvektor als eine Koordinate in der zweiten Dimension, wodurch eine Vielzahl von Kontrolldatenpunkten erhalten wird; und
      • (Q) Berechnen eines normalisierten Abstands zwischen der Vielzahl von Testzustandsdatenpunkten und der Vielzahl von Kontrolldatenpunkten.
    53. 53. Das Computersystem nach 52, wobei das eine oder die mehreren Programme außerdem Anweisungen enthalten für:
      • (R) Berechnen einer normalisierten Dichtheit der Vielzahl von Testzustandsdatenpunkten.
    54. 54. Das Computersystem nach 53, wobei die normalisierte Dichtheit durch ein Verfahren berechnet wird, das Folgendes umfasst:
      • für jeden jeweiligen Testvektor in der Vielzahl von Testvektoren, Berechnen einer Testzustandsähnlichkeitsmetrik zwischen (i) dem jeweiligen Testvektor und (ii) einer Verteilungsmetrik der Vielzahl von Testvektoren, wobei der jeweilige Testvektor aus der Vielzahl von Testvektoren entfernt wird, wodurch eine Vielzahl von Testzustandsähnlichkeitsmetriken für die Vielzahl von Testvektoren erhalten wird, wobei jede Testzustandsähnlichkeitsmetrik in der Vielzahl von Testzustandsähnlichkeitsmetriken eindeutig einer Teststörung in dem Satz von Teststörungen entspricht, und
      • Berechnung einer komplementären Verteilung durch einen Prozess, der Folgendes umfasst:
        1. (a) für jeden jeweiligen Kontrollzustandsvektor in der Vielzahl von Kontrollzustandsvektoren, Berechnen einer jeweiligen Kontrollähnlichkeitsmetrik zwischen (i) dem jeweiligen Kontrollvektor und (ii) einer Verteilungsmetrik der Vielzahl von Kontrollvektoren, wobei der jeweilige Kontrollvektor aus der Vielzahl von Kontrollvektoren entfernt wird, wodurch die Vielzahl von Kontrollähnlichkeitsmetriken erhalten wird, wobei jede Kontrollähnlichkeitsmetrik in der Vielzahl von Kontrollähnlichkeitsmetriken eindeutig einer Kontrollstörung in dem Satz von Kontrollstörungen entspricht, und
        2. (b) Berechnen der komplementären Verteilung als eine Verteilungsmetrik aus der Vielzahl von Kontrollähnlichkeitsmetriken; und
      • Bestimmen eines ersten Maßes der zentralen Tendenz des Winkels zwischen (i) jeder jeweiligen Testzustandsähnlichkeitsmetrik in der Vielzahl von Testzustandsähnlichkeitsmetriken und (ii) der komplementären Verteilung über die Vielzahl von Testzustandsähnlichkeitsmetriken, und
      • Normalisieren des ersten Maßes der zentralen Tendenz des Winkels durch ein zweites Maß der zentralen Tendenz des Winkels zwischen (i) jeder Kontrollähnlichkeitsmetrik in der Vielzahl von Kontrollähnlichkeitsmetriken und (ii) der komplementären Verteilung über die Vielzahl von Kontrollähnlichkeitsmetriken, wobei das normalisierte erste Maß der zentralen Tendenz die normalisierte Dichtheit der Vielzahl von Testzustandsdatenpunkten darstellt.
    55. 55. Das Computersystem der Ausführungsform 54, wobei die Verteilungsmetrik der Vielzahl von Testvektoren mit dem jeweiligen Testvektor, der aus der Vielzahl von Testvektoren entfernt wurde, ein Maß der zentralen Tendenz jeder entsprechenden Dimension in der Vielzahl von Dimensionen über die Vielzahl von Testvektoren außer dem jeweiligen Testvektor ist.
    56. 56. Das Computersystem der Ausführungsform 55, wobei das Maß der zentralen Tendenz jeder entsprechenden Dimension in der Vielzahl von Dimensionen über die Vielzahl von Testvektoren, die nicht der jeweilige Testvektor sind, ein arithmetisches Mittel, ein gewichtetes Mittel, ein mittlerer Bereich, ein Midhinge, ein Trimean, ein geometrisches Mittel, ein geometrischer Median, ein winsorisiertes Mittel, ein Median oder ein Modus der entsprechenden Dimension über die Vielzahl von Testvektoren ist.
    57. 57. Das Computersystem der Ausführungsform 56, wobei der jeweilige Testzustand ähnlich der Metrik zwischen (i) dem jeweiligen Testvektor und (ii) der Verteilungsmetrik der Vielzahl von Testvektoren, wobei der jeweilige Testvektor aus der Vielzahl von Testvektoren entfernt wird, als ein Abstand zwischen entsprechenden Dimensionen des Testvektors und der Verteilungsmetrik der Vielzahl von Testvektoren berechnet wird, wobei der jeweilige Testvektor aus der Vielzahl von Testvektoren entfernt wird.
    58. 58. Das Computersystem der Ausführungsform 57, wobei der Abstand ein Winkelabstand ist, der wie folgt berechnet wird: i n A i B i i = 1 n A i 2 i = 1 n B i 2
      Figure DE112020002936T5_0017
      und wobei:
      • Ai ist eine Dimension i im jeweiligen Testvektor,
      • Bi ist die Verteilungsmetrik der entsprechenden Dimension i in der Vielzahl von Dimensionen über die Vielzahl von Testvektoren, die nicht der jeweilige Testvektor sind, und
      • n ist die Anzahl der Dimensionen des jeweiligen Testvektors.
    59. 59. Das Computersystem von Ausführungsform 54, wobei die Verteilungsmetrik der Vielzahl von Kontrollvektoren mit dem jeweiligen Kontrollvektor, der aus der Vielzahl von Kontrollvektoren entfernt wurde, ein Maß der zentralen Tendenz jeder entsprechenden Dimension in der Vielzahl von Dimensionen über die Vielzahl von Kontrollvektoren außer dem jeweiligen Kontrollvektor ist.
    60. 60. Das Computersystem der Ausführungsform 59, wobei das Maß der zentralen Tendenz jeder entsprechenden Dimension in der Vielzahl von Dimensionen über die Vielzahl von Kontrollvektoren, die nicht der jeweilige Kontrollvektor sind, ein arithmetisches Mittel, ein gewichtetes Mittel, ein mittlerer Bereich, ein Midhinge, ein Trimean, ein geometrisches Mittel, ein geometrischer Median, ein winsorisiertes Mittel, ein Median oder ein Modus der entsprechenden Dimension über die Vielzahl von Kontrollvektoren ist.
    61. 61. Das Computersystem der Ausführungsform 60, wobei: die jeweilige Kontroll-ähnliche Metrik zwischen (i) dem jeweiligen Kontrollvektor und (ii) der Verteilungsmetrik der Vielzahl von Kontrollvektoren, wobei der jeweilige Kontrollvektor aus der Vielzahl von Kontrollvektoren entfernt wird, als ein Abstand zwischen entsprechenden Dimensionen des Kontrollvektors und der Verteilungsmetrik der Vielzahl von Kontrollvektoren berechnet wird, wobei der jeweilige Kontrollvektor aus der Vielzahl von Kontrollvektoren entfernt wird.
    62. 62. Das Computersystem der Ausführungsform 61, wobei der Abstand ein Winkelabstand ist, der wie folgt berechnet wird: i n A i B i i = 1 n A i 2 i = 1 n B i 2
      Figure DE112020002936T5_0018
      und wobei,
      • Ai ist eine Dimension i im jeweiligen Kontrollvektor,
      • Bi ist die Verteilungsmetrik der entsprechenden Dimension i in der Vielzahl von Dimensionen über die Vielzahl von Kontrollvektoren, die nicht der jeweilige Kontrollvektor sind, und
      • n ist die Anzahl der Dimensionen des jeweiligen Kontrollvektors.
    63. 63. Das Computersystem nach Ausführungsform 50 oder 51, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten für:
      • Bestimmung einer Assayqualität durch ein erstes Verfahren, das Folgendes umfasst:
        • (a) Berechnen einer Vielzahl von Testvektoren, wobei jeder jeweilige Testvektor in der Vielzahl von Testvektoren zwischen (i) dem ersten Punkt und (ii) einem zweiten Punkt liegt, der durch einen jeweiligen Testdatenpunkt in dem Satz von Testdatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist,
        • b) Berechnen einer Vielzahl von Kontrollvektoren, wobei jeder jeweilige Kontrollvektor in der Vielzahl von Kontrollvektoren zwischen (i) dem ersten Punkt und (ii) einem dritten Punkt liegt, der durch einen jeweiligen Kontrolldatenpunkt in dem Satz von Kontrolldatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist;
        • (c) Berechnen eines On-Target-Werts für jeden jeweiligen Testvektor in der Vielzahl von Testvektoren als Projektion des jeweiligen Testvektors auf den zusammengesetzten Testvektor;
        • (d) Berechnen eines Off-Target-Werts für jeden jeweiligen Testvektor in der Vielzahl der Testvektoren als Ablehnung des jeweiligen Testvektors gegenüber dem zusammengesetzten Testvektor;
        • (e) Berechnen eines On-Target-Werts für jeden jeweiligen Kontrollvektor in der Vielzahl der Kontrollvektoren als Projektion des jeweiligen Kontrollvektors auf den zusammengesetzten Testvektor;
        • (f) Berechnen eines Off-Target-Werts für jeden jeweiligen Kontrollvektor in der Vielzahl der Kontrollvektoren als Ablehnung des jeweiligen Kontrollvektors gegenüber dem zusammengesetzten Testvektor;
        • (g) Aufzeichnen jedes jeweiligen Testvektors in der Vielzahl von Testvektoren auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für den jeweiligen Testvektor als eine Koordinate in einer ersten Dimension des zweidimensionalen Diagramms und des Off-Target-Werts für den jeweiligen Testvektor als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms, wodurch eine Vielzahl von Testzustandsdatenpunkten erhalten wird,
        • (h) Auftragen jedes jeweiligen Kontrollvektors in der Vielzahl von Kontrollvektoren auf dem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für den jeweiligen Kontrollvektor als eine Koordinate in der ersten Dimension und des Off-Target-Werts für den jeweiligen Kontrollvektor als eine Koordinate in der zweiten Dimension, wodurch eine Vielzahl von Kontrolldatenpunkten erhalten wird; und
        • (i) Berechnen der Assay-Qualität als normalisierter Abstand zwischen der Vielzahl von Testzustandsdatenpunkten und der Vielzahl von Kontrolldatenpunkten;
        • Bestimmen einer Testzustandsqualität durch Berechnen einer normalisierten Dichtheit der Vielzahl von Testzustandsdatenpunkten;
        • unter Verwendung der Rettungsqualität für die Abfrage-Störung, der Assayqualität und der Testzustandsqualität, um eine Gesamtqualität zu berechnen.
    64. 64. Das Computersystem nach Ausführungsform 63, wobei die Gesamtqualität wie folgt berechnet wird: ( Rettungsqualit a ¨ t f u ¨ r die Verbindung ) exp ( Assay Qualit a ¨ t 1 ) 1 1 + exp ( 1 Ph a ¨ notyp Qualit a ¨ t ) .
      Figure DE112020002936T5_0019
    65. 65. Das Computersystem der Ausführungsform 63, wobei die normalisierte Dichtheit durch ein Verfahren berechnet wird, das Folgendes umfasst:
      • für jeden jeweiligen Testvektor in der Vielzahl von Testvektoren, Berechnen einer Testzustandsähnlichkeitsmetrik zwischen (i) dem jeweiligen Testvektor und (ii) einer Verteilungsmetrik der Vielzahl von Testvektoren, wobei der jeweilige Testvektor aus der Vielzahl von Testvektoren entfernt wird, wodurch eine Vielzahl von Testzustandsähnlichkeitsmetriken für die Vielzahl von Testvektoren erhalten wird, wobei jede Testzustandsähnlichkeitsmetrik in der Vielzahl von Testzustandsähnlichkeitsmetriken eindeutig einer Teststörung in dem Satz von Teststörungen entspricht, und
      • Berechnung einer Nullverteilung durch einen Prozess, der Folgendes umfasst:
        1. (a) für jeden jeweiligen Kontrollvektor in der Vielzahl von Kontrollvektoren, Berechnen einer jeweiligen Kontrollähnlichkeitsmetrik zwischen (i) dem jeweiligen Kontrollvektor und (ii) einer Verteilungsmetrik der Vielzahl von Kontrollvektoren, wobei der jeweilige Kontrollvektor aus der Vielzahl von Kontrollvektoren entfernt wird, wodurch die Vielzahl von Kontrollähnlichkeitsmetriken erhalten wird, wobei jede Kontrollähnlichkeitsmetrik in der Vielzahl von Kontrollähnlichkeitsmetriken eindeutig einer Kontrollstörung in dem Satz von Kontrollstörungen entspricht, und
        2. (b) Berechnen der Nullverteilung als eine Verteilungsmetrik aus der Vielzahl von Kontrollähnlichkeitsmetriken; und
      • Bestimmen eines ersten Maßes der zentralen Tendenz des Winkels zwischen (i) jeder jeweiligen Testzustandsähnlichkeitsmetrik in der Vielzahl von Testzustandsähnlichkeitsmetriken und (ii) der Nullverteilung über die Vielzahl von Testzustandsähnlichkeitsmetriken, und
      • Normalisieren des ersten Maßes der zentralen Tendenz des Winkels durch ein zweites Maß der zentralen Tendenz des Winkels zwischen (i) jeder Kontrollähnlichkeitsmetrik in der Vielzahl von Kontrollähnlichkeitsmetriken und (ii) der Nullverteilung über die Vielzahl von Kontrollähnlichkeitsmetriken, wobei das normalisierte erste Maß der zentralen Tendenz die normalisierte Dichtheit der Vielzahl von Testzustandsdatenpunkten darstellt.
    66. 66. Das Computersystem nach einer der Ausführungsformen 1-65, wobei die Vielzahl von Abfragestörungen 1000 Abfragestörungen umfasst.
    67. 67. Das Computersystem nach einer der Ausführungsformen 2-66, wobei das eine oder die mehreren Programme ferner Anweisungen zum Eliminieren einer oder mehrerer Abfragestörungen aus der Vielzahl von Abfragestörungen unter Verwendung eines Eliminierungskriteriums enthalten, das zumindest teilweise auf dem On-Target-Wert jeder Abfragestörung in der Vielzahl von Abfragestörungen basiert.
    68. 68. Das Computersystem nach Ausführungsform 67, wobei das Eliminierungskriterium lautet E = uudx K * uuudx ,
      Figure DE112020002936T5_0020
      wobei, jede jeweilige Abfragestörung in der Vielzahl von Abfragestörungen, die einen On-Target-Wert von weniger als E hat, aus der Vielzahl von Abfragestörungen eliminiert wird, uudx = ist ein Maß für die zentrale Tendenz des On-Target-Werts über die Vielzahl von Abfragestörungen hinweg, uuudx = ist eine Standardabweichung des On-Target-Werts über die Vielzahl von Abfrage-Störungen hinweg, K = ist ein Gewicht, und für jede jeweilige Abfrage-Störung, die in der Vielzahl von Abfrage-Störungen verbleibt, wird das Erhalten (D), Berechnen (E), Berechnen (F) und Berechnen (G) für jede jeweilige Menge der jeweiligen Abfrage-Störung in einer Vielzahl von jeweiligen Mengen der jeweiligen Abfrage-Störung wiederholt, wobei jede jeweilige Menge der jeweiligen Abfrage-Störung als eine entsprechende Konzentration der jeweiligen Abfrage-Störung in der entsprechenden Teilmenge der Vielzahl von Vertiefungen ausgedrückt wird, wodurch ein On-Target-Wert und ein Off-Target-Wert bei jeder Konzentration in einer Vielzahl von Konzentrationen für die jeweilige Abfrage-Störung erhalten wird.
    69. 69. Das Computersystem der Ausführungsform 46, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten für: Anpassen der On-Target-Kurve an eine erste Sigmoidalfunktion; und Anpassung der Off-Target-Kurve an eine zweite Sigmoidalfunktion.
    70. 70. Das Computersystem der Ausführungsform 69, wobei die erste Sigmoidalfunktion die Form hat: ( c + ( d c ) ( 1 + ( ( x E C 50 ) ) b ) ) + ( c + ( d c ) ( 1 + ( ( x E C 50 ) ) b ) ) ,
      Figure DE112020002936T5_0021
      wobei
      • c = ein für die Abfrage-Störung berechneter minimaler On-Target-Wert,
      • d = ein für die Abfrage-Störung berechneter maximaler On-Target-Wert,
      • ECso = eine Konzentration der Abfrage-Störung, die der Hälfte ihrer maximalen On-Target-Wirkung entspricht,
      • x = eine Konzentration der Abfrage-Störung in der Vielzahl von Konzentrationen und
      • b = eine Hill-Steigung der On-Target-Kurve.
    71. 71. Das Computersystem der Ausführungsform 69 oder 70, wobei die zweite Sigmoidalfunktion die Form hat: ( c ' + ( d ' c ' ) ( 1 + ( ( x E C 50 ' ) ) b ' ) ) + ( c ' + ( d ' c ' ) ( 1 + ( ( x E C 50 ' ) ) b ' ) ) ,
      Figure DE112020002936T5_0022
      wobei
      • c' = ein für die Abfrage-Störung berechneter minimaler Off-Target-Wert,
      • d' = ein für die Abfrage-Störung berechneter maximaler Off-Target-Wert,
      • EC50 ' = eine Konzentration der Abfrage-Störung, die der Hälfte ihrer Off-Target-Wirkung entspricht,
      • x = eine Konzentration der Abfrage-Störung in der Vielzahl von Konzentrationen und
      • b' = eine Hill-Steigung der Off-Target-Kurve.
    72. 72. Verfahren zur Auswertung einer Abfragestörung in einem zellbasierten Assay, der einen Testzustand darstellt, wobei der zellbasierte Assay eine Vielzahl von Vertiefungen in einer oder mehreren Platten umfasst, wobei das Verfahren umfasst:
      1. (A) Erhalten eines entsprechenden Kontrolldatenpunkts für jede jeweilige Kontrollstörung in einem Satz von Kontrollstörungen, wodurch eine Vielzahl von Kontrolldatenpunkten erhalten wird, wobei jeder entsprechende Kontrolldatenpunkt eine Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz eines unterschiedlichen Merkmals in einer Vielzahl von Merkmalen darstellt, das über eine entsprechende Vielzahl von Kontrollaliquots von Zellen in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen bestimmt wird, die die jeweilige Kontrollstörung darstellen;
      2. (B) Erhalten eines entsprechenden Testdatenpunkts für jede jeweilige Teststörung in einem Satz von einer oder mehreren Teststörungen, wodurch eine Vielzahl von Testdatenpunkten erhalten wird, wobei jeder entsprechende Testdatenpunkt die Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen eine Messung der zentralen Tendenz eines anderen Merkmals in der Vielzahl von Merkmalen umfasst, die über eine entsprechende Vielzahl von Testaliquoten der Zellen bestimmt wird, die die jeweilige Teststörung in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen darstellen;
      3. (C) Berechnen eines zusammengesetzten Testvektors, wobei der zusammengesetzte Testvektor zwischen (i) einem ersten Punkt, der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Kontrolldatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, und (ii) einem zweiten Punkt, der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Testdatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, liegt;
      4. (D) Erhalten einer Vielzahl von Abfragestörungsdatenpunkten, wobei jeder entsprechende Abfragestörungsdatenpunkt die Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz eines unterschiedlichen Merkmals in der Vielzahl von Merkmalen umfasst, das über eine Vielzahl von Instanzen von Abfragestörungsaliquots der Zellen bestimmt wird, die eine jeweilige Teststörung in der Vielzahl von Teststörungen und eine erste Menge der Abfragestörung in einer entsprechenden Teilmenge der Vielzahl von Vertiefungen darstellen;
      5. (E) Berechnen eines Abfrage-Störungsvektors zwischen (i) dem ersten Punkt und (ii) einem jeweiligen Maß der zentralen Tendenz über die Vielzahl von Abfrage-Störungsdatenpunkten für jede Dimension in der Vielzahl von Dimensionen;
      6. (F) Berechnung eines On-Target-Werts für die Abfrage-Störung als Projektion des Vektors der Abfrage-Störung auf den zusammengesetzten Test;
      7. (G) Berechnen eines Off-Target-Werts für die Abfrage-Störung als Ablehnung des Abfrage-Störungsvektors gegenüber dem zusammengesetzten Testvektor; und
      8. (H) Bewertung des Off-Target-Werts für die Abfrage-Störung und damit Bewertung der Abfrage-Störung.
    73. 73. Nicht-transitorisches, computerlesbares Speichermedium und ein oder mehrere darin eingebettete Computerprogramme zur Auswertung einer Abfragestörung in einem zellbasierten Assay, der einen Testzustand darstellt, wobei der zellbasierte Assay eine Vielzahl von Vertiefungen in einer oder mehreren Platten umfasst, wobei das eine oder die mehreren Computerprogramme Anweisungen umfassen, die, wenn sie von einem Computersystem ausgeführt werden, das Computersystem veranlassen, ein Verfahren durchzuführen, das Folgendes umfasst:
      1. (A) Erhalten eines entsprechenden Kontrolldatenpunkts für jede jeweilige Kontrollstörung in einem Satz von Kontrollstörungen, wodurch eine Vielzahl von Kontrolldatenpunkten erhalten wird, wobei jeder entsprechende Kontrolldatenpunkt eine Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen (i) ein Maß der zentralen Tendenz eines anderen Merkmals in einer Vielzahl von Merkmalen darstellt, das über eine entsprechende Vielzahl von Kontrollaliquoten von Zellen in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen bestimmt wird, die die jeweilige Kontrollstörung darstellen;
      2. (B) Erhalten eines entsprechenden Testdatenpunkts für jede jeweilige Teststörung in einem Satz von einer oder mehreren Teststörungen, wodurch eine Vielzahl von Testdatenpunkten erhalten wird, wobei jeder entsprechende Testdatenpunkt die Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen eine Messung der zentralen Tendenz eines unterschiedlichen Merkmals in der Vielzahl von Merkmalen umfasst, die über eine entsprechende Vielzahl von Testaliquots der Zellen bestimmt wird, die die jeweilige Teststörung in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen darstellen;
      3. (C) Berechnen eines zusammengesetzten Testvektors, wobei der zusammengesetzte Testvektor zwischen (i) einem ersten Punkt, der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Kontrolldatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, und (ii) einem zweiten Punkt, der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Testdatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, liegt;
      4. (D) Erhalten einer Vielzahl von Abfragestörungsdatenpunkten, wobei jeder entsprechende Abfragestörungsdatenpunkt die Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz eines unterschiedlichen Merkmals in der Vielzahl von Merkmalen umfasst, das über eine Vielzahl von Instanzen von Abfragestörungsaliquots der Zellen bestimmt wird, die eine jeweilige Teststörung in der Vielzahl von Teststörungen und eine erste Menge der Abfragestörung in einer entsprechenden Teilmenge der Vielzahl von Vertiefungen darstellen;
      5. (E) Berechnen eines Abfrage-Störungsvektors zwischen (i) dem ersten Punkt und (ii) einem jeweiligen Maß der zentralen Tendenz über die Vielzahl von Abfrage-Störungsdatenpunkten für jede Dimension in der Vielzahl von Dimensionen;
      6. (F) Berechnung eines On-Target-Werts für die Abfrage-Störung als Projektion des Vektors der Abfrage-Störung auf den zusammengesetzten Test;
      7. (G) Berechnen eines Off-Target-Werts für die Abfrage-Störung als Ablehnung des Abfrage-Störungsvektors gegenüber dem zusammengesetzten Testvektor; und
      8. (H) Bewertung des Off-Target-Werts für die Abfrage-Störung und damit Bewertung der Abfrage-Störung.
    74. 74. Ein Computersystem zur Auswertung einer Abfrage-Störung in einem zellbasierten Assay, der einen Testzustand darstellt, wobei:
      • der zellbasierte Asssy umfasst eine Vielzahl von Vertiefungen in einer oder mehreren Platten, wobei das Computersystem Folgendes umfasst:
        • einen oder mehrere Prozessoren;
        • einen Speicher; und
        • ein oder mehrere Programme, wobei das eine oder die mehreren Programme in dem Speicher gespeichert sind und so konfiguriert sind, dass sie von dem einen oder den mehreren Prozessoren ausgeführt werden, wobei das eine oder die mehreren Programme Anweisungen enthalten, um:
          • (A) Erhalten eines entsprechenden Kontrolldatenpunktes für jede jeweilige Kontrollstörung in einem Satz von Kontrollstörungen, wodurch eine Vielzahl von Kontrolldatenpunkten erhalten wird, wobei jeder entsprechende Kontrolldatenpunkt eine Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz eines anderen Merkmals in einer Vielzahl von Merkmalen darstellt, das über eine entsprechende Vielzahl von Kontrollaliquots von Zellen in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen bestimmt wird, die die jeweilige Kontrollstörung darstellen;
          • B) Erhalten eines entsprechenden Testdatenpunkts für jede jeweilige Teststörung in einem Satz von einer oder mehreren Teststörungen, wodurch eine Vielzahl von Testdatenpunkten erhalten wird, wobei jeder entsprechende Testdatenpunkt die Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen eine Messung der zentralen Tendenz eines anderen Merkmals in der Vielzahl von Merkmalen umfasst, die über eine entsprechende Vielzahl von Testaliquoten der Zellen bestimmt wird, die die jeweilige Teststörung in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen darstellen;
          • (C) Berechnen eines zusammengesetzten Testvektors, wobei der zusammengesetzte Testvektor zwischen (i) einem ersten Punkt, der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Kontrolldatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, und (ii) einem zweiten Punkt, der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Testdatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, liegt;
          • (D) Erhalten einer Vielzahl von Abfragestörungsdatenpunkten, wobei jeder entsprechende Abfragestörungsdatenpunkt die Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz eines anderen Merkmals in der Vielzahl von Merkmalen umfasst, das über eine Vielzahl von Instanzen von Abfragestörungsaliquots der Zellen bestimmt wird, die eine jeweilige Teststörung in der Vielzahl von Teststörungen und eine erste Menge der Abfragestörung in einer entsprechenden Teilmenge der Vielzahl von Vertiefungen darstellen; und
          • (E) Berechnen eines Abfrage-Störungsvektors zwischen (i) dem ersten Punkt und (ii) einem jeweiligen Maß der zentralen Tendenz über die Vielzahl von Abfrage-Störungsdatenpunkten für jede Dimension in der Vielzahl von Dimensionen.
    75. 75. Das Computersystem der Ausführungsform 74, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten für:
      • Ausgabe des Abfrage-Störungsvektors in einem für den Menschen sichtbaren Format.
    76. 76. Das Computersystem der Ausführungsform 74, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten für:
      • Berechnen eines On-Target-Werts für die Abfrage-Störung als Projektion des Abfrage-Störungsvektors auf den zusammengesetzten Testvektor.
    77. 77. Das Computersystem der Ausführungsform 76, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten für:
      • die Ausgabe des On-Target-Werts in einem für den Menschen sichtbaren Format.
    78. 78. Das Computersystem der Ausführungsform 74, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten für:
      • Berechnen eines Off-Target-Werts für die Abfrage-Störung als Ablehnung des Abfrage-Störungsvektors gegenüber dem zusammengesetzten Testvektor.
    79. 79. Das Computersystem von Ausführungsform 78, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten für:
      • die Bewertung des Off-Target-Werts für die Abfragestörung und damit die Bewertung der Abfragestörung.
    80. 80. Das Computersystem der Ausführungsform 79, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten für:
      • Ausgabe des Off-Target-Werts und/oder der Ergebnisse der Auswertung des Off-Target-Werts in einem für den Menschen sichtbaren Format.
    81. 81. Das Computersystem der Ausführungsform 74, wobei das eine oder die mehreren Programme ferner Anweisungen für Folgendes enthalten:
      • (F) Berechnung eines On-Target-Werts für die Abfrage-Störung als Projektion des Abfrage-Störungsvektors auf den zusammengesetzten Testvektor;
      • (G) Berechnen eines Off-Target-Werts für die Abfrage-Störung als Ablehnung des Abfrage-Störungsvektors gegenüber dem zusammengesetzten Testvektor; und
      • (H) Bewertung des Off-Target-Werts für die Abfrage-Störung und damit Bewertung der Abfrage-Störung.
    82. 82. Das Computersystem von Ausführungsform 81, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten für:
      • Wiederholen des Erhaltens der Vielzahl von Abfragestörungsdatenpunkten, des Berechnens eines Abfragestörungsvektors, des Berechnens des On-Target-Werts und des Berechnens des Off-Target-Werts für jede Abfragestörung in einer Vielzahl von Abfragestörungen; und
      wobei das Auswerten des Off-Target-Werts das Auftragen jeder jeweiligen Abfrage-Störung in der Vielzahl von Abfrage-Störungen auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für die jeweilige Abfrage-Störung als eine Koordinate in einer ersten Dimension des zweidimensionalen Diagramms und des Off-Target-Werts für die jeweilige Abfrage-Störung als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms umfasst, wobei das zweidimensionale Diagramm für Menschen sichtbar ist.
    83. 83. Das Computersystem der Ausführungsform 74, wobei das eine oder die mehreren Programme ferner Anweisungen für Folgendes enthalten:
      • Berechnen eines entsprechenden Kontrollvektors zwischen dem ersten Punkt und einem zweiten Punkt, der durch ein Maß der zentralen Tendenz über die Kontrolldatenpunkte, die mit der jeweiligen Kontrollstörung verbunden sind, für jede Dimension in der Vielzahl von Dimensionen definiert ist, für jede jeweilige Kontrollstörung in dem Satz von Kontrollstörungen, wodurch eine Vielzahl von Kontrollvektoren berechnet wird;
      • Berechnen eines On-Target-Werts für jede Kontrollstörung als Projektion des entsprechenden Kontrollvektors aus der Vielzahl der Kontrollvektoren auf den zusammengesetzten Testvektor;
      • Berechnen eines Off-Target-Werts für jede Kontrollstörung als Ablehnung des entsprechenden Kontrollvektors gegenüber dem zusammengesetzten Testvektor; und wobei die Auswertung weiterhin umfasst:
        • Aufzeichnen jeder Kontrollstörung im Satz von Kontrollstörungen auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für die jeweilige Kontrollstörung als eine Koordinate in einer ersten Dimension und des Off-Target-Werts für die jeweilige Kontrollstörung als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms.
    84. 84. Das Computersystem der Ausführungsform 74, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten für:
      • Berechnen eines entsprechenden Kontrollvektors zwischen dem ersten Punkt für jede Dimension in der Vielzahl von Dimensionen und einem zweiten Punkt, der durch einen Wert eines entsprechenden Merkmals in der Vielzahl von Merkmalen definiert ist, der aus der jeweiligen Vertiefung bestimmt wurde, für jede entsprechende Vertiefung in der Vielzahl von Vertiefungen, die eine Kontrollstörung in dem Satz von Kontrollstörungen darstellt, wodurch eine Vielzahl von Kontrollvektoren berechnet wird, und
      • Berechnen eines On-Target-Werts für jeden entsprechenden Kontrollvektor in der Vielzahl der Kontrollvektoren als Projektion des entsprechenden Kontrollvektors auf den zusammengesetzten Testvektor;
      • Berechnen eines Off-Target-Werts für jeden jeweiligen Kontrollvektor in der Vielzahl der Kontrollvektoren als Ablehnung des jeweiligen Kontrollvektors gegenüber dem zusammengesetzten Testvektor; und
      • wobei die Auswertung weiterhin umfasst:
        • Aufzeichnen jedes jeweiligen Kontrollvektors in der Vielzahl von Kontrollvektoren auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für den jeweiligen Kontrollvektor als eine Koordinate in einer ersten Dimension und des Off-Target-Werts für den jeweiligen Kontrollvektor als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms.
    85. 85. Das Computersystem der Ausführungsform 74, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten für:
      • Berechnen eines entsprechenden Testvektors zwischen dem ersten Punkt für jede Dimension in der Vielzahl von Dimensionen und einem zweiten Punkt, der durch ein Maß der zentralen Tendenz über die Testdatenpunkte definiert ist, die mit der jeweiligen Teststörung verbunden sind, für jede jeweilige Teststörung in dem Satz von Teststörungen, wodurch eine Vielzahl von Testvektoren berechnet wird,
      • Berechnen eines On-Target-Werts für jede Teststörung als Projektion des entsprechenden Testvektors aus der Vielzahl der Testvektoren auf den zusammengesetzten Testvektor;
      • Berechnen eines Off-Target-Werts für jede Teststörung als Ablehnung des entsprechenden Testvektors gegenüber dem zusammengesetzten Testvektor; und
      • wobei die Auswertung weiterhin umfasst:
        • Aufzeichnen jeder Teststörung im Satz von Teststörungen auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für die jeweilige Teststörung als eine Koordinate in einer ersten Dimension und des Off-Target-Werts für die jeweilige Teststörung als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms.
    86. 86. Das Computersystem der Ausführungsform 74, wobei das eine oder die mehreren Programme ferner Anweisungen für Folgendes enthalten:
      • Berechnen eines entsprechenden Testvektors zwischen dem ersten Punkt für jede Dimension in der Vielzahl von Dimensionen und einem zweiten Punkt, der durch eine Messung eines entsprechenden Merkmals in der Vielzahl von Merkmalen in der jeweiligen Vertiefung definiert ist, für jede jeweilige Vertiefung in der Vielzahl von Vertiefungen, die eine Teststörung in dem Satz von Teststörungen darstellen, wodurch eine Vielzahl von Testvektoren berechnet wird, und
      • Berechnen eines On-Target-Werts für jeden entsprechenden Testvektor in der Vielzahl von Testvektoren als Projektion des entsprechenden Testvektors auf den zusammengesetzten Testvektor;
      • Berechnen eines Off-Target-Werts für jeden jeweiligen Testvektor in der Vielzahl von Testvektoren als eine Ablehnung des jeweiligen Testvektors gegenüber dem zusammengesetzten Testvektor; und wobei das Auswerten weiterhin umfasst:
        • Aufzeichnen jedes jeweiligen Testvektors in der Vielzahl von Testvektoren auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für den jeweiligen Testvektor als eine Koordinate in einer ersten Dimension und des Off-Target-Werts für den Testvektor als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms.
    87. 87. Das Computersystem nach Ausführungsform 74, wobei der Satz von Kontrollstörungen aus einer Vielzahl von Kontroll-siRNA besteht, die die Expression eines mit dem Testzustand assoziierten Gens nicht direkt beeinflussen.
    88. 88. Das Computersystem nach Ausführungsform 74, wobei der Satz von Teststörungen aus einer Vielzahl von Ziel-siRNA besteht, die die Expression eines mit dem Testzustand assoziierten Gens direkt beeinflussen.
    89. 89. Das Computersystem nach Ausführungsform 74, wobei jedes Merkmal aus einer Kombination von messbaren Eigenschaften abgeleitet wird, die aus einer Farbe, einer Textur und einer Größe eines Zellkontextes oder eines aufgezählten Teils des Zellkontextes ausgewählt werden.
    90. 90. Das Computersystem nach Ausführungsform 74, wobei die Gewinnung von Kontrolldatenpunkten umfasst:
      • Abbilden einer entsprechenden Vertiefung in der Vielzahl von Vertiefungen, um ein entsprechendes zweidimensionales gepixeltes Bild mit einer entsprechenden Vielzahl von nativen Pixelwerten zu bilden, und wobei ein unterschiedliches Merkmal in der Vielzahl von Merkmalen des Erhaltens von Kontrolldatenpunkten als ein Ergebnis einer Faltung oder einer Reihe von Faltungen und Pooling-Operatoren entsteht, die gegen native Pixelwerte in einer entsprechenden Vielzahl von nativen Pixelwerten des entsprechenden zweidimensionalen gepixelten Bildes ausgeführt werden.
    91. 91. Das Computersystem nach Ausführungsform 74, wobei jedes Merkmal in der Vielzahl von Merkmalen anhand eines optisch gemessenen Merkmals bestimmt wird.
    92. 92. Das Computersystem der Ausführungsform 74, wobei:
      • eine erste Teilmenge der Vielzahl von Merkmalen aus optisch gemessenen Merkmalen bestimmt wird; und
      • eine zweite Teilmenge der Vielzahl von Merkmalen aus nicht optisch gemessenen Merkmalen bestimmt wird.
    93. 93. Das Computersystem der Ausführungsform 74, wobei jedes Merkmal in der Vielzahl von Merkmalen aus einem nicht optisch gemessenen Merkmal bestimmt wird.
    94. 94. Verfahren zur Auswertung einer Abfragestörung in einem zellbasierten Assay, der einen Testzustand darstellt, wobei der zellbasierte Assay eine Vielzahl von Vertiefungen in einer oder mehreren Multiwell-Platten umfasst, wobei das Verfahren umfasst:
      • Erhalten eines entsprechenden Kontrolldatenpunkts für jede jeweilige Kontrollstörung in einem Satz von Kontrollstörungen, wodurch eine Vielzahl von Kontrolldatenpunkten erhalten wird, wobei jeder entsprechende Kontrolldatenpunkt eine Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz eines anderen Merkmals in einer Vielzahl von Merkmalen darstellt, das über eine entsprechende Vielzahl von Kontrollaliquoten von Zellen in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen bestimmt wird, die die jeweilige Kontrollstörung darstellen;
      • Erhalten eines entsprechenden Testdatenpunkts für jede jeweilige Teststörung in einem Satz von einer oder mehreren Teststörungen, wodurch eine Vielzahl von Testdatenpunkten erhalten wird, wobei jeder entsprechende Testdatenpunkt die Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen eine Messung der zentralen Tendenz eines anderen Merkmals in der Vielzahl von Merkmalen umfasst, die über eine entsprechende Vielzahl von Testaliquoten der Zellen bestimmt wird, die die jeweilige Teststörung in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen darstellen;
      • Berechnen eines zusammengesetzten Testvektors, wobei der zusammengesetzte Testvektor zwischen (i) einem ersten Punkt, der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Kontrolldatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, und (ii) einem zweiten Punkt, der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Testdatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, liegt;
      • Erhalten einer Vielzahl von Abfragestörungsdatenpunkten, wobei jeder entsprechende Abfragestörungsdatenpunkt die Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz eines anderen Merkmals in der Vielzahl von Merkmalen umfasst, das über eine Vielzahl von Instanzen von Abfragestörungsaliquots der Zellen bestimmt wird, die eine jeweilige Teststörung in dem Satz von Teststörungen und eine erste Menge der Abfragestörung in einer entsprechenden Teilmenge der Vielzahl von Vertiefungen darstellen; und
      • Berechnen eines Abfrage-Störungsvektors zwischen dem ersten Punkt und einem jeweiligen Maß der zentralen Tendenz über die Vielzahl von Abfrage-Störungsdatenpunkten für jede Dimension in der Vielzahl von Dimensionen.
    95. 95. Nicht-transitorisches, computerlesbares Speichermedium und ein oder mehrere darin eingebettete Computerprogramme zur Auswertung einer Abfragestörung in einem zellbasierten Assay, der einen Testzustand darstellt, wobei der zellbasierte Assay eine Vielzahl von Vertiefungen in einer oder mehreren Multiwell-Platten umfasst, wobei das eine oder die mehreren Computerprogramme Anweisungen umfassen, die, wenn sie von einem Computersystem ausgeführt werden, das Computersystem veranlassen, ein Verfahren durchzuführen, das Folgendes umfasst:
      • Erhalten eines entsprechenden Kontrolldatenpunkts für jede jeweilige Kontrollstörung in einem Satz von Kontrollstörungen, wodurch eine Vielzahl von Kontrolldatenpunkten erhalten wird, wobei jeder entsprechende Kontrolldatenpunkt eine Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz eines anderen Merkmals in einer Vielzahl von Merkmalen darstellt, das über eine entsprechende Vielzahl von Kontrollaliquoten von Zellen in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen bestimmt wird, die die jeweilige Kontrollstörung darstellen;
      • Erhalten eines entsprechenden Testdatenpunkts für jede jeweilige Teststörung in einem Satz von einer oder mehreren Teststörungen, wodurch eine Vielzahl von Testdatenpunkten erhalten wird, wobei jeder entsprechende Testdatenpunkt die Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen eine Messung der zentralen Tendenz eines anderen Merkmals in der Vielzahl von Merkmalen umfasst, die über eine entsprechende Vielzahl von Testaliquoten der Zellen bestimmt wird, die die jeweilige Teststörung in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen darstellen;
      • Berechnen eines zusammengesetzten Testvektors, wobei der zusammengesetzte Testvektor zwischen (i) einem ersten Punkt, der durch ein entsprechendes Maß der zentralen Tendenz über die Vielzahl von Kontrolldatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, und (ii) einem zweiten Punkt, der durch ein entsprechendes Maß der zentralen Tendenz über die Vielzahl von Testdatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, liegt;
      • Erhalten einer Vielzahl von Abfragestörungsdatenpunkten, wobei jeder entsprechende Abfragestörungsdatenpunkt die Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz eines anderen Merkmals in der Vielzahl von Merkmalen umfasst, das über eine Vielzahl von Instanzen von Abfragestörungsaliquots der Zellen bestimmt wird, die eine jeweilige Teststörung in dem Satz von Teststörungen und eine erste Menge der Abfragestörung in einer entsprechenden Teilmenge der Vielzahl von Vertiefungen darstellen; und
      • Berechnen eines Abfrage-Störungsvektors zwischen dem ersten Punkt und einem jeweiligen Maß der zentralen Tendenz über die Vielzahl von Abfrage-Störungsdatenpunkten für jede Dimension in der Vielzahl von Dimensionen.
  • ZITIERTE REFERENZEN UND ALTERNATIVE AUSFÜHRUNGSFORMEN
  • Alle hierin zitierten Referenzen sind durch Verweis in ihrer Gesamtheit und für alle Zwecke in demselben Umfang einbezogen, als ob jede einzelne Veröffentlichung oder jedes einzelne Patent oder jede einzelne Patentanmeldung ausdrücklich und individuell als durch Verweis in ihrer Gesamtheit für alle Zwecke einbezogen angegeben wäre.
  • Verschiedene hierin beschriebene Ausführungsformen können als Computerprogrammprodukt implementiert werden, das einen Computerprogramm-Mechanismus umfasst, der in ein nicht-transitorisches computerlesbares Speichermedium eingebettet ist. Das Computerprogrammprodukt könnte beispielsweise die in einer beliebigen Kombination der 1, 2A-2D, 3 und 4A-4AD gezeigten und/oder beschriebenen Programmmodule enthalten. Diese Programmmodule können auf einer CD-ROM, einer DVD, einem Magnetplattenspeicher, einem USB-Stick oder einem anderen nichtübertragbaren, computerlesbaren Daten- oder Programmspeicher gespeichert werden.
  • Viele Modifikationen und Variationen der hierin beschriebenen Ausführungsformen können vorgenommen werden, ohne von ihrem Sinn und Anwendungsbereich abzuweichen, wie für den Fachmann offensichtlich ist. Die hier beschriebenen spezifischen Ausführungsformen werden nur als Beispiel angeboten. Die Ausführungsformen wurden ausgewählt und beschrieben, um die Prinzipien der beschriebenen Technologie und ihre praktischen Anwendungen bestmöglich zu erläutern und dadurch andere Fachleute in die Lage zu versetzen, die beschriebene Technologie und die verschiedenen Ausführungsformen mit verschiedenen Modifikationen, die für die jeweilige Anwendung geeignet sind, optimal zu nutzen. Die beschriebenen Ausführungsformen sind nur durch die Bedingungen der beigefügten Ansprüche begrenzt, zusammen mit dem vollen Umfang der Äquivalente, auf die diese Ansprüche Anspruch haben.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • US 15/910822 [0006]
    • US 2019/019846 PCT [0007]
    • US 2020/022048 PCT [0008]
    • US 276686 A1 [0213]

Claims (22)

  1. Computersystem zum Auswerten einer Abfragestörung in einem zellbasierten Assay, der einen Testzustand darstellt, wobei der zellbasierte Assay eine Vielzahl von Vertiefungen in einer oder mehreren Multiwell-Platten umfasst, wobei das Computersystem umfasst: einen oder mehrere Prozessoren; einen Speicher; und ein oder mehrere Programme, wobei das eine oder die mehreren Programme in dem Speicher gespeichert sind und so konfiguriert sind, dass sie von dem einen oder den mehreren Prozessoren ausgeführt werden, wobei das eine oder die mehreren Programme Anweisungen enthalten, um: Erhalten eines entsprechenden Kontrolldatenpunkts für jede jeweilige Kontrollstörung in einem Satz von Kontrollstörungen, wodurch eine Vielzahl von Kontrolldatenpunkten erhalten wird, wobei jeder entsprechende Kontrolldatenpunkt eine Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz eines anderen Merkmals in einer Vielzahl von Merkmalen darstellt, das über eine entsprechende Vielzahl von Kontrollaliquoten von Zellen in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen bestimmt wird, die die jeweilige Kontrollstörung darstellen; Erhalten eines entsprechenden Testdatenpunkts für jede jeweilige Teststörung in einem Satz von einer oder mehreren Teststörungen, wodurch eine Vielzahl von Testdatenpunkten erhalten wird, wobei jeder entsprechende Testdatenpunkt die Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen eine Messung der zentralen Tendenz eines anderen Merkmals in der Vielzahl von Merkmalen umfasst, die über eine entsprechende Vielzahl von Testaliquoten der Zellen bestimmt wird, die die jeweilige Teststörung in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen darstellen; Berechnen eines zusammengesetzten Testvektors, wobei der zusammengesetzte Testvektor zwischen einem ersten Punkt, der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Kontrolldatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, und einem zweiten Punkt, der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Testdatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, liegt; Erhalten einer Vielzahl von Abfragestörungsdatenpunkten, wobei jeder entsprechende Abfragestörungsdatenpunkt die Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz eines anderen Merkmals in der Vielzahl von Merkmalen umfasst, das über eine Vielzahl von Instanzen von Abfragestörungsaliquots der Zellen bestimmt wird, die eine jeweilige Teststörung in dem Satz von Teststörungen und eine erste Menge der Abfragestörung in einer entsprechenden Teilmenge der Vielzahl von Vertiefungen darstellen; und Berechnen eines Abfrage-Störungsvektors zwischen dem ersten Punkt und einem jeweiligen Maß der zentralen Tendenz über die Vielzahl von Abfrage-Störungsdatenpunkten für jede Dimension in der Vielzahl von Dimensionen.
  2. Computersystem nach Anspruch 1, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten, um: Ausgabe des Abfrage-Störungsvektors in einem für den Menschen sichtbaren Format.
  3. Computersystem nach Anspruch 1, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten, um: Berechnen eines On-Target-Werts für die Abfrage-Störung als Projektion des Abfrage-Störungsvektors auf den zusammengesetzten Testvektor.
  4. Computersystem nach Anspruch 3, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten, um: die Ausgabe des On-Target-Werts in einem für den Menschen sichtbaren Format.
  5. Computersystem nach Anspruch 1, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten, um: Berechnen eines Off-Target-Werts für die Abfrage-Störung als Ablehnung des Abfrage-Störungsvektors gegenüber dem zusammengesetzten Testvektor.
  6. Computersystem nach Anspruch 5, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten, um: die Bewertung des Off-Target-Werts für die Abfragestörung und damit die Bewertung der Abfragestörung.
  7. Computersystem nach Anspruch 6, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten für: Ausgabe des Off-Target-Werts und/oder der Ergebnisse der Auswertung des Off-Target-Werts in einem für den Menschen sichtbaren Format.
  8. Computersystem nach Anspruch 1, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten, um: Berechnen eines On-Target-Werts für die Abfrage-Störung als Projektion des Abfrage-Störungsvektors auf den zusammengesetzten Testvektor; Berechnen eines Off-Target-Werts für die Abfrage-Störung als Ablehnung des Abfrage-Störungsvektors gegenüber dem zusammengesetzten Testvektor; und die Bewertung des Off-Target-Werts für die Abfragestörung und damit die Bewertung der Abfragestörung.
  9. Computersystem nach Anspruch 8, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten, um: Wiederholen des Erhaltens der Vielzahl von Abfragestörungsdatenpunkten, des Berechnens eines Abfragestörungsvektors, des Berechnens des On-Target-Werts und des Berechnens des Off-Target-Werts für jede Abfragestörung in einer Vielzahl von Abfragestörungen; und wobei das Auswerten des Off-Target-Werts das Auftragen jeder jeweiligen Abfrage-Störung in der Vielzahl von Abfrage-Störungen auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für die jeweilige Abfrage-Störung als eine Koordinate in einer ersten Dimension des zweidimensionalen Diagramms und des Off-Target-Werts für die jeweilige Abfrage-Störung als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms umfasst, wobei das zweidimensionale Diagramm für Menschen sichtbar ist.
  10. Computersystem nach Anspruch 1, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten, um: Berechnen eines entsprechenden Kontrollvektors zwischen dem ersten Punkt und einem zweiten Punkt, der durch ein Maß der zentralen Tendenz über die Kontrolldatenpunkte, die mit der jeweiligen Kontrollstörung verbunden sind, für jede Dimension in der Vielzahl von Dimensionen definiert ist, für jede jeweilige Kontrollstörung in dem Satz von Kontrollstörungen, wodurch eine Vielzahl von Kontrollvektoren berechnet wird, Berechnen eines On-Target-Werts für jede Kontrollstörung als Projektion des entsprechenden Kontrollvektors aus der Vielzahl der Kontrollvektoren auf den zusammengesetzten Testvektor; Berechnen eines Off-Target-Werts für jede Kontrollstörung als Ablehnung des entsprechenden Kontrollvektors gegenüber dem zusammengesetzten Testvektor; und wobei die Auswertung weiterhin umfasst: Aufzeichnen jeder Kontrollstörung im Satz von Kontrollstörungen auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für die jeweilige Kontrollstörung als eine Koordinate in einer ersten Dimension und des Off-Target-Werts für die jeweilige Kontrollstörung als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms.
  11. Computersystem nach Anspruch 1, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten, um: Berechnen eines entsprechenden Kontrollvektors zwischen dem ersten Punkt für jede Dimension in der Vielzahl von Dimensionen und einem zweiten Punkt, der durch einen Wert eines entsprechenden Merkmals in der Vielzahl von Merkmalen definiert ist, der aus der jeweiligen Vertiefung bestimmt wurde, für jede entsprechende Vertiefung in der Vielzahl von Vertiefungen, die eine Kontrollstörung in dem Satz von Kontrollstörungen darstellt, wodurch eine Vielzahl von Kontrollvektoren berechnet wird, und Berechnen eines On-Target-Werts für jeden entsprechenden Kontrollvektor in der Vielzahl der Kontrollvektoren als Projektion des entsprechenden Kontrollvektors auf den zusammengesetzten Testvektor; Berechnen eines Off-Target-Werts für jeden jeweiligen Kontrollvektor in der Vielzahl der Kontrollvektoren als Ablehnung des jeweiligen Kontrollvektors gegenüber dem zusammengesetzten Testvektor; und wobei die Auswertung weiterhin umfasst: Aufzeichnen jedes jeweiligen Kontrollvektors in der Vielzahl von Kontrollvektoren auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für den jeweiligen Kontrollvektor als eine Koordinate in einer ersten Dimension und des Off-Target-Werts für den jeweiligen Kontrollvektor als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms.
  12. Computersystem nach Anspruch 1, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten, um: Berechnen eines entsprechenden Testvektors zwischen dem ersten Punkt für jede Dimension in der Vielzahl von Dimensionen und einem zweiten Punkt, der durch ein Maß der zentralen Tendenz über die Testdatenpunkte definiert ist, die mit der jeweiligen Teststörung verbunden sind, für jede jeweilige Teststörung in dem Satz von Teststörungen, wodurch eine Vielzahl von Testvektoren berechnet wird, Berechnen eines On-Target-Werts für jede Teststörung als Projektion des entsprechenden Testvektors aus der Vielzahl der Testvektoren auf den zusammengesetzten Testvektor; Berechnen eines Off-Target-Werts für jede Teststörung als Ablehnung des entsprechenden Testvektors gegenüber dem zusammengesetzten Testvektor; und wobei die Auswertung weiterhin umfasst: Aufzeichnen jeder Teststörung im Satz von Teststörungen auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für die jeweilige Teststörung als eine Koordinate in einer ersten Dimension und des Off-Target-Werts für die jeweilige Teststörung als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms.
  13. Computersystem nach Anspruch 1, wobei das eine oder die mehreren Programme ferner Anweisungen enthalten, um: Berechnen eines entsprechenden Testvektors zwischen dem ersten Punkt für jede Dimension in der Vielzahl von Dimensionen und einem zweiten Punkt, der durch eine Messung eines entsprechenden Merkmals in der Vielzahl von Merkmalen in der jeweiligen Vertiefung definiert ist, für jede jeweilige Vertiefung in der Vielzahl von Vertiefungen, die eine Teststörung in dem Satz von Teststörungen darstellt, wodurch eine Vielzahl von Testvektoren berechnet wird, und Berechnen eines On-Target-Werts für jeden entsprechenden Testvektor in der Vielzahl von Testvektoren als Projektion des entsprechenden Testvektors auf den zusammengesetzten Testvektor; Berechnen eines Off-Target-Werts für jeden jeweiligen Testvektor in der Vielzahl von Testvektoren als eine Ablehnung des jeweiligen Testvektors gegenüber dem zusammengesetzten Testvektor; und wobei das Auswerten weiterhin umfasst: Aufzeichnen jedes jeweiligen Testvektors in der Vielzahl von Testvektoren auf einem zweidimensionalen Diagramm unter Verwendung des On-Target-Werts für den jeweiligen Testvektor als eine Koordinate in einer ersten Dimension und des Off-Target-Werts für den Testvektor als eine Koordinate in einer zweiten Dimension des zweidimensionalen Diagramms.
  14. Computersystem nach Anspruch 1, wobei der Satz von Kontrollstörungen aus einer Vielzahl von Kontroll-siRNA besteht, die die Expression eines mit dem Testzustand assoziierten Gens nicht direkt beeinflussen.
  15. Computersystem nach Anspruch 1, wobei der Satz von Teststörungen aus einer Vielzahl von Ziel-siRNA besteht, die die Expression eines mit dem Testzustand verbundenen Gens direkt beeinflussen.
  16. Computersystem nach Anspruch 1, wobei jedes Merkmal aus einer Kombination von messbaren Eigenschaften abgeleitet ist, die aus einer Farbe, einer Textur und einer Größe eines Zellkontextes oder eines aufgezählten Teils des Zellkontextes ausgewählt sind.
  17. Computersystem nach Anspruch 1, wobei die Gewinnung von Kontrolldatenpunkten umfasst: Abbilden einer entsprechenden Vertiefung in der Vielzahl von Vertiefungen, um ein entsprechendes zweidimensionales gepixeltes Bild mit einer entsprechenden Vielzahl von nativen Pixelwerten zu bilden, und wobei ein unterschiedliches Merkmal in der Vielzahl von Merkmalen des Erhaltens von Kontrolldatenpunkten als ein Ergebnis einer Faltung oder einer Reihe von Faltungen und Pooling-Operatoren entsteht, die gegen native Pixelwerte in einer entsprechenden Vielzahl von nativen Pixelwerten des entsprechenden zweidimensionalen gepixelten Bildes ausgeführt werden.
  18. Computersystem nach Anspruch 1, wobei jedes Merkmal in der Vielzahl von Merkmalen anhand eines optisch gemessenen Merkmals bestimmt wird.
  19. Computersystem nach Anspruch 1, wobei: eine erste Teilmenge der Vielzahl von Merkmalen aus optisch gemessenen Merkmalen bestimmt wird; und eine zweite Teilmenge der Vielzahl von Merkmalen aus nicht optisch gemessenen Merkmalen bestimmt wird.
  20. Computersystem nach Anspruch 1, wobei jedes Merkmal in der Vielzahl von Merkmalen aus einem nicht optisch gemessenen Merkmal bestimmt wird.
  21. Verfahren zur Auswertung einer Abfragestörung in einem zellbasierten Assay, der einen Testzustand darstellt, wobei der zellbasierte Assay eine Vielzahl von Vertiefungen in einer oder mehreren Multiwell-Platten umfasst, wobei das Verfahren umfasst: Erhalten eines entsprechenden Kontrolldatenpunkts für jede jeweilige Kontrollstörung in einem Satz von Kontrollstörungen, wodurch eine Vielzahl von Kontrolldatenpunkten erhalten wird, wobei jeder entsprechende Kontrolldatenpunkt eine Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz eines anderen Merkmals in einer Vielzahl von Merkmalen darstellt, das über eine entsprechende Vielzahl von Kontrollaliquoten von Zellen in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen bestimmt wird, die die jeweilige Kontrollstörung darstellen; Erhalten eines entsprechenden Testdatenpunkts für jede jeweilige Teststörung in einem Satz von einer oder mehreren Teststörungen, wodurch eine Vielzahl von Testdatenpunkten erhalten wird, wobei jeder entsprechende Testdatenpunkt die Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen eine Messung der zentralen Tendenz eines anderen Merkmals in der Vielzahl von Merkmalen umfasst, die über eine entsprechende Vielzahl von Testaliquoten der Zellen bestimmt wird, die die jeweilige Teststörung in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen darstellen; Berechnen eines zusammengesetzten Testvektors, wobei der zusammengesetzte Testvektor zwischen (i) einem ersten Punkt, der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Kontrolldatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, und (ii) einem zweiten Punkt, der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Testdatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, liegt; Erhalten einer Vielzahl von Abfragestörungsdatenpunkten, wobei jeder entsprechende Abfragestörungsdatenpunkt die Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz eines anderen Merkmals in der Vielzahl von Merkmalen umfasst, das über eine Vielzahl von Instanzen von Abfragestörungsaliquots der Zellen bestimmt wird, die eine jeweilige Teststörung in dem Satz von Teststörungen und eine erste Menge der Abfragestörung in einer entsprechenden Teilmenge der Vielzahl von Vertiefungen darstellen; und Berechnen eines Abfrage-Störungsvektors zwischen dem ersten Punkt und einem jeweiligen Maß der zentralen Tendenz über die Vielzahl von Abfrage-Störungsdatenpunkten für jede Dimension in der Vielzahl von Dimensionen.
  22. Nicht-transitorisches, computerlesbares Speichermedium und ein oder mehrere darin eingebettete Computerprogramme zur Auswertung einer Abfragestörung in einem zellbasierten Assay, der einen Testzustand darstellt, wobei der zellbasierte Assay eine Vielzahl von Vertiefungen in einer oder mehreren Multiwell-Platten umfasst, wobei das eine oder die mehreren Computerprogramme Anweisungen umfassen, die, wenn sie von einem Computersystem ausgeführt werden, das Computersystem veranlassen, ein Verfahren durchzuführen, das Folgendes umfasst: Erhalten eines entsprechenden Kontrolldatenpunkts für jede jeweilige Kontrollstörung in einem Satz von Kontrollstörungen, wodurch eine Vielzahl von Kontrolldatenpunkten erhalten wird, wobei jeder entsprechende Kontrolldatenpunkt eine Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz eines anderen Merkmals in einer Vielzahl von Merkmalen darstellt, das über eine entsprechende Vielzahl von Kontrollaliquoten von Zellen in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen bestimmt wird, die die jeweilige Kontrollstörung darstellen; Erhalten eines entsprechenden Testdatenpunkts für jede jeweilige Teststörung in einem Satz von einer oder mehreren Teststörungen, wodurch eine Vielzahl von Testdatenpunkten erhalten wird, wobei jeder entsprechende Testdatenpunkt die Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen eine Messung der zentralen Tendenz eines anderen Merkmals in der Vielzahl von Merkmalen umfasst, die über eine entsprechende Vielzahl von Testaliquoten der Zellen bestimmt wird, die die jeweilige Teststörung in entsprechenden Vertiefungen in der Vielzahl von Vertiefungen darstellen; Berechnen eines zusammengesetzten Testvektors, wobei der zusammengesetzte Testvektor zwischen (i) einem ersten Punkt, der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Kontrolldatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, und (ii) einem zweiten Punkt, der durch ein jeweiliges Maß der zentralen Tendenz über die Vielzahl von Testdatenpunkten für jede Dimension in der Vielzahl von Dimensionen definiert ist, liegt; Erhalten einer Vielzahl von Abfragestörungsdatenpunkten, wobei jeder entsprechende Abfragestörungsdatenpunkt die Vielzahl von Dimensionen umfasst, wobei jede Dimension in der Vielzahl von Dimensionen ein Maß der zentralen Tendenz eines anderen Merkmals in der Vielzahl von Merkmalen umfasst, das über eine Vielzahl von Instanzen von Abfragestörungsaliquots der Zellen bestimmt wird, die eine jeweilige Teststörung in dem Satz von Teststörungen und eine erste Menge der Abfragestörung in einer entsprechenden Teilmenge der Vielzahl von Vertiefungen darstellen; und Berechnen eines Abfrage-Störungsvektors zwischen dem ersten Punkt und einem jeweiligen Maß der zentralen Tendenz über die Vielzahl von Abfrage-Störungsdatenpunkten für jede Dimension in der Vielzahl von Dimensionen.
DE112020002936.0T 2019-06-19 2020-06-18 Systeme und verfahren zur auswertung von abfragestörungen Pending DE112020002936T5 (de)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201962863711P 2019-06-19 2019-06-19
US201962863700P 2019-06-19 2019-06-19
US201962863696P 2019-06-19 2019-06-19
US201962863414P 2019-06-19 2019-06-19
US62/863,700 2019-06-19
US62/863,696 2019-06-19
US62/863,711 2019-06-19
US62/863,414 2019-06-19
PCT/US2020/038500 WO2020257501A1 (en) 2019-06-19 2020-06-18 Systems and methods for evaluating query perturbations

Publications (1)

Publication Number Publication Date
DE112020002936T5 true DE112020002936T5 (de) 2022-04-07

Family

ID=74038342

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112020002936.0T Pending DE112020002936T5 (de) 2019-06-19 2020-06-18 Systeme und verfahren zur auswertung von abfragestörungen

Country Status (3)

Country Link
US (2) US11715551B2 (de)
DE (1) DE112020002936T5 (de)
WO (1) WO2020257501A1 (de)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4085391A4 (de) * 2020-01-02 2024-06-05 Spring Discovery, Inc. Verfahren, systeme und instrumente für anwendungen im zusammenhang mit langlebigkeit
US11033516B1 (en) 2020-09-18 2021-06-15 Spring Discovery, Inc. Combination therapies with disulfiram
GB202107576D0 (en) * 2021-05-27 2021-07-14 Univ Dublin Molecular evaluation methods
US20220397565A1 (en) * 2021-06-10 2022-12-15 Recursion Pharmaceuticals, Inc. Methods of screening and related systems

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US276686A (en) 1883-05-01 Wagon-brake

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7657379B2 (en) 2000-07-05 2010-02-02 Microsoft Corporation Methods and systems for determining the biological function of cell constituents using response profiles
CA2785835C (en) * 2010-01-12 2020-10-20 Rigel Pharmaceuticals, Inc. Mode of action screening method
US10769501B1 (en) * 2017-02-15 2020-09-08 Google Llc Analysis of perturbed subjects using semantic embeddings
US10146914B1 (en) 2018-03-01 2018-12-04 Recursion Pharmaceuticals, Inc. Systems and methods for evaluating whether perturbations discriminate an on target effect
US20200020419A1 (en) 2018-07-16 2020-01-16 Flagship Pioneering Innovations Vi, Llc. Methods of analyzing cells

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US276686A (en) 1883-05-01 Wagon-brake

Also Published As

Publication number Publication date
US20200402628A1 (en) 2020-12-24
US11715551B2 (en) 2023-08-01
US20230386632A1 (en) 2023-11-30
WO2020257501A1 (en) 2020-12-24

Similar Documents

Publication Publication Date Title
Bakken et al. Comparative cellular analysis of motor cortex in human, marmoset and mouse
Cao et al. The single-cell transcriptional landscape of mammalian organogenesis
Alavattam et al. Attenuated chromatin compartmentalization in meiosis and its maturation in sperm development
Jung et al. Unified single-cell analysis of testis gene regulation and pathology in five mouse strains
DE112020002936T5 (de) Systeme und verfahren zur auswertung von abfragestörungen
US11791019B2 (en) Systems and methods for high throughput compound library creation
Waldhaus et al. Quantitative high-resolution cellular map of the organ of Corti
TWI831766B (zh) 用於區別對靶標之效應的系統及方法
Rube et al. Sequence features accurately predict genome-wide MeCP2 binding in vivo
Culibrk et al. Systems biology approaches for host–fungal interactions: An expanding multi-omics frontier
Galan et al. CHESS enables quantitative comparison of chromatin contact data and automatic feature extraction
WO2014152939A1 (en) Methods and systems for identifying a physiological state of a target cell
Gouwens et al. Toward an integrated classification of neuronal cell types: morphoelectric and transcriptomic characterization of individual GABAergic cortical neurons
Fabre et al. Heterogeneous combinatorial expression of Hoxd genes in single cells during limb development
Maamar et al. Transgenerational disease specific epigenetic sperm biomarkers after ancestral exposure to dioxin
Sarro et al. Disrupting the three-dimensional regulatory topology of the Pitx1 locus results in overtly normal development
Komissarov et al. B Chromosomes of the Asian seabass (Lates calcarifer) contribute to genome variations at the level of individuals and populations
US20210071256A1 (en) Systems and methods for pairwise inference of drug-gene interaction networks
Han et al. Transcriptome analysis of testicular aging in mice
Jevitt et al. Modeling notch-induced tumor cell survival in the drosophila ovary identifies cellular and transcriptional response to nuclear nicd accumulation
Alinejad-Rokny et al. MaxHiC: robust estimation of chromatin interaction frequency in Hi-C and capture Hi-C experiments
Vainshelbaum et al. Meta-Analysis of cancer triploidy: rearrangements of genome complements in male human tumors are characterized by XXY karyotypes
US20220155281A1 (en) Process control in cell based assays
Gazo et al. Transcriptome and proteome analyses reveal stage-specific DNA damage response in embryos of sturgeon (Acipenser ruthenus)
Chikarmane Coordinated Activation of the Androgen Receptor Transcriptional Program in Prostate Cancer

Legal Events

Date Code Title Description
R012 Request for examination validly filed