DE102013221669A1 - Genaue Simulation von aus einer Rekombination von Eltern stammenden Nachkommen - Google Patents
Genaue Simulation von aus einer Rekombination von Eltern stammenden Nachkommen Download PDFInfo
- Publication number
- DE102013221669A1 DE102013221669A1 DE102013221669.6A DE102013221669A DE102013221669A1 DE 102013221669 A1 DE102013221669 A1 DE 102013221669A1 DE 102013221669 A DE102013221669 A DE 102013221669A DE 102013221669 A1 DE102013221669 A1 DE 102013221669A1
- Authority
- DE
- Germany
- Prior art keywords
- positions
- crossover
- chromosome
- additional
- simulated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
- G16B5/20—Probabilistic models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Physiology (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
- Hintergrund
- Die vorliegende Erfindung betrifft das Gebiet der Bioinformatik (computational biology) im Allgemeinen und ein Simulieren von aus einer Rekombination von Eltern stammenden Nachkommen im Besonderen.
- Bei der Fortpflanzung von diploiden Organismen treten Crossover-Ereignisse (crossovers) häufig während der Meiose auf. Daher erhalten Nachkommen nicht immer vollständige Kopien der Chromosomen ihrer Eltern. Stattdessen ist das von einem Elter geerbte genetische Material oftmals eine Kombination von Segmenten aus den beiden in diesem Elter vorhandenen Chromosomen, d. h. eine Kombination aus den beiden Haplotypen des Elters (und Ähnliches gilt für vom anderen Elter geerbtes Material). Die Simulation der Crossover-Ereignisse in einem Chromosom ist eine grundlegende Komponente eines Simulators für Populationsevolution, wobei die Population (neutral) unter Selektion stehen kann. Ein Individuum aus einer diploiden Population bezieht sein genetisches Material aus seinen beiden Eltern, und das Interesse richtet sich auf die Untersuchung dieser Fragmentierung und Verteilung des Elternmaterials in den Nachkommen. Da das Crossover-Ereignis das vorherrschende Ereignis im Simulator ist, legt es zum einen die Genauigkeit des Simulators fest und steuert letztendlich auch dessen Ausführungsgeschwindigkeit.
- Kurzdarstellung
- In einer Ausführungsform wird ein auf einem Computer implementiertes Verfahren zum Simulieren von Crossover-Ereignissen auf einem Chromosom offenbart. Das auf einem Computer implementierte Verfahren beinhaltet ein Festlegen einer Anzahl Y von Positionen durch einen Prozessor, welche auf einem simulierten Chromosom ausgewählt werden müssen. Das simulierte Chromosom hat eine genetische Länge L mit einer Crossover-Häufigkeit p. Die Y Positionen j1, ..., jy auf dem simulierten Chromosom werden auf der Grundlage des Festlegens ausgewählt. Ein Crossover-Ereignis wird an einer oder mehreren der Positionen j1, ..., jy platziert, die ausgehend davon, dass Y größer als 0 ist, ausgewählt wurden. Es wird eine zusätzliche Anzahl Y' von Positionen j'1, ..., j'y festgelegt, die auf dem simulierten Chromosom ausgewählt werden müssen. Die Y' zusätzlichen Positionen j'1, ..., j'y auf dem simulierten Chromosom werden auf der Grundlage des Festlegens ausgewählt. Ein zusätzliches Crossover-Ereignis wird an einer oder mehreren der zusätzlichen Positionen j'1, ..., j'y platziert, die ausgehend davon, dass Y größer als 0 ist und eine der einen oder den mehreren zusätzlichen Positionen j'1, ..., j'y zugehörige Nachbarschaft t frei von Crossover-Ereignissen ist. Ein Satz von Crossover-Ereignisorten auf dem simulierten Chromosom wird auf der Grundlage der null oder mehr der Positionen j1, ..., jy und der null oder mehr der zusätzlichen Positionen j'1, ..., j'y ermittelt, an denen ein Crossover-Ereignis platziert wurde.
- In einer anderen Ausführungsform wird ein Datenverarbeitungssystem zum Simulieren von Crossover-Ereignissen auf einem Chromosom offenbart. Das Datenverarbeitungssystem beinhaltet einen Speicher und einen Prozessor, der zum Datenaustausch mit dem Speicher verbunden ist. Ein Nachkommensimulationsmodul (progeny simulation module) ist zum Datenaustausch mit dem Speicher und dem Prozessor verbunden. Das Nachkommensimulationsmodell ist so konfiguriert, dass es ein Verfahren ausführt. Das Verfahren beinhaltet ein Festlegen einer Anzahl Y von auf einem simulierten Chromosom auszuwählenden Positionen durch einen Prozessor. Das simulierte Chromosom hat eine genetische Länge L mit einer Crossover-Häufigkeit p. Die Y Positionen j1, ..., jy auf dem simulierten Chromosom werden auf der Grundlage des Festlegens ausgewählt. Ein Crossover-Ereignis wird an einer oder mehreren der Positionen j1, ..., jy platziert, die ausgehend davon, dass Y größer als 0 ist, ausgewählt wurden. Es wird eine zusätzliche Anzahl Y' von auf dem simulierten Chromosom auszuwählenden Positionen j'1, ..., j'y festgelegt.
- Die Y' zusätzlichen Positionen j'1, ..., j'y auf dem simulierten Chromosom werden auf der Grundlage des Festlegens ausgewählt. Ein zusätzliches Crossover-Ereignis wird an einer oder mehreren der zusätzlichen Positionen j'1, ..., j'y platziert, die ausgehend davon, dass Y größer als 0 ist und eine der einen oder mehreren der zusätzlichen Positionen j'1, ..., j'y zugehörige Nachbarschaft t frei von Crossover-Ereignissen ist, ausgewählt wurden. Ein Satz von Crossover-Ereignisorten auf dem simulierten Chromosom wird auf der Grundlage der null oder mehreren der Positionen j1, ..., jy und der null oder mehreren der zusätzlichen Positionen j'1, ..., j'y ermittelt, an denen ein Crossover-Ereignis platziert wurde.
- In einer weiteren Ausführungsform wird ein Computerprogrammprodukt zum Simulieren von Crossover-Ereignissen auf einem Chromosom offenbart. Das Computerprogrammprodukt beinhaltet ein Speichermedium, das von einer Verarbeitungsschaltung gelesen werden kann und Befehle zur Ausführung durch die Verarbeitungsschaltung speichern kann, um ein Verfahren auszuführen. Das Verfahren beinhaltet ein Festlegen einer Anzahl Y von auf einem simulierten Chromosom auszuwählenden Positionen durch einen Prozessor. Das simulierte Chromosom hat eine genetische Länge L mit einer Crossover-Häufigkeit p. Die Y Positionen j1, ..., jy auf dem simulierten Chromosom werden auf der Grundlage des Festlegens ausgewählt. Ein Crossover-Ereignis wird an einer oder mehreren der Positionen j1, ..., jy platziert, die ausgehend davon, dass Y größer als 0 ist, ausgewählt wurden. Es wird eine zusätzliche Anzahl Y' von auf dem simulierten Chromosom auszuwählenden Positionen j'1, ..., j'y festgelegt. Die Y' zusätzlichen Positionen j'1, ..., j'y auf dem simulierten Chromosom werden auf der Grundlage des Festlegens ausgewählt. Ein zusätzliches Crossover-Ereignis wird an einer oder mehreren der zusätzlichen Positionen j'1, ..., j'y platziert, die ausgehend davon, dass Y größer als 0 ist und eine der einen oder mehreren der zusätzlichen Positionen j'1, ..., j'y zugehörige Nachbarschaft t frei von Crossover-Ereignissen ist, ausgewählt wurden. Ein Satz von Crossover-Ereignisorten auf dem simulierten Chromosom wird auf der Grundlage der null oder mehreren der Positionen j1, ..., jy und der null oder mehreren der zusätzlichen Positionen j'1, ..., j'y ermittelt, an denen ein Crossover-Ereignis platziert wurde.
- Kurzbeschreibung der verschiedenen Ansichten der Zeichnungen
- Die beigefügten Figuren, in denen gleiche Bezugszeichen in den einzelnen Ansichten durchgehend identische oder funktionell ähnliche Elemente bezeichnen und die zusammen mit der folgenden ausführlichen Beschreibung in der Patentbeschreibung enthalten sind und einen Teil von dieser bilden, dienen zur weiteren Veranschaulichung von verschiedenen Ausführungsformen und zur Erläuterung von verschiedenen Grundgedanken und Vorteilen gemäß der vorliegenden Erfindung, wobei:
-
1 ein Blockschaltbild ist, das ein Beispiel einer Betriebsumgebung gemäß einer Ausführungsform der vorliegenden Erfindung veranschaulicht; -
2 ein Beispiel eines Chromosoms zeigt, das als Teil eines Nachkommensimulationsprozesses gemäß einer Ausführungsform der vorliegenden Erfindung simuliert wird; -
3 ein Crossover zeigt, das auf dem Chromosom von2 an einer Position innerhalb einer Nachbarschaft t eines Crossover vorhanden ist, welches als Teil des Simulationsprozesses gemäß einer Ausführungsform der vorliegenden Erfindung auf dem Chromosom platziert wurde; -
4 das Chromosom von2 zeigt, nachdem gemäß einer Ausführungsform der vorliegenden Erfindung zusätzliche Crossover auf diesem platziert wurden; -
5 ein Diagramm ist, das eine Positionskartierungsdistanz (location mapping distance) d als Funktion eines Rekombinationsfaktors (recombination factor) r für Lösungen in geschlossener Form gemäß den Modellen von Haldane und Kosambi und für beobachtete Daten, die gemäß einer oder mehreren Ausführungsformen der vorliegenden Erfindung erzeugt werden, zeigt; und -
6 ein Verarbeitungsablaufplan ist, der ein Beispiel eines Prozesses zum Simulieren von Crossover-Ereignissen auf einem Chromosom gemäß einer Ausführungsform der vorliegenden Erfindung veranschaulicht. - Ausführliche Beschreibung
- Verarbeitungsumgebung
-
1 veranschaulicht eine allgemeine Übersicht über eine Verarbeitungsumgebung100 zum Simulieren von aus der Rekombination von Eltern stammenden Nachkommen gemäß einer Ausführungsform der vorliegenden Erfindung. Insbesondere veranschaulicht1 ein Datenverarbeitungssystem102 , das in Ausführungsformen der vorliegenden Erfindung verwendet werden kann. Das in1 gezeigte Datenverarbeitungssystem102 ist lediglich ein Beispiel eines geeigneten Systems und soll nicht den Schutzumfang der Anwendung oder Funktionalität von Ausführungsformen der oben beschriebenen vorliegenden Erfindung einschränken. Das Datenverarbeitungssystem102 von1 kann eine beliebige der oben dargelegten Funktionen implementieren und/oder ausführen. Jedes geeignet konfigurierte Verarbeitungssystem kann in Ausführungsformen der vorliegenden Erfindung als Datenverarbeitungssystem102 verwendet werden. - Wie in
1 veranschaulicht wird, liegt das Datenverarbeitungssystem102 in Form einer Universal-Datenverarbeitungseinheit vor. Zu den Komponenten des Datenverarbeitungssystems102 können, ohne jedoch auf diese beschränkt zu sein, ein oder mehrere Prozessoren oder Verarbeitungseinheiten104 , ein Systemspeicher106 und ein Bus108 gehören, der verschiedene Systemkomponenten, unter anderem den Systemspeicher106 , mit dem Prozessor104 verbindet. - Der Bus
108 verkörpert einen oder mehrere eines beliebigen von verschiedenen Typen von Busstrukturen, unter anderem einen Speicherbus oder eine Speichersteuereinheit, einen peripheren Bus, einen beschleunigten Grafikanschluss (accelerated graphics port) und einen Prozessor- oder einen lokalen Bus, wobei eine beliebige aus einer Vielfalt von Busarchitekturen verwendet wird. Beispielsweise und ohne Einschränkung gehören zu solchen Architekturen der Industry-Standard-Architecture-(ISA-)Bus, der Micro-Channel-Architecture-(MCA-)Bus, der Enhanced-ISA-(EISA-)Bus, der lokale Video-Electronics-Standards-Association-(VESA-)Bus und der Peripheral-Component-Interconnect-(PCI-)Bus. - Der Systemspeicher
106 enthält in einer Ausführungsform ein Nachkommensimulationsmodul109 , das so konfiguriert ist, dass es Crossover-Ereignisse auf einem Chromosom simuliert. Es sei darauf hingewiesen, dass das Nachkommensimulationsmodul109 ein eigenständiges Modul oder Teil eines anderen Simulators sein kann wie beispielsweise (ohne jedoch darauf beschränkt zu sein) eines Nachkommensimulators, der so konfiguriert ist, dass er Nachkommen aus der Rekombination von Eltern simuliert. Das Nachkommensimulationsmodul109 wird im Folgenden ausführlicher erläutert. Zwar zeigt1 das Nachkommensimulationsmodul109 als im Hauptspeicher befindlich, das Nachkommensimulationsmodul109 kann sich jedoch im Prozessor104 befinden, eine gesonderte Hardware-Komponente sein und/oder über eine Vielzahl von Datenverarbeitungssystemen und/oder Prozessoren verteilt sein. - Der Systemspeicher
106 kann außerdem vom Computersystem lesbare Medien in Form eines flüchtigen Speichers wie beispielsweise eines Direktzugriffspeichers (RAM)110 und/oder eines Cachespeichers112 enthalten. Das Datenverarbeitungssystem102 kann außerdem andere austauschbare/nichtaustauschbare, flüchtige/nichtflüchtige Computersystem-Speichermedien aufweisen. Lediglich beispielhaft kann ein Speichersystem114 zum Lesen aus einem oder Schreiben auf ein nichtaustauschbares oder austauschbares, nichtflüchtiges Medium, beispielsweise eine oder mehrere SSD-Festplatten (solid state disks), und/oder magnetisches Medium (normalerweise als „Festplatte” bezeichnet) bereitgestellt werden. Es können ein Magnetplattenlaufwerk zum Lesen aus einer und Schreiben auf eine austauschbare, nichtflüchtige Magnetplatte (z. B. eine Diskette) und ein optisches Plattenlaufwerk zum Lesen aus einer oder Schreiben auf eine austauschbare, nichtflüchtige optische Platte, beispielsweise eine CD-ROM, DVD-ROM oder ein anderes optisches Medium, bereitgestellt werden. In solchen Fällen kann jedes durch eine oder mehrere Datenmedienschnittstellen mit dem Bus108 verbunden werden. Der Speicher106 kann mindestens ein Programmprodukt mit einem Satz von Programmmodulen enthalten, die so konfiguriert sind, dass sie die Funktionen einer Ausführungsform der vorliegenden Erfindung ausführen. - Beispielhaft und ohne auf diese beschränkt zu sein, können ein Programm/Dienstprogramm
116 mit einem Satz von Programmmodulen118 sowie ein Betriebssystem, ein oder mehrere Anwendungsprogramme, andere Programmmodule und Programmdaten im Speicher106 gespeichert sein. Das Betriebssystem, das eine oder die mehreren Anwendungsprogramme, die anderen Programmmodule und die Programmdaten oder eine Kombination aus diesen können jeweils eine Implementierung einer Vernetzungsumgebung aufweisen. Die Programmmodule118 führen im Allgemeinen die Funktionen und/oder Methodologien von Ausführungsformen der vorliegenden Erfindung aus. - Das Datenverarbeitungssystem
102 kann außerdem Daten austauschen mit einer oder mehreren externen Einheiten120 , beispielsweise einer Tastatur, einer Zeigereinheit, einer Anzeige122 usw.; mit einer oder mehreren Einheiten, die einem Benutzer die Interaktion mit dem Datenverarbeitungssystem102 ermöglichen; und/oder mit beliebigen Einheiten (z. B. Netzwerkkarte, Modem usw.), die dem Computersystem/Server102 den Datenaustausch mit einer oder mehreren anderen Datenverarbeitungseinheiten ermöglichen. Ein solcher Datenaustausch kann über Ein-/Ausgabe-Schnittstellen124 erfolgen. Außerdem kann das Datenverarbeitungssystem102 über einen Netzwerkadapter126 mit einem oder mehreren Netzwerken Daten austauschen, beispielsweise einem lokalen Netz (LAN), einem allgemeinen überregionalen Netz (WAN) und/oder einem öffentlichen Netz (z. B. dem Internet). Wie gezeigt wird, tauscht der Netzwerkadapter126 über den Bus108 Daten mit den anderen Komponenten des Datenverarbeitungssystems102 aus. Es können auch andere Hardware- und/oder Software-Komponenten in Verbindung mit dem Datenverarbeitungssystem102 verwendet werden. Zu Beispielen zählen, ohne jedoch auf diese beschränkt zu sein: Mikrocode, Einheitentreiber, redundante Verarbeitungseinheiten, externe Plattenlaufwerkanordnungen, RAID-Systeme, Bandlaufwerke und Speichersysteme zur Datenarchivierung. - Nachkommensimulation
- In einer Ausführungsform simuliert das Nachkommensimulationsmodul
109 Crossover-Ereignisse als Teil eines Nachkommensimulationsprozesses. Wie im Folgenden ausführlicher erläutert wird, verwendet das Nachkommensimulationsmodul109 als Eingabe eine Länge von einem oder mehreren Chromosomen. Bei jeder Chromosomenprobe entnimmt das Nachkommensimulationsmodul109 eine Anzahl von Positionen aus einer Poisson-Zufallsverteilung. Anschließend wählt das Nachkommensimulationsmodul109 auf der Grundlage der aus der Poisson-Zufallsverteilung entnommenen Zahl eine zufällige Position auf dem Chromosom aus. Das Nachkommensimulationsmodul109 platziert sodann an jeder Position ein Crossover. Wenn in irgendeiner der der ausgewählten Position vorangehenden t oder folgenden t Positionen ein Crossover vorliegt, entfernt das Nachkommensimulationsmodul109 das Crossover, das mit einer gegebenen Wahrscheinlichkeit an der ausgewählten Position platziert wurde. Anschließend wählt das Nachkommensimulationsmodell109 eine gegebene Anzahl von zusätzlichen Positionen aus einer Poisson-Verteilung aus. An jeder dieser zufällig ausgewählten zusätzlichen Positionen platziert das Nachkommensimulationsmodell109 sodann ein Crossover, wenn in den vorangehenden t oder den folgenden t Positionen kein Crossover vorhanden ist. Die ausgewählten Positionen, an denen Crossover-Ereignisse platziert und vom Nachkommensimulationsmodell109 nicht entfernt wurden, werden als die Orte von Crossover-Ereignissen im Chromosom ausgegeben. - Es folgt eine ausführliche Erläuterung zum Simulieren von Crossover-Ereignissen gemäß einer oder mehreren Ausführungsformen der vorliegenden Erfindung. Eine Crossover-Hypothese kann durch ein genaues mathematisches Modell M identifiziert werden. Wenn beispielsweise rij der Rekombinationsanteil zwischen Orten i und j auf dem Chromosom ist, dann ist
r13 = r12 + r23 – 2Cr12r23 (GL 1) r = 1 / 2(1 – e–2d) (GL 2) r = 1 / 2tanh2d (GL 3). - Selbst nach dem Identifizieren einer Crossover-Hypothese durch ein genaues mathematisches Modell M wie beispielsweise das oben in GL 1 gegebene Modell sind viele herkömmliche Simulatoren jedoch nicht in der Lage, alle Nachkommen auf eine Weise zu simulieren, die dem Modell M entspricht. Daher stellen eine oder mehrere Ausführungsformen ein Gerüst bereit, um Crossover-Ereignisse auf der Grundlage des mathematisches Modells von GL 1 mit einem sehr hohen Grad an Genauigkeit im Vergleich zu den Modellen von Haldane (C = 1) und Kosambi (C = 2r) zu erzeugen. Dieses Gerüst arbeitet mit einer generischen Interferenzfunktion der Form
C = f(r) (GL 4). - Eine ausführlichere Erläuterung des Haldane-Modells wird in J. B. S. Haldane: "The combination of linkage values, and the calculation of distance between linked factors", Journal of Genetics, 8: 299 bis 309, 1919, gegeben, das hiermit in seiner Gesamtheit durch Bezugnahme aufgenommen ist. Eine ausführlichere Beschreibung des Kosambi-Modells wird in D. D. Kosambi: "The estimation of map distance from recombination values", Journal of Genetics, 12(3): 172 bis 175, 1944, gegeben, das hiermit in seiner Gesamtheit durch Bezugnahme aufgenommen ist
-
- Der Parameter L ist die vom Nachkommensimulationsmodul
109 empfangene Eingabe und ist die Länge eines Chromosoms, die als Z Morgan oder Z × 100 centiMorgan (cM) definiert ist. In einer Ausführungsform wird von der Annahme ausgegangen, dass in einem Chromosomensegment der Länge 1 cM eine 1%ige Wahrscheinlichkeit für ein Crossover besteht. Diese Crossover-Häufigkeit wird als p = 0,01 codiert. Der Parameter t ist die Größe eines benachbarten Bereichs von Interesse auf dem simulierten Chromosom. In einer Ausführungsform ist der Parameter t = Xc und wird experimentell festgelegt, so dass sich ein Mittelwert von 16 ergibt. Xc ist eine Zufallsvariable, die aus einer einheitlichen Verteilung über [m, n] für m < n entnommen wird, wobei c = (m + n)/2. Ein Beispiel ist eine einheitliche diskrete Verteilung über [1,31] für t. Der Parameter a ist ein Skalierungsparameter für die Größe t des benachbarten Bereichs. In einer Ausführungsform ist der Parameter a = Xw und wird experimentell festgelegt, so dass sich ein Mittelwert von 1,1 ergibt. Xw ist eine Zufallsvariable, die aus einer einheitlichen Verteilung über [y, z] für y < z entnommen wird, wobei w = (y + z)/2. Ein Beispiel ist eine einheitliche stetige Verteilung über [1,0, 1,2] für a. Der Parameter q ist eine Wahrscheinlichkeit, die vom Nachkommensimulationsmodell109 verwendet wird, um zu entscheiden, ob Crossover-Ereignisse zugewiesen werden sollen, wenn Orten in der Nachbarschaft bereits andere Crossover-Ereignisse zugewiesen wurden (Interferenz). Bei Betrachtung der Funktion C von GL 4, kann q definiert werden als q = 1 – f(p). In diesem allgemeinen Gerüst werden a von GL 6 und t von GL 5 empirisch geschätzt, so dass sie den erwarteten r Kurven des Haldane- bzw. des Kosambi-Modells entsprechen. -
2 zeigt ein Beispiel eines Chromosoms200 , das vom Nachkommensimulationsmodul109 als Teil eines Meiose-Prozesses simuliert wird. Wie oben erläutert wird, verwendet das Nachkommensimulationsmodul109 als Eingabe eine Länge L eines Chromosoms. In einer Ausführungsform wird diese Länge von einem Benutzer festgelegt. Im aktuellen Beispiel empfängt das Nachkommensimulationsmodul109 von einem Benutzer (oder einer Anwendung) eine Länge von L = 500 cM. Das Nachkommensimulationsmodul109 empfängt in einer Ausführungsform außerdem eine Auswahl eines mathematischen Modells von dem Benutzer wie zum Beispiel des Haldane- oder Kosambi-Modells, das dem Crossover-Simulationsprozess zugrundegelegt werden muss. Beispielsweise wählt der Benutzer aus, ob C = 1 (keine Interferenz) oder C = 2r (Interferenz). - Das Nachkommensimulationsmodul
109 entnimmt eine Anzahl Y von Positionen aus einer Poisson-Verteilung mit dem Mittelwert λ = pL. Im vorliegenden Beispiel ist Y = 5, p = 0,01, L = 500 und λ = 5. Das Nachkommensimulationsmodul109 wählt auf der Grundlage der entnommenen Anzahl Y Positionen j1, ..., jy von 0 bis L (reale Zahlen, nicht auf ganze Zahlen begrenzt) auf dem Chromosom200 zufällig aus. An jeder der zufällig ausgewählten Positionen j1, ..., jy platziert das Nachkommensimulationsmodul109 ein Crossover-Ereignis. Im vorliegenden Beispiel wird dieser Prozess fünfmal ausgeführt, da Y = 5, wie in2 gezeigt wird.2 zeigt beispielsweise, dass das Crossover-Simulationsmodul109 ein Crossover-Ereignis (durch eine gestrichelte Linie dargestellt) an den Positionen j1202 , j2204 , j3206 , j4208 und j5210 platziert hat. Wenn der Benutzer eine Simulation ohne Interferenz ausgewählt hat (d. h. C = 1), gibt das Nachkommensimulationsmodul109 die Orte der Crossover-Ereignisse auf dem Chromosom200 aus. In diesem Beispiel gibt das Nachkommensimulationsmodul109 die Positionen j1202 , j2204 , j3206 , j4208 und j5210 als Orte der Crossover-Ereignisse aus. - Wenn der Benutzer jedoch eine Interferenzsimulation ausgewählt hat (d. h. C = 2r), berücksichtigt das Nachkommensimulationsmodul
109 die Nachbarschaft t cM einer aktuellen Position beim Platzieren eines Crossover-Orts. Wird beispielsweise ein Crossover-Ereignis an der Position j5 platziert, stellt das Nachkommensimulationsmodul109 fest, dass in der Nachbarschaft t cM der Position j5 mindestens ein weiteres Crossover vorhanden ist, wie in3 gezeigt wird.3 zeigt beispielsweise, dass an der Position j4, die innerhalb der Nachbarschaft t cM der Position j5 liegt, bereits ein Crossover vorhanden ist. Daher entfernt das Nachkommensimulationsmodul109 das Crossover an der Position j5 mit der Wahrscheinlichkeit q = 0,98. - Das Nachkommensimulationsmodul
109 entnimmt eine Anzahl von Y' zusätzlichen Positionen j'1, ..., j'y aus einer Poisson-Verteilung mit dem Mittelwert λ = p'L. Im vorliegenden Beispiel istmit a = 1,1 und t = 16 und λ = p'L ≈ (0,0019·500) = 0,95. Das Nachkommensimulationsmodul109 wählt für jedes Y', wobei in diesem Beispiel Y' = 1, eine Position j' von 0 bis L (eine reale Zahl, nicht auf ganze Zahlen begrenzt) auf dem Chromosom200 zufällig aus. Das Nachkommensimulationsmodul109 platziert ein Crossover-Ereignis an dieser zufällig ausgewählten Position j'1, wie in4 gezeigt wird.4 zeigt beispielsweise, dass das Nachkommensimulationsmodul109 ein zusätzliches Crossover an der Position j'1 platziert hat. Das Nachkommensimulationsmodul109 ermittelt, ob mindestens ein weiteres Crossover in der Nachbarschaft t cM der Position j'1 vorhanden ist. Im vorliegenden Beispiel gibt es innerhalb der Nachbarschaft t cM der Position j'1 kein weiteres Crossover. Daher wird das Crossover an der Position j'1 auf dem Chromosom platziert. Das Nachkommensimulationsmodul109 gibt sodann die Orte der Crossover-Ereignisse auf dem Chromosom aus. In diesem Beispiel gibt das Nachkommensimulationsmodul109 die Positionen j1, j2, j3, j4 und j'1 als Orte der Crossover-Ereignisse aus. - In einer Ausführungsform kann der oben erläuterte Crossover-Simulationsprozess auch angewandt werden, um die Crossover-Häufigkeit entlang eines Chromosoms zu verändern. Beispielsweise kann der Crossover-Simulationsprozess angewandt werden, wenn das Chromosom in Blöcke mit unterschiedlichen Crossover-Häufigkeiten unterteilt wird. In dieser Ausführungsform empfängt das Nachkommensimulationsmodul
109 als Eingabe die Crossover-Häufigkeiten p1, p2, ..., pL (0 ≤ pl < 1, l = 1, ..., L) und die Segmentlängen Z1, Z2, ..., ZL (Zl > 0). Aufgrund dieser Eingabe gibt das Nachkommensimulationsmodul109 die Orte von Crossover-Ereignissen R aus. Beispielsweise führt das Nachkommensimulationsmodul109 für l = 1, ..., L den oben erläuterten Crossover-Simulationsprozess unter Verwendung der Parameter Z = Zl und p = pl aus. Das Nachkommensimulationsmodul109 fügt dem Ergebnis R Crossover-Orte hinzu. Das Nachkommensimulationsmodul109 gibt eine Verkettung von Crossover-Positionen aus, und die genetische Länge des Chromosoms in cM beträgt 100 × Σlpl. -
5 zeigt die Übereinstimmung von r aus dem oben erläuterten Crossover-Simulationsprozess mit den erwarteten Werten (auf der Grundlage der Lösungen der geschlossenen Form). Insbesondere zeigt5 die Distanz d als Funktion des Rekombinationsanteils r für Lösungen der geschlossenen Form entsprechend dem Haldane- und Kosambi-Modell und für beobachtete Daten, die gemäß dem vom Nachkommensimulationsmodel109 ausgeführten Crossover-Simulationsprozess erzeugt wurden. Wie zu erkennen ist, stimmen die beobachteten Daten, die gemäß dem vom Nachkommensimulationsmodel109 ausgeführten Crossover-Simulationsprozess erzeugt wurden, mit einem sehr hohen Grad an Genauigkeit mit den erwarteten Werten des Haldane- und Kosambi-Modells überein. Außerdem sei cp die einer Entnahme aus einer Poisson-Verteilung und cu die einer Entnahme aus einer einheitlichen Verteilung zugehörige Zeit. Dann beträgt die erwartete Zeit, die vom obigen Algorithmus für jede Stichprobe benötigt wird, O(2cp + (Z + 1)cu) im Gegensatz zu O(100Zcu) bei einem herkömmlichen Algorithmus für einen ”chromosome walk”, der für jede cM-Position entscheiden würde, ob ein Crossover platziert werden soll oder nicht. - Verarbeitungsablaufpläne
-
6 ist ein Verarbeitungsablaufplan, der ein Beispiel eines Gesamtprozesses zum Simulieren von Crossover-Ereignissen auf einem Chromosom veranschaulicht. Der Verarbeitungsablaufplan beginnt beim Schritt602 und geht direkt zum Schritt604 . Das Nachkommensimulationsmodul109 legt beim Schritt604 eine Anzahl Y von auf einem simulierten Chromosom200 auszuwählenden Positionen fest. Das simulierte Chromosom200 hat eine genetische Länge L mit einer Crossover-Häufigkeit p. Das Nachkommensimulationsmodul109 wählt beim Schritt606 auf der Grundlage des Festlegens Y Positionen j1, ..., jy auf dem simulierten Chromosom200 aus. Das Nachkommensimulationsmodul109 platziert beim Schritt608 ein Crossover-Ereignis an einer oder mehreren der Positionen j1, ..., jy, die ausgehend davon, dass Y größer als 0 ist, ausgewählt wurden. Beispielsweise wird mindestens ein erstes Crossover-Ereignis an einer Position auf dem Chromosom platziert, da aktuell keine weiteren Crossover-Ereignisse auf dem Chromosom vorhanden sind. - Das Nachkommensimulationsmodul
109 legt beim Schritt610 eine zusätzliche Anzahl Y' von auf dem simulierten Chromosom200 auszuwählenden Positionen j1, ..., jy fest. Das Nachkommensimulationsmodul109 wählt im Schritt612 auf der Grundlage des Festlegens Y' zusätzliche Positionen auf dem simulierten Chromosom200 aus. Das Nachkommensimulationsmodul109 platziert im Schritt614 ein zusätzliches Crossover-Ereignis an einer oder mehreren der zusätzlichen Positionen j'1, ..., j'y, die ausgehend davon, dass Y' größer als 0 und eine der einen oder den mehreren zusätzlichen Positionen j'1, ..., j'y zugehörige Nachbarschaft t frei von Crossover-Ereignissen ist, ausgewählt wurden. Wenn beispielsweise aktuell ein Crossover-Ereignis an einer von mehreren Positionen innerhalb einer Nachbarschaft t der einen oder mehreren der zusätzlichen Positionen j'1, ..., j'y vorhanden ist, wird kein Crossover-Ereignis an der einen oder den mehreren der zusätzlichen Positionen j'1, ..., j'y platziert. Wenn aktuell jedoch keine Crossover-Ereignisse innerhalb einer Nachbarschaft t der einen oder mehreren der zusätzlichen Positionen vorhanden sind, wird ein Crossover-Ereignis an der einen oder mehreren der zusätzlichen Positionen j'1, ..., j'y platziert. Das Nachkommensimulationsmodul109 ermittelt beim Schritt616 einen Satz von Crossover-Ereignisorten auf dem simulierten Chromosom auf der Grundlage der einen oder mehreren der Positionen j1, ..., jy und der einen oder mehreren der zusätzlichen Positionen j'1, ..., j'y, an denen ein Crossover-Ereignis platziert worden ist. Die Ablaufsteuerung endet beim Schritt618 . - Nicht einschränkende Beispiele
- Wie für Fachleute klar ist, können Aspekte der vorliegenden Erfindung als System, Verfahren oder Computerprogrammprodukt verkörpert werden. Dementsprechend können Aspekte der vorliegenden Erfindung in Form einer kompletten Hardware-Ausführungsform, einer kompletten Software-Ausführungsform (darunter Firmware, residente Software, Mikrocode usw.) oder einer Ausführungsform vorliegen, die Software- und Hardware-Aspekte miteinander kombiniert, die hierin im Allgemeinen als „Schaltung”, „Modul” oder „System” bezeichnet werden können. Außerdem können Aspekte der vorliegenden Erfindung in Form eines Computerprogrammprodukts vorliegen, das in einem oder mehreren computerlesbaren Medien mit einem darin enthaltenen computerlesbaren Programmcode verkörpert ist.
- Es kann eine beliebige Kombination von einem oder mehreren computerlesbaren Medien verwendet werden. Das computerlesbare Medium kann ein computerlesbares Signalmedium oder ein computerlesbares Speichermedium sein. Bei dem computerlesbaren Speichermedium kann es sich zum Beispiel, ohne jedoch auf diese beschränkt zu sein, um ein elektronisches, magnetisches, optisches, elektromagnetisches, ein Infrarot- oder Halbleitersystem, eine Vorrichtung oder Einheit oder eine beliebige geeignete Kombination aus den vorgenannten handeln. Zu spezifischeren Beispielen (eine nicht erschöpfende Liste) für das computerlesbare Speichermedium würden die folgenden gehören: eine elektrische Verbindung mit einer oder mehreren Leitungen, eine tragbare Computerdiskette, eine Festplatte, ein Direktzugriffsspeicher (RAM), ein Nur-Lese-Speicher (ROM), ein löschbarer programmierbarer Nur-Lese-Speicher (EPROM oder Flash-Speicher), ein Lichtwellenleiter, ein tragbarer Kompaktdisk-Nur-Lese-Speicher (CD-ROM), eine optische Speichereinheit, eine magnetische Speichereinheit oder eine beliebige geeignete Kombination aus den vorgenannten. Im Kontext dieses Dokuments kann ein computerlesbares Speichermedium ein beliebiges physisches Medium sein, das ein Programm zur Verwendung durch ein oder in Verbindung mit einem Befehlsausführungssystem, einer Vorrichtung oder einer Einheit enthalten oder speichern kann.
- Zu einem computerlesbaren Signalmedium kann ein weitergeleitetes Datensignal mit einem darin enthaltenen computerlesbaren Programmcode gehören, beispielsweise in einem Basisband oder als Teil einer Trägerwelle. Ein solches weitergeleitetes Signal kann in einer Vielfalt von Formen vorliegen, unter anderem, ohne jedoch auf diese beschränkt zu sein, elektromagnetisch, optisch oder in einer beliebigen geeigneten Kombination davon. Ein computerlesbares Signalmedium kann ein beliebiges computerlesbares Medium sein, das kein computerlesbares Speichermedium ist und das ein Programm zur Verwendung durch ein oder in Verbindung mit einem Befehlsausführungssystem, einer Vorrichtung oder einer Einheit übertragen, weiterleiten oder transportieren kann.
- Ein in einem computerlesbaren Medium enthaltener Programmcode kann unter Verwendung eines beliebigen geeigneten Mediums übertragen werden, unter anderem, ohne jedoch auf diese beschränkt zu sein, drahtlos, drahtgebunden, über ein Lichtwellenleiterkabel, HF usw. oder eine beliebige geeignete Kombination aus den vorgenannten.
- Ein Computerprogrammcode zum Ausführen von Arbeitsgängen für Aspekte der vorliegenden Erfindung kann in einer beliebigen Kombination aus einer oder mehreren Programmiersprachen, unter anderem, ohne jedoch auf diese beschränkt zu sein, Java, Smalltalk, C++ oder dergleichen, und in herkömmlichen prozeduralen Programmiersprachen, beispielsweise der Programmiersprache „C” oder ähnlichen Programmiersprachen, geschrieben sein. Der Programmcode kann vollständig im Computer des Benutzers, teilweise im Computer des Benutzers, als ein eigenständiges Software-Paket, teilweise im Computer des Benutzers und teilweise in einem entfernt angeordneten Computer oder vollständig im entfernt angeordneten Computer oder Server ausgeführt werden. Im letzteren Szenario kann der entfernt angeordnete Computer durch einen beliebigen Typ von Netzwerk mit dem Computer des Benutzers verbunden sein, unter anderem durch ein lokales Netz (LAN), ein überregionales Netz (WAN), oder die Verbindung kann mit einem externen Computer (beispielsweise durch das Internet unter Verwendung eines Internet-Dienstanbieters) eingerichtet werden.
- Aspekte der vorliegenden Erfindung wurden oben unter Bezugnahme auf Ablaufplandarstellungen und/oder Blockschaubilder von Verfahren, Vorrichtungen (Systemen) und Computerprogrammprodukten gemäß verschiedenen Ausführungsformen der Erfindung beschrieben. Es versteht sich von selbst, dass jeder Block der Ablaufplandarstellungen und/oder Blockschaubilder und Kombinationen von Blöcken in den Ablaufplandarstellungen und/oder Blockschaubildern durch Computerprogrammbefehle implementiert werden können. Diese Computerprogrammbefehle können einem Prozessor eines Universalcomputers, eines Spezialcomputers oder einer anderen programmierbaren Datenverarbeitungsvorrichtung zugeführt werden, um eine Maschine zu erzeugen, so dass die Befehle, die über den Prozessor des Computers oder der anderen Datenverarbeitungsvorrichtung ausgeführt werden, ein Mittel zum Implementieren der im Block oder in den Blöcken der Ablaufpläne und/oder Blockschaubilder angegebenen Funktionen/Vorgänge erzeugen.
- Diese Computerprogrammbefehle können auch in einem computerlesbaren Medium gespeichert sein, das einen Computer, eine andere programmierbare Datenverarbeitungsvorrichtung oder andere Einheiten steuern kann, so dass diese auf eine bestimmte Weise funktionieren, so dass die im computerlesbaren Medium gespeicherten Befehle einen hergestellten Gegenstand erzeugen, der Befehle enthält, welche die Funktion/den Vorgang implementieren, die/der im Block oder in den Blöcken der Ablaufpläne und/oder Blockschaubilder angegeben ist.
- Die Computerprogrammbefehle können auch in einen Computer, eine andere programmierbare Datenverarbeitungsvorrichtung oder andere Einheiten geladen werden, um das Ausführen einer Reihe von Verarbeitungsschritten im Computer, in der anderen programmierbaren Datenverarbeitungsvorrichtung oder den anderen Einheiten zu veranlassen, um einen auf einem Computer implementierten Prozess zu erzeugen, so dass die Befehle, die im Computer oder in der anderen programmierbaren Datenverarbeitungsvorrichtung ausgeführt werden, Prozesse zum Implementieren der im Block oder in den Blöcken der Ablaufpläne und/oder Blockschaubilder angegebenen Funktionen/Vorgänge bereitstellen.
- Die hierin verwendete Terminologie dient lediglich zur Beschreibung bestimmter Ausführungsformen und soll die Erfindung nicht einschränken. Wie hierin verwendet, sollen die Singularformen „ein(e)” und „der/die/das” auch die Pluralformen mit einschließen, sofern aus dem Kontext nicht eindeutig etwas anderes hervorgeht. Außerdem versteht es sich von selbst, dass die Begriffe „aufweist” und/oder „aufweisend” bei Verwendung in dieser Beschreibung das Vorhandensein von dargelegten Merkmalen, ganzen Zahlen, Schritten, Vorgängen, Elementen und/oder Komponenten angeben, jedoch das Vorhandensein oder Hinzufügen von einem oder mehreren anderen Merkmalen, ganzen Zahlen, Schritten, Vorgängen, Elementen, Komponenten und/oder Gruppen von diesen nicht ausschließen.
- Die Beschreibung der vorliegenden Erfindung dient der Veranschaulichung und Beschreibung, soll jedoch nicht erschöpfend sein oder die Erfindung auf die offenbarte Form beschränken. Viele Modifikationen und Änderungen sind für Fachleute offensichtlich, ohne vom Schutzumfang und Gedanken der Erfindung abzuweichen. Die Ausführungsform wurde gewählt und beschrieben, um den Grundgedanken der Erfindung und die praktische Anwendung bestmöglich zu erläutern und anderen Fachleuten ein Verständnis der Erfindung für verschiedene Ausführungsformen mit verschiedenen Modifikationen zu ermöglichen, wie sie für die jeweils beabsichtigte Verwendung geeignet sind.
- ZITATE ENTHALTEN IN DER BESCHREIBUNG
- Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
- Zitierte Nicht-Patentliteratur
-
- J. B. S. Haldane: ”The combination of linkage values, and the calculation of distance between linked factors”, Journal of Genetics, 8: 299 bis 309, 1919 [0024]
- D. D. Kosambi: ”The estimation of map distance from recombination values”, Journal of Genetics, 12(3): 172 bis 175, 1944 [0024]
Claims (15)
- Auf einem Computer implementiertes Verfahren zum Simulieren von Crossover-Ereignissen auf einem Chromosom, wobei das auf einem Computer implementierte Verfahren aufweist: Festlegen einer Anzahl Y von auf einem simulierten Chromosom auszuwählenden Positionen durch einen Prozessor, wobei das simulierte Chromosom eine genetische Länge L mit einer Crossover-Häufigkeit p aufweist; auf Grundlage des Festlegens Auswählen von Y Positionen j1, ..., jy auf dem simulierten Chromosom; Platzieren eines Crossover-Ereignisses an einer oder mehreren der Positionen j1, ..., jy, die ausgehend davon, dass Y größer als 0 ist, ausgewählt wurden; Festlegen einer zusätzlichen Anzahl Y' von auf dem simulierten Chromosom auszuwählenden Positionen j'1, ..., j'y; auf der Grundlage des Festlegens Auswählen von Y' zusätzlichen Positionen j'1, ..., j'y auf dem simulierten Chromosom; Platzieren eines zusätzlichen Crossover-Ereignisses an einer oder mehreren der zusätzlichen Positionen j'1, ..., j'y, die ausgehend davon, dass Y' größer als 0 ist und eine der einen oder den mehreren der zusätzlichen Positionen j'1, ..., j'y zugehörige Nachbarschaft t frei von Crossover-Ereignissen ist, ausgewählt wurden; und Ermitteln eines Satzes von Crossover-Ereignisorten auf dem simulierten Chromosom auf Grundlage der einen oder mehreren der Positionen j1, ..., jy und der einen oder mehreren der zusätzlichen Positionen j'1, ..., j'y, an denen ein Crossover-Ereignis platziert wurde.
- Auf einem Computer implementiertes Verfahren nach Anspruch 1, das außerdem aufweist: Ermitteln für mindestens eine erste der Positionen j1, ..., jy, an denen ein Crossover-Ereignis platziert wurde, ob sich mindestens ein Crossover-Ereignis an einer Position auf dem simulierten Chromosom innerhalb einer Nachbarschaft t der ersten der Positionen j1, ..., jy befindet, wobei t = Xc, wobei Xc eine Zufallsvariable ist, die einer einheitlichen diskreten Verteilung über [m, n] entnommen wird, wobei m < n, wobei c = (m + n)/2; und Entfernen des an der ersten der Positionen j1, ..., jy platzierten Crossover-Ereignisses mit einer Wahrscheinlichkeit q = (1 – 2p) ausgehend davon, dass sich das mindestens ein Crossover-Ereignis an der Position auf dem simulierten Chromosom innerhalb der Nachbarschaft t befindet.
- Auf einem Computer implementiertes Verfahren nach Anspruch 2, wobei m = 1, n = 31 und c = 16.
- Auf einem Computer implementiertes Verfahren nach Anspruch 1, das außerdem aufweist: Feststellen für mindestens eine erste der zusätzlichen Positionen j'1, ..., j'y, an denen ein Crossover-Ereignis platziert wurde, ob sich mindestens ein Crossover-Ereignis an einer Position auf dem simulierten Chromosom innerhalb einer Nachbarschaft t der ersten der zusätzlichen Positionen j'1, ..., j'y befindet, wobei t = Xc, wobei Xc eine Zufallsvariable ist, die einer einheitlichen diskreten Verteilung über [m, n] entnommen wird, wobei m < n, wobei c = (m + n)/2; und Entfernen des an der ersten der zusätzlichen Positionen j'1, ..., j'y platzierten Crossover-Ereignisses mit einer Wahrscheinlichkeit q = (1 – 2p) ausgehend davon, dass sich das mindestens ein Crossover-Ereignis an der Position auf dem simulierten Chromosom innerhalb der Nachbarschaft t befindet.
- Auf einem Computer implementiertes Verfahren nach Anspruch 4, wobei m = 1, n = 31 und c = 16.
- Auf einem Computer implementiertes Verfahren nach Anspruch 1, wobei die Anzahl Y von Positionen j1, ..., jy aus einer Poisson-Verteilung mit einem Mittelwert λ = pL ausgewählt werden, wobei p = 0,01.
- Auf einem Computer implementiertes Verfahren nach Anspruch 6, wobei die Anzahl Y' von Positionen j'1, ..., j'y aus einer Poisson-Verteilung mit einem Mittelwert λ' = p'L ausgewählt werden undwobei q eine Wahrscheinlichkeit gleich (1 – 2p), a ein Skalierungsfaktor gleich Xw ist, wobei Xw eine Zufallsvariable ist, die einer einheitlichen stetigen Verteilung über [y, z] entnommen wird, wobei y < z, wobei w = (y + z)/2.
- Auf einem Computer implementiertes Verfahren nach Anspruch 7, wobei w = 1,1, y = 1,0 und z = 1,2.
- Auf einem Computer implementiertes Verfahren nach Anspruch 1, wobei die genetische Länge L eine Vielzahl von Segmentlängen Z1, Z2, ..., ZL (Zl > 0) aufweist, und wobei jede Segmentlänge Z1, Z2, ..., ZL eine entsprechende Crossover-Häufigkeit p1, p2, ..., pL (0 ≤ pl < 1, l = 1, ..., L) aufweist und wobei der Satz von Crossover-Ereignisorten eine Verkettung von Crossover-Positionen ist, die für jede Segmentlänge Z1, Z2, ..., ZL auf Grundlage von jeder der entsprechenden Crossover-Häufigkeiten p1, p2, ..., pL auf dem simulierten Chromosom platziert wurden.
- Datenverarbeitungssystem zum Simulieren von Crossover-Ereignissen auf einem Chromosom, wobei das Datenverarbeitungssystem aufweist: einen Speicher; einen Prozessor, der zum Datenaustausch mit dem Speicher verbunden ist; und ein Nachkommensimulationsmodul, das zum Datenaustausch mit dem Speicher und dem Prozessor verbunden ist, wobei das Nachkommensimulationsmodul so konfiguriert ist, dass es ein Verfahren ausführt, wobei das Verfahren aufweist: Festlegen einer Anzahl Y von auf einem simulierten Chromosom auszuwählenden Positionen durch einen Prozessor, wobei das simulierte Chromosom eine genetische Länge L mit einer Crossover-Häufigkeit p hat; auf der Grundlage des Festlegens Auswählen von Y Positionen j1, ..., jy auf dem simulierten Chromosom; Platzieren eines Crossover-Ereignisses an einer oder mehreren der Positionen j1, ..., jy, die ausgehend davon, dass Y größer als 0 ist, ausgewählt wurden; Festlegen einer zusätzlichen Anzahl Y' von auf dem simulierten Chromosom auszuwählenden Positionen j'1, ..., j'y; auf der Grundlage des Festlegens Auswählen von Y' zusätzlichen Positionen j'1, ..., j'y auf dem simulierten Chromosom; Platzieren eines zusätzlichen Crossover-Ereignisses an einer oder mehreren der zusätzlichen Positionen j'1, ..., j'y, die ausgehend davon, dass Y' größer als 0 ist und eine der einen oder den mehreren der zusätzlichen Positionen j'1, ..., j'y zugehörige Nachbarschaft t frei von Crossover-Ereignissen ist, ausgewählt wurden; und Ermitteln eines Satzes von Crossover-Ereignisorten auf dem simulierten Chromosom auf der Grundlage der einen oder mehreren der Positionen j1, ..., jy und der einen oder mehreren der zusätzlichen Positionen j'1, ..., j'y, an denen ein Crossover-Ereignis platziert wurde.
- Datenverarbeitungssystem nach Anspruch 10, wobei das Verfahren außerdem aufweist: Ermitteln für mindestens eine erste der Positionen j1, ..., jy, an denen ein Crossover-Ereignis platziert wurde, ob sich mindestens ein Crossover-Ereignis an einer Position auf dem simulierten Chromosom innerhalb einer Nachbarschaft t der ersten der Positionen j1, ..., jy befindet, wobei t = Xc, wobei Xc eine Zufallsvariable ist, die einer einheitlichen diskreten Verteilung über [m, n] entnommen wird, wobei m < n, wobei c = (m + n)/2; und Entfernen des an der ersten der Positionen j1, ..., jy platzierten Crossover-Ereignisses mit einer Wahrscheinlichkeit q = (1 – 2p) ausgehend davon, dass sich das mindestens ein Crossover-Ereignis an der Position auf dem simulierten Chromosom innerhalb der Nachbarschaft t befindet,
- Datenverarbeitungssystem nach Anspruch 10, wobei das Verfahren außerdem aufweist: Ermitteln für mindestens eine erste der zusätzlichen Positionen j'1, ..., j'y, an denen ein Crossover-Ereignis platziert wurde, ob sich mindestens ein Crossover-Ereignis an einer Position auf dem simulierten Chromosom innerhalb einer Nachbarschaft t der ersten der zusätzlichen Positionen j'1, ..., j'y befindet, wobei t = Xc, wobei Xc eine Zufallsvariable ist, die einer einheitlichen diskreten Verteilung über [m, n] entnommen wird, wobei m < n, wobei c = (m + n)/2; und Entfernen des an der ersten der zusätzlichen Positionen j'1, ..., j'y platzierten Crossover-Ereignisses mit einer Wahrscheinlichkeit q = (1 – 2p) ausgehend davon, dass sich das mindestens eine Crossover-Ereignis an der Position auf dem simulierten Chromosom innerhalb der Nachbarschaft t befindet.
- Datenverarbeitungssystem nach Anspruch 10, wobei die Anzahl Y von Positionen j1, ..., jy aus einer Poisson-Verteilung mit einem Mittelwert λ = pL ausgewählt werden, wobei p = 0,01, wobei die Anzahl Y' von Positionen j'1, ..., j'y aus einer Poisson-Verteilung mit einem Mittelwert λ' = p'L ausgewählt werden undwobei q eine Wahrscheinlichkeit gleich (1 – 2p), a ein Skalierungsfaktor gleich Xw ist, wobei Xw eine Zufallsvariable ist, die einer einheitlichen stetigen Verteilung über [y, z] entnommen wird, wobei y < z, wobei w = (y + z)/2.
- Datenverarbeitungssystem nach Anspruch 10, wobei die genetische Länge L eine Vielzahl von Segmentlängen Z1, Z2, ..., ZL (Zl > 0) aufweist und wobei jede Segmentlänge Z1, Z2, ..., ZL eine entsprechende Crossover-Häufigkeit p1, p2, ..., pL (0 ≤ pl < 1, l = 1, ..., L) hat und wobei der Satz von Crossover-Ereignisorten eine Verkettung von Crossover-Positionen ist, die für jede Segmentlänge Z1, Z2, ..., ZL auf der Grundlage von jeder der entsprechenden Crossover-Häufigkeiten p1, p2, ..., pL auf dem simulierten Chromosom platziert wurden.
- Nichtflüchtiges Computerprogrammprodukt zum Simulieren von Crossover-Ereignissen auf einem Chromosom, wobei das nichtflüchtige Computerprogrammprodukt aufweist: ein Speichermedium, das durch eine Verarbeitungsschaltung lesbar ist und Befehle zur Ausführung durch die Verarbeitungsschaltung speichert, um ein Verfahren nach einem der Ansprüche 1 bis 9 auszuführen.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/675,496 | 2012-11-13 | ||
US13/675,496 US20140136161A1 (en) | 2012-11-13 | 2012-11-13 | Precise simulation of progeny derived from recombining parents |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102013221669A1 true DE102013221669A1 (de) | 2014-06-12 |
Family
ID=50682543
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102013221669.6A Ceased DE102013221669A1 (de) | 2012-11-13 | 2013-10-24 | Genaue Simulation von aus einer Rekombination von Eltern stammenden Nachkommen |
Country Status (2)
Country | Link |
---|---|
US (2) | US20140136161A1 (de) |
DE (1) | DE102013221669A1 (de) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10468122B2 (en) * | 2012-06-21 | 2019-11-05 | International Business Machines Corporation | Exact haplotype reconstruction of F2 populations |
EP3261007A1 (de) | 2016-06-22 | 2017-12-27 | Vilmorin & Cie | Verbessertes computerimplementiertes verfahren zum testen von zuchtprogrammen |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7043461B2 (en) * | 2001-01-19 | 2006-05-09 | Genalytics, Inc. | Process and system for developing a predictive model |
-
2012
- 2012-11-13 US US13/675,496 patent/US20140136161A1/en not_active Abandoned
-
2013
- 2013-09-17 US US14/029,265 patent/US20140136166A1/en not_active Abandoned
- 2013-10-24 DE DE102013221669.6A patent/DE102013221669A1/de not_active Ceased
Non-Patent Citations (2)
Title |
---|
D. D. Kosambi: "The estimation of map distance from recombination values", Journal of Genetics, 12(3): 172 bis 175, 1944 |
J. B. S. Haldane: "The combination of linkage values, and the calculation of distance between linked factors", Journal of Genetics, 8: 299 bis 309, 1919 |
Also Published As
Publication number | Publication date |
---|---|
US20140136161A1 (en) | 2014-05-15 |
US20140136166A1 (en) | 2014-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE112018006189T5 (de) | Robuste gradienten-gewichtskomprimierungsschemata für deep-learning-anwendungen | |
EP3336800B1 (de) | Bestimmen einer trainingsfunktion zum generieren von annotierten trainingsbildern | |
DE102020211853A1 (de) | Effiziente gegnerische blackbox-angriffe unter ausnutzung einer eingabedatenstruktur | |
DE112018002822T5 (de) | Klassifizieren neuronaler netze | |
DE202017105184U1 (de) | Tiefes Maschinenlernen zum Ausführen einer Berührungsbewegungsvorhersage | |
DE112016004534T5 (de) | Nicht überwachtes Abgleichen in feinkörnigen Datensätzen zur Einzelansicht-Objektrekonstruktion | |
DE112018005205T5 (de) | Komprimierung von vollständig verbundenen / wiederkehrenden Schichten von einem oder mehreren tiefen Netzen durch Durchsetzen von räumlicher Lokalität für Gewichtsmatrizen und erwirken von Frequenzkomprimierung | |
DE102013213397A1 (de) | Verfahren und Vorrichtung zum Bereitstellen von Stützstellendaten für ein datenbasiertes Funktionsmodell | |
DE102018128289A1 (de) | Verfahren und vorrichtung für eine autonome systemleistung und zur einstufung | |
DE112021000392T5 (de) | Leistungsfähiges kommentieren der grundwahrheit | |
DE102019124018A1 (de) | Verfahren zum Optimieren von Tests von Regelsystemen für automatisierte Fahrdynamiksysteme | |
EP3462412A1 (de) | Bestimmen eines zweidimensionalen mammographiedatensatzes | |
DE102022110889A1 (de) | Halbüberwachtes training grober labels bei bildsegmentierung | |
DE102021124445A1 (de) | Metamerkmal-trainingsmodelle für maschinenlernalgorithmen | |
DE102019210507A1 (de) | Vorrichtung und computerimplementiertes Verfahren für die Verarbeitung digitaler Sensordaten und Trainingsverfahren dafür | |
DE102019203634A1 (de) | Verfahren und Vorrichtung zum Ansteuern eines Roboters | |
DE102014225039A1 (de) | Verfahren und Vorrichtung zum Bereitstellen von spärlichen Gauß-Prozess-Modellen zur Berechnung in einem Motorsteuergerät | |
DE102013221669A1 (de) | Genaue Simulation von aus einer Rekombination von Eltern stammenden Nachkommen | |
DE112021005925T5 (de) | Domänenverallgemeinerter spielraum über metalernen zur tiefen gesichtserkennung | |
DE112016007411T5 (de) | Fuzzy-eingabe für autoencoder | |
DE112012005532T5 (de) | Verfahren und Vorrichtung zum Verarbeiten von Daten dreidimensionaler Modelle | |
DE102018006332A1 (de) | Verfahren zum Ermitteln von Ampelschaltzeiten | |
DE102018217114A1 (de) | Verfahren und Anordnung zur Speicherbedarfsermittlung, um mittels einer Grafikprozessoreinheit auf FEM-Knotennetzen basierte Simulationen durchzuführen | |
DE102020212318A1 (de) | Fallpriorisierung für ein medizinisches System | |
DE112017008160T5 (de) | Sprachverarbeitungsvorrichtung, sprachverarbeitungssystem undsprachverarbeitungsverfahren |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R012 | Request for examination validly filed | ||
R082 | Change of representative |
Representative=s name: RICHARDT PATENTANWAELTE PARTG MBB, DE Representative=s name: LIFETECH IP SPIES DANNER & PARTNER PATENTANWAE, DE Representative=s name: SPIES DANNER & PARTNER PATENTANWAELTE PARTNERS, DE |
|
R016 | Response to examination communication | ||
R082 | Change of representative |
Representative=s name: RICHARDT PATENTANWAELTE PARTG MBB, DE Representative=s name: LIFETECH IP SPIES DANNER & PARTNER PATENTANWAE, DE |
|
R016 | Response to examination communication | ||
R002 | Refusal decision in examination/registration proceedings | ||
R003 | Refusal decision now final | ||
R081 | Change of applicant/patentee |
Owner name: GLOBALFOUNDRIES INC., KY Free format text: FORMER OWNER: INTERNATIONAL BUSINESS MACHINES CORPORATION, ARMONK, N.Y., US |
|
R082 | Change of representative |
Representative=s name: RICHARDT PATENTANWAELTE PARTG MBB, DE |
|
R081 | Change of applicant/patentee |
Owner name: GLOBALFOUNDRIES INC., KY Free format text: FORMER OWNER: GLOBALFOUNDRIES US 2 LLC (N.D.GES.DES STAATES DELAWARE), HOPEWELL JUNCTION, N.Y., US |
|
R082 | Change of representative |
Representative=s name: RICHARDT PATENTANWAELTE PARTG MBB, DE |