AT412476B - Verfahren zur herstellung eines virtuellen chromosoms - Google Patents

Verfahren zur herstellung eines virtuellen chromosoms Download PDF

Info

Publication number
AT412476B
AT412476B AT0143002A AT14302002A AT412476B AT 412476 B AT412476 B AT 412476B AT 0143002 A AT0143002 A AT 0143002A AT 14302002 A AT14302002 A AT 14302002A AT 412476 B AT412476 B AT 412476B
Authority
AT
Austria
Prior art keywords
chromosomes
virtual
chromosome
sequence
value
Prior art date
Application number
AT0143002A
Other languages
English (en)
Other versions
ATA14302002A (de
Inventor
Oskar A Prof Haas
Andreas Dipl Ing Schmidt
Original Assignee
Forsch Krebskranke Kinder
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Forsch Krebskranke Kinder filed Critical Forsch Krebskranke Kinder
Priority to AT0143002A priority Critical patent/AT412476B/de
Priority to EP03798163A priority patent/EP1563444A2/de
Priority to AU2003275968A priority patent/AU2003275968A1/en
Priority to PCT/EP2003/010254 priority patent/WO2004029747A2/en
Publication of ATA14302002A publication Critical patent/ATA14302002A/de
Application granted granted Critical
Publication of AT412476B publication Critical patent/AT412476B/de

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Data Mining & Analysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Description


   <Desc/Clms Page number 1> 
 



   Die vorliegende Erfindung betnfft ein Verfahren zur Herstellung eines virtuellen Chromosoms, das ein entsprechendes natürliches Chromosom repräsentiert, sowie ein virtuelles Chromosom oder einen Teil davon, das bzw. der durch seinem CG-Gehalt entsprechende Werte dargestellt ist, einen Satz von virtuellen Chromosomen oder Teilen davon und die Verwendung eines Satzes von virtuellen Chromosomen. 



   Das menschliche Genom ist in einer streng hierarchischen Struktur geordnet. Der Nucleus einer diploiden Zelle enthält etwa 2 3, 17 109 Nucleotidbasen, die in 46 innig verwickelten DNA- Fäden angeordnet sind, welche bei einer Zellteilung in Form von separaten Chromosomen sichtbar werden. Die spezifischen Merkmale dieser Chromosome, wie Zahl, Form, Struktur und Bände- rungsmuster, schaffen die Basis für ihre mikroskopische Bestimmung durch herkömmliche zytoge- netische Mittel. Diese Methode ist nach wie vor das wichtigste Screening-Werkzeug zur Identifika- tion von konstitutionellen sowie erworbenen Karyotyp-Anomalien. 



   Derzeit werden Karyotyp-Anomalien gemäss dem "Internationalen System für Humane Zytoge- netische Nomenklatur (ISCN)", einem System, das auf der diagrammartigen Darstellung von Chromosomen und ihren Bänderungsmustern beruht, beschrieben. Die Bandgrössen und ihre Verteilung in diesen so genannten Ideogrammen leiten sich aus dem Messwert von Trypsin/Giemsa-gefärbten Chromosenbildern ab, und ihre relative Färbungsintensität wird durch fünf verschiedene Schattierungen symbolisch dargestellt. Da die Anzahl von wahrnehmbaren Bändern auch von der veränderlichen Länge der jeweiligen Chromosome abhängt, stellen Ideo- gramme mit einer Bandauflösung von 400, 550 und 850 verschiedene Kondensationsstufen dar. 



   Verglichen mit den hoch ausgeklügelten Computer-Algorithmen und Software-Werzeugen, die für die Analyse und Evaluierung von molekulargenetischen Daten zur Verfügung stehen, haben sich jene zur Darstellung und Verarbeitung von zytogenetischen Daten innerhalb der letzten 20 Jahre kaum verändert. Einerseits reichte die ISCN-Nomenklatur für die begrenzte räumliche Auflösung der morphologischen Analysen, die resultierende inhärente subjektive Bandzuordnung und die Interpretation der sich daraus ergebenden Anomalien aus. Andererseits verhinderte diese beschreibende Natur bisher eine genauere und objektive Darstellung von zytogenetischen Daten und Daten der fluoreszierenden in situ Hybridisierung (FISH) und in der Folge auch ihre nahtlose Integration in bestehende DNA-Datenbanken.

   Während der letzten zwei Jahrzehnte wurden zahl- reiche Meta- und Interphasen-FISH-Technologien wie jene, bei denen heterogene Arten von se- quenzspezifischen Sonden, chromosomale Multifarben- und regionsspezifische Färbungssonden, vergleichende genomische Hybridisierung (CGH) und vergleichende exprimierte Sequenz- Hybridisierung (CESH) verwendet werden, verfügbar und wurden zu Mikroarray-Techniken weiter- entwickelt, die rein auf DNA und RNA basieren. Die Beschreibung der sich daraus ergebenden rasch ansammelnden molekulargenetischen Ergebnisse ist gemäss der derzeit verfügbaren zytoge- netischen und insbesondere FISH-Nomenklatur mühsam und mit Fehlern behaftet. Die Daten sind schwierig zu verarbeiten, und derzeit ist ihre Integration in eine gemeinsame molekularzytogeneti- sche Datenbank praktisch nicht möglich.

   Ein Ansatz aus jüngerer Zeit zur Überwindung dieser Hindernisse zumindest zu einem gewissen Grad besteht in der Definition von zytogenetischen Orientierungspunkten mit Hilfe von homogen beabstandeten FISH-Ankersonden entlang den Chromosomen und den entsprechenden Ideogrammen. 



   Es wird schon lange als gegeben anerkannt, dass das chromosomale Bänderungsmuster ab- wechselnd CG-reiche und CG-arme Sequenzabschnitte widerspiegelt. Nichtsdestotrotz herrschte die Ansicht vor, dass die Korrelation zwischen Chromosomenbändern und dem   CG-Gehait   insge- samt nur als ziemlich schwache Approximation betrachtet werden kann. In diesem Zusammenhang schien es höchst unwahrscheinlich, dass das Bänderungsphänomen einfach das Ergebnis von langbereichigen Veränderungen in der linearen Basenpaarzusammensetzung allein sein sollte. Es wurde vielmehr angenommen, dass das Bänderungsmuster signifikant von strukturellen Faktoren wie Faltung, Proteindeckung, DNA-Packung und-Kondensation sowie der Erreichbarkeit der DNA durch Farben mitbestimmt und modifiziert wird. 



   Schliesslich bekräftigte ein direkter Berechnungsvergleich zwischen dem sequenzspezifischen CG-Gehalt und dem speziellen Färbungsmuster, das jüngst möglich wurde, diesen Zusammen- hang weiter (Niimura und Gojobori ("In silico chromosome staining : Reconstruction of Giemsa bands from the whole human genome sequence", PNAS, Band 99, Nr. 2 (797-802)). Ihre   "in-silico-   Chromosomenfärbung" wurde mit Hilfe eines Verfahrens mit zwei Fenstern, einem lokalen Fenster 

 <Desc/Clms Page number 2> 

 von 2,5 mb und einem regionalen Fenster von 9,3 mb, erreicht, wobei die Beziehung zwischen dem CG-Gehalt im lokalen Fenster in Bezug auf den GC-Gehalt im regionalen Fenster berechnet wurde.

   Nach Niimura und Gojobori würde dieses Zweifenster-Verfahren besser eine in-silico- Färbung bewirken als die Giemsa-Bänderungsmuster nur durch den Unterschied in der Basenzu- sammensetzung zu erklären. Weiters wird angenommen, dass sich der Leistungsgrad verbessert würde, wenn der Unterschied eines Verdichtungsverhältnisses zwischen G- und R-Bändern be- rücksichtigt würde, wobei G-Bänder stärker kondensiert werden als R-Bänder. Durch eine Berech- nung von 10-kb-Fragmenten der menschlichen DNA-Sequenz und verschiedene Möglichkeiten statistischer Analysen fanden sie heraus, dass bei einem Bandniveau von 850 der CG-Gehalt und die Giemsa-Bändern entlang eines Chromosoms am besten bei einem lokalen Fenster von 2,5 Mb und einem regionalen Fenster von 9,3 Mb korrelierten.

   Die Grösse dieser Fenster wurde so ge- wählt, dass die Übereinstimmung zwischen in-silico- und Giemsa-Bändern optimiert wurde, doch stellten die Autoren auch fest, dass ihr Ansatz für feine Bänder, die kleiner als das lokale Fenster sind,   möglicherweise   nicht geeignet wären. Sie   gingen   jedoch davon aus, dass die Komelation zwischen Giemsa- und in-silico-Bändern durch eine Integration der Genom-weiten FISH- Kartierungsdaten weiter verbessert werden könnte. In dieser Veröffentlichung wurden jedoch keine Chromosome kondensiert, sondern Ideogramme berechnet und verglichen. Nach Niimura und Gojobori zeigen ihre Ergebnisse, dass Giemsa-Bänderungsmuster nur durch den Unterschied in der Basenzusammensetzung nicht erklärt werden können.

   Die Beziehung zwischen der Nukleotid- sequenz und zytogenen Bändern würde somit nach wie vor illusorisch bleiben. 



   Frühere Versuche, die zytogenetische Karte mit der Sequenz des menschlichen Genoms zu verknüpfen, konzentrierten sich auf einen Top-Down-Ansatz entweder durch die Abgrenzung von Bändergrenzen oder durch das Setzen von bandunabhängigen zytogenetischen Orientierungs- punkten mit spezifischen FISH-Sonden. Beispielsweise platzierte das "BAC Resource Consortium" 7. 600 solcher zytogenetisch definierter Orientierungspunkte auf dem Sequenzentwurf des mensch- lichen Genoms. Zwar sollten diese Marker unter anderem "auch eine strikte Beurteilung von Se- quenzunterschieden zwischen den dunklen und hellen Bänder von Chromosomen zulassen", doch wird ihre Lage nach wie vor auf Ideogrammen veranschaulicht, die nicht mit der DNA-Sequenz verknüpft sind.

   Desgleichen stellt das "Krebschromosomen-Aberrationsprojekt" (Cancer Chromo- some Aberration Project - CCAP) " ein zytogenetisches Koordinatensystem mit willkürlich definier- ten Intervallen auf Basis eines Ideogramms auf, um die Lage von Sequenz-verankerten FISH- Klonen aufzuzeigen. 



   In Jingwei et al. (PNAS 94 (1997), S. 6862-6867) wird allgemein der GC-Gehalt von Chromosomenteilen untersucht. 



   In der US 6 136 540 A wird ein Computerprogramm zum Auffinden genetischer Abnormitäten beschrieben, mit dem die subjektive Analyse von selektiv gefärbten Chromosomen vermieden werden kann. Gemäss diesem Dokument werden die chromosomalen Abnormitäten durch spezifi- sche Hybridisierungssonden (die mit Fluorophoren markiert sind) bestimmt und analysiert, wobei chromosomale Additionen, Deletionen, Amplifikationen, Translokationen und Umbildungen erkannt werden können. Obgleich gemäss diesem Dokument die Nachteile experimenteller Chromosomen- färbungen vermieden werden sollen bzw. deren Probleme bei der Reproduzierbarkeit, wird auch hierbei experimentell aufwendig, nämlich mit Fluorophor-markierten Hybridisierungssonden, gear- beitet, wodurch ebenfalls wiederum Reproduktionsschwierigkeiten und die experimentellen Nach- weisen inhärenten Ungenauigkeiten vorhanden sind. 



    Gemäss Daigo et al. (DNA Res. 6 (4) S. 227-233) wird der GC-Gehalt auf bestimmten   Abschnitten auf Chromosom 9 und 3 bestimmt und zwar nach konventionellen Methoden. 



   Der Artikel von Hraber et al. (Genome Biology 2(9) (2001), research 0037. 1-0037.14) betrifft eine Analysemöglichkeit zur Untersuchung von interspezifischen Wechselwirkungen in Sequenzen, die während der Wechselwirkung zwischen zwei Symbionten exprimiert werden, z.B. hinsichtlich ihres GC-Gehaltes. Dabei werden aber weder komplette grössere Bereiche des Genoms miteinan- der verglichen, noch konkret als Chromosomen dargestellt. 



   Ein Ziel der vorliegenden Erfindung ist daher die Schaffung eines Verfahrens zur Herstellung eines virtuellen Chromosoms, das ein genaues Bänderungsmuster auf skalenunabhängige und stark bereichspezifische Weise mit hoher Auflösung ermöglicht. Weiters sollten diese hergestellten virtuellen Chromosome nicht nur morphologische Informationen wie die herkömmlichen Ideogram- 

 <Desc/Clms Page number 3> 

 me oder ISCN-Bänder, sondern auch die entsprechenden genetischen Informationen, z. B. die Sequenzdaten, aufweisen. Ein solches virtuelles Chromosom, das die kompletten Sequenzdaten aufweist, mit den herkömmlichen Darstellungen von Chromosomen vergleichbar ist und eine hohe Auflösung hat, wurde bisher noch nicht erzeugt.

   Daher besteht ein weiteres Ziel der vorliegenden Erfindung in der Schaffung eines Chromosensatzes, der als Schnittstelle zwischen herkömmlichen Darstellungen von Chromosomen und genetischen Informationen und Sequenzdaten verwendet werden kann, um von einer DNA-Sequenz abgeleitete Daten und natürliche chromosomale Bände- rungsmuster direkt zu vergleichen. 



   Das Ziel der vorliegenden Anmeldung wird durch ein erfindungsgemässes Verfahren wie oben definiert erreicht, welches dadurch gekennzeichnet ist, dass es die folgenden Schritte umfasst: - Unterteilen von Sequenzdaten des natürlichen Chromosoms in Fraktionen mit einer Länge von mindestens 10. 000 bp, - Bestimmen des CG-Gehalts in jeder Fraktion, - Berechnen eines Werts zwischen einem Minimalwert und einem Maximalwert für jede Frakti- on gemäss dem CG-Gehalt, und - Herstellen des virtuellen Chromosoms durch Darstellen jeder Fraktion mit dem Wert. 



   Es stellte sich heraus, dass mit diesem Verfahren hergestellte Chromosome eine hervorragen- de Korrelation zwischen dem eigenen Bänderungsmuster und dem ihrer entsprechenden natürli- chen Gegenstücke lieferten. Diese überraschende Übereinstimmung zeigt nicht nur, dass das chromosomale Bänderungsmuster zu einem Grossteil direkt durch die zugrunde liegende DNA- Sequenz bestimmt wird, sondern kann auch eine einzigartige Basis für die gemeinsame Verarbei- tung von morphologischen und molekulargenetischen Daten innerhalb eines einzigen, auf der DNA-Sequenz basierenden Gerüsts bieten.

   Im Gegensatz zu aktuellen Publikationen, die aus- drücklich feststellen, dass Giemsa-Bänderungsmuster durch die unterschiedliche Basenzusam- mensetzung allein nicht erklärt werden können, wird mit dem vorliegenden Verfahren gezeigt, dass eine Darstellung von Chromosomen auf Sequenzbasis gemäss dem CG-Gehalt sehr wohl möglich ist und zu virtuellen Chromosomen mit hoher Auflösung führt. 



   Im Rahmen der vorliegenden Anmeldung bezieht sich der Ausdruck "Verfahren zur Herstellung eines virtuellen Chromosoms, das ein entsprechendes natürliches Chromosom repräsentiert" nicht nur auf vollständige Chromosome, sondern auch auf Teile davon, beispielsweise separate Chro- mosomenarme oder-enden. Für die Sequenzdaten des natürlichen Chromosoms können bei- spielsweise irgendwelche elektronisch verfügbaren Daten herangezogen werden, im Fall von menschlichen Chromosomen können das zum Beispiel Sequenzen aus dem Arbeitsentwurf des Humangenomprojekts [Human Genome Project Working Draft (http://genome.ucsc.edu/)] sein. Im Rahmen der vorliegenden Anmeldung bezieht sich der Ausdruck "Chromosom" auf irgendwelche Chromosome irgendeines Organismus.

   Der Organismus ist zum Beispiel der Mensch, es kann jedoch auch irgendein Lebewesen, insbesondere ein Säuger, den Organismus darstellen, aus dem das Chromosom stammt. Virtuelle Chromosome von Säugern und Menschen sind besonders bevorzugt, da sie für Evolutionsstudien verwendet werden können. 



   Der Schritt des Unterteilens der Sequenzdaten in Fraktionen und des Bestimmens des CG-Gehalts in jeder Fraktion wird vorzugsweise elektronisch ausgeführt. 



   Der Ausdruck "Wert zwischen einem Minimalwert und einem Maximalwert" bezieht sich auf irgendeinen Parameter, der geeignet ist, einen spezifischen CG-Gehalt zu definieren und vorzugs- weise virtuell darzustellen. Das kann beispielsweise ein Prozentwert zwischen 0% und 100% oder ein Wert zwischen 0 und 1 sein, der zum Beispiel in einem zwei- oder dreidimensionalen Bild sichtbar gemacht wird. Die Werte können weiters durch Lichtwerte oder Farbwerte dargestellt werden. Jeder Wert, der sichtbar gemacht werden kann, ist zur Darstellung eines bestimmten CG-Gehalts geeignet. 



   Der Schritt des Berechnens des Werts für jede Fraktion gemäss ihrem CG-Gehalt kann mit je- der geeigneten Tabelle oder Formel, jedem geeigneten Algorithmus oder Programm durchgeführt werden, wobei zum Beispiel ein Minimalwert einer Minimalmenge an CG in einer Fraktion zuge- ordnet wird und ein Maximalwert einer Maximalmenge an CG in einer Fraktion zugeordnet wird. 



  Die Werte dazwischen werden dann als lineare Funktion zwischen den beiden Extremwerten dem wechselnden CG-Gehalt in den Fraktionen zugeordnet. 



   Vorzugsweise ist der Wert ein Lichtwert. Der Vorteil eines Lichtwerts besteht darin, dass die 

 <Desc/Clms Page number 4> 

 Sichtbarmachung sehr rasch und einfach interpretiert werden kann und weiters mit konventionell erzeugten, beispielsweise mikroskopisch entnommenen oder ISCN-Chromosomen verglichen werden kann. 



   Auf weiters bevorzugte Weise werden der Maximalwert weiss, der Minimalwert schwarz und Werte dazwischen in Grauschattierungen dargestellt. Diese Darstellung eines virtuellen Chromo- soms ist direkt vergleichbar mit den herkömmlich gescannten Chromosomen, die Auflösung ist jedoch sehr hoch und das virtuelle Chromosom umfasst weiters die Sequenzdateninformationen, die in den Chromosomendarstellungen des Standes der Technik fehlen. 



   Gemäss einer bevorzugten Ausführungsform wird das natürliche Chromosom in Fraktionen einer Länge bis 1.000.000 bp, vorzugsweise einer Länge von 50. 000 bis 500. 000 bp, noch bevor- zugter einer Länge von 100. 000 bis 300. 000 bp unterteilt. Diese Fraktionen sind ausreichend klein, um hohe Auflösungen und eine grösstmögliche Fülle an Informationen zu ermöglichen. Vorzugs- weise entspricht eine Fraktion der geschätzten Durchschnittsgrösse einer DNA-Schleife sowie jener eines lsochors.   Eine     optimale   Fraktionslänge   beträgt     beispielsweise     200.000   Basenpaare, 
Vorteilhaft wird die Fraktion mit einem CG-Gehalt von 30 bis 35 %, vorzugsweise 33 %, einem Minimalwert und die Fraktion mit einem CG-Gehalt von 60 bis 65 %, vorzugsweise 62 %, einem Maximalwert zugeordnet.

   Es wurde gefunden, dass eine Veränderung zwischen diesen Prozent- angaben Chromosome mit grauen Bandwerten erzeugt, die den herkömmlich dargestellten Chro- mosomen entsprechen. Daher kann diese Sichtbarmachung des virtuellen Chromosoms direkt mit herkömmlichen Chromosomendarstellungen verglichen werden kann, wie sie beispielsweise durch ein Mikroskop wahrgenommen werden. 



   Vorzugsweise wird Fraktionen mit unbekannter Sequenz der Wert gemäss ihrer morphologi- schen Erscheinung zugeordnet. Auch wenn die Menge an Fraktionen, denen eine Sequenz fehlt, insbesondere bei menschlichen Chromosomen aufgrund des nahezu vollständigen menschlichen Genoms sehr gering geworden ist und im Allgemeinen rasch abnehmen wird, können die wenigen Fraktionen mit fehlender Sequenz durch Daten ergänzt werden, die von der morphologischen Erscheinung abgeleitet, beispielsweise einem Ideogramm entnommen worden sind, um ein voll- ständiges Chromosom zu liefern. 



   Auf weiters bevorzugte Weise wird nach der Herstellung des virtuellen Chromosoms ein Filter zur Glättung der Erscheinung, vorzugsweise ein Gausssches Faltungsfilter, angewendet. Dabei wurden auch die resultierenden Schattierungen verwendet, um die wenigen letzten Pixels an den Chromsomengrenzen nach und nach zu füllen. 



   Gemäss noch einem bevorzugten Verfahren wird zur Herstellung des virtuellen Chromosoms ein Skalenkorrekturfilter angewendet. Das kann ein Normalisierungs- und nichtlineares Grauska- lenkorrekturfilter vom Gamma-Typ sein. Dadurch kommt es zu einer Kontrastverstärkung und das Bild von Chromosomen, wie sie durch das Mikroskop wahrgenommen werden, wird optimal nach- geahmt. 



   Ein weiterer Aspekt der vorliegenden Anmeldung betrifft ein virtuelles Chromosom oder einen Teil davon, das bzw. der durch Werte gemäss seinem CG-Gehalt dargestellt wird, welcher bzw. welches dadurch gekennzeichnet ist, dass die Herstellung gemäss dem oben definierten erfin- dungsgemässen Verfahren erfolgt. Gemäss der vorliegenden Erfindung wird ein virtuelles Chromo- som geschaffen, das nicht nur morphologische Informationen umfasst und beispielsweise mit herkömmlichen Ideogrammen verglichen werden kann, sondern welches auch Sequenzdaten enthält. Dieses auf Sequenzbasis visualisierte Chromosom gemäss der vorliegenden Erfindung zeigt eine hervorragende Korrelation des Bänderungsmusters von virtuellen Chromosomen und jenem der entsprechenden natürlichen Gegenstücke.

   Hinsichtlich dieses Aspekts der vorliegenden Erfindung gelten dieselben Definitionen und bevorzugten Ausführungsformen wie oben. 



   Vorzugsweise ist der Wert ein Lichtwert, noch bevorzugter sind der Maximalwert weiss, der Mi- nimalwert schwarz und Werte dazwischen in Grauschattierungen dargestellt. Wie oben ausgeführt, ermöglicht dies eine Darstellung des Chromosoms, wie es durch das Mikroskop gesehen wird, und ist daher optimal für einen Vergleich mit herkömmlichen Chromosomendarstellungen, wie bei- spielsweise Ideogrammen oder mikroskopisch wahrgenommenen Chromosomen, geeignet. 



   Gemäss einem weiteren Aspekt der vorliegenden Anmeldung wird ein Satz von virtuellen Chro- mosomen oder Teilen davon zur Verfügung gestellt, der dadurch gekennzeichnet ist, dass er zwei oder mehr erfindungsgemässe Chromosome oder Teile davon wie oben definiert umfasst. 

 <Desc/Clms Page number 5> 

 



  Vorzugsweise umfasst der Satz eine Höchstzahl von Chromosomen, wobei dieser Satz ständig durch weitere, neu gefundene oder neu identifizierte Chromosome ergänzt werden kann. 



   Vorzugsweise umfasst der Satz Chromosome oder Teile davon, die für einen oder mehrere Organismen spezifisch sind. Der Vorteil eines Satzes, der für einen Organismus spezifisch ist, liegt darin, dass dieser Satz für einen Vergleich von irgendwelchen neu identifizierten Modifikationen oder Umlagerungen von Chromosomen dieses Organismus nützlich ist. Es ist jedoch selbstver- ständlich möglich, einen Satz mit Chromosomen verschiedener, vorzugsweise definierter Organis- men zur Verfügung zu stellen. 



   Auf weiters bevorzugte Weise umfasst der Satz 24 menschliche Chromosome oder Teile da- von. Dieser Satz ist ein Standardsatz für normale menschliche Chromosome und kann für einen Vergleich von Chromosomen eines Patienten mit normalen Chromosomen zum Nachweis irgend- welcher Modifikationen oder Umlagerungen verwendet werden. 



   Auf weiters bevorzugte Weise umfasst der Satz weiters zusätzliche modifizierte Chromosome oder Teile davon, vorzugsweise Chromosome mit Translokationen. Das ist von besonderem Vorteil für modifizierte Chromosome, die mit einer spezifischen Krankheit, beispielsweise einem spezifi- schen Tumor, verwandt sind. Indem eine Klassifikation von solchen modifizierten virtuellen Chro- mosomen, vorzugsweise jeder Modifikation mit einem Hinweis auf eine spezifische Krankheit, vorgesehen wird, ist es ganz leicht möglich, eine Krankheit oder die Gefahr des Ausbrechens einer Krankheit einem Satz von aus einem Patienten isolierten Chromosomen zuzuordnen, indem der Satz von virtuellen Chromosomen mit den Chromosomen des Patienten verglichen wird.

   Aufgrund des ständigen Nachweises neuer Modifikationen in Chromosomen kann der Satz rasch und per- manent mit den neuesten medizinischen Informationen vervollständigt werden. 



   Im Rahmen der vorliegenden Anmeldung bezieht sich der Ausdruck "Chromosomenmodifikati- on" auf irgendeine Sequenzmodifikation, z. B. irgendeine Mutation oder Translokation eines Chro- mosomenfragments. 



   Ein weiterer Aspekt der vorliegenden Erfindung ist die Verwendung des erfindungsgemässen Satzes von virtuellen Chromosomen wie oben genannt zur Katalogisierung von Chromosomenmo- difikationen. Wie oben ausgeführt, ist der erfindungsgemässe Satz besonders zweckmässig zur Lieferung von elektronischen Informationen über Chromosomenmodifikationen und ihren Konnex zu irgendeiner Krankheit oder Krankheitsgefahr. Im Rahmen der vorliegenden Anmeldung bezieht sich der Ausdruck "Chromosomenmodifikation" auf irgendeine Modifikation im Chromosom. Es kann sich dabei um eine Sequenzmutation oder die vollständige Translokation eines Chromoso- menfragments handeln. Aufgrund der hohen Auflösung kann jede Chromosomenmodifikation detektiert und katalogisiert werden. 



   Der erfindungsgemässe Satz gestattet die Beschreibung von Chromosomenanomalien mit einer bisher unbekannten molekularen Präzision, wobei andererseits nach wie vor die Möglichkeit be- steht, verschwommenere Grossereignisse auf reiner Chromosomenebene zu interpretieren, wie es auch mittels konventioneller zytogenetischer Analyse sowie mittels vergleichender Genomhybridi- sierung und vergleichender exprimierter Sequenzhybridisierung auf Basis von chromosomaler Multifarbenfärbung FISH möglich ist. 



   Ein weiterer Aspekt der vorliegenden Anmeldung betrifft die Verwendung eines erfindungsge- mässen Satzes von virtuellen Chromosomen wie oben definiert zur virtuellen Kartierung der chro- mosomalen Position einer Sequenz. Da der erfindungsgemässe Satz von virtuellen Chromosomen von der vollständigen menschlichen DNA-Sequenz abgeleitet ist bzw. diese darstellt, ist es mög- lich, die chromosomale Position irgendeiner gegebenen, bekannten oder unbekannten Sequenz oder Sequenzgruppe, die in einer Datenbank zur Herstellung der virtuellen Chromosome enthalten ist, zu kartieren und anzuzeigen. 



   Ein weiterer Aspekt der vorliegenden Anmeldung bezieht sich auf die Verwendung eines erfin- dungsgemässen Satzes von virtuellen Chromosomen wie oben definiert als Schnittstelle zwischen morphologischen und molekulargenetischen Daten. Vorzugsweise stammen die morphologischen Daten von Informationen basierend auf dem Internationalen System für Humane Zytogenetische Nomenklatur (ISCN). 



   Dabei kann eine grafische Schnittstelle über jede molekulargenetischen Datenbank überlagert werden. So gewährleistet ein virtuelles System auf Chromosomenbasis, dass zuvor erfasste Daten zugänglich und analysierbar bleiben. Beispielsweise ist eine Kombination von grafischen Schnitt- 

 <Desc/Clms Page number 6> 

 stellen-Werkzeugen auf Basis von ISCN-Nomenklatur und virtuellen Chromosomen, die bestehen- de zytogenetische Datenbanken überlagern kann wie oben ausgeführt, äusserst nützlich. Eine derartige Schnittstelle ermöglicht die Transformation von ISCN-Informationen in das entsprechen- de Karyotyp-Bild. Umgekehrt kann ein Karyotyp-Bild, das mit einem solchen virtuellen Chromoso- men-Werkzeug generiert wird, in ein ISCN-Band translatiert werden.

   Eine derartige grafische Schnittstelle ist extrem wertvoll für eine visuelle Kreuzprüfung der ISCN-Beschreibung durch einen Vergleich des Karyotyp-Bilds mit dem virtuellen Chromosomenbild. Als wertvolle Nebenerschei- nung verbessert ein solcher Ansatz auch signifikant die Qualität von zytogenetischen Daten. Dar- über hinaus erleichtert er auch den nahtlosen Austausch und Verkehr von zytogenetischen Daten in standardisierter Form in einem Labor bzw. zwischen Labors nicht nur mit einer Fernzentrale, sondern auch mit FISH- und molekulargenetische Datenbanken.

   Beispielsweise können dann zytogenetische Daten, die zur Veröffentlichung vorbereitet werden, leicht überprüft und bequem an eine zentrale Datenbank übermittelt werden. 
 EMI6.1 
 tische Datenbanken unterstützt die Visualisierung jeder Art von FISH-, DNA- und RNA-abgeleiteten Datensätzen sowie Gen-Expressionsprofilen auf standardisierte "chromosomale" Weise. Die Vorteile einer solchen chromosomalen Darstellung liegen darin, dass diese unabhängig von der Sondenverteilung auf den verschiedenen Arrays ist, und auch darin, dass ihre "natürliche" Erscheinung das Verständnis und einen Vergleich durch visuelle Prüfung erleichtert.

   Darüber hinaus kommt einer derartigen Darstellung von Gen-Expressionsprofilen immer mehr Bedeutung zu, weil es zunehmend Beweismittel dafür gibt, dass auch funktionell nichtverwandte Gene in Transkriptionsterritorien in Drosophila sowie im menschlichen Genom exprimiert werden. Das resultierende Verteilungsmuster gleicht jenen, die von CGH- und CESH-Analysen stammen, bei denen unterschiedlich markierte DNA oder cDNA aus einem Gewebe von Interesse und eine Kontrollprobe gleichzeitig direkt auf Chromosome hybridisiert werden. In der Folge können solche Datensätze mit anderen Karyotyp-Mustern, beispielsweise den zugehörigen Karyotyp-Anomalien, direkt korreliert und kreuzanalysiert werden. 



   Da die Position von FISH- oder anderen DNA-Sonden (von Oligonucleotiden bis regionsspezi- fischen Färbungssonden) bequem auf virtuellen Chromosomen angezeigt werden und mit den tatsächlich erhaltenen Hybridisierungsmustern kreuzgeprüft werden kann, sind solche grafischen Schnittstellen auch von potentiellem Interesse für Ressourcen-Zentren. Darüber hinaus kann die Position von zytogenetischen Orientierungspunkten in Form von gleichmässig verteilten FISH- Sonden für Zwecke des Kartierens von Defektstellen direkt in derartige Chromosome integriert werden. Schliesslich können sogar submikroskopische Ereignisse, die andernfalls mit konventionel- len zytogenetischen Mitteln nicht nachweisbar sind, wie Mikrodeletionen und Interphasen-FISH- Daten, kartiert und in eine solche universelle Plattform inkludiert werden. 



   Vorzugsweise dient der Chromosomensatz als Referenz zur Klassifizierung eines Phänotyps zu einer Sequenzanordnung. Der Ausdruck "Sequenzanordnung" bezieht sich auf irgendeine Modifikation, z. B. Sequenzmutationen oder Translokationen von Chromosomenfragmenten. Der Phänotyp kann sich auf normale oder abnormale Phänotypen beziehen, z. B. verschiedenen Krankheiten wie Tumore. Insbesondere bei einer Klassifizierung der Chromosome nach Modifikati- onen und resultierenden Phänotypen kann jedes aus einem Patienten isolierte und mit herkömmli- chen mikroskopischen Methoden analysierte Chromosom mit dem erfindungsgemässen Chromo- somensatz verglichen werden. Ähnlichkeiten zwischen den Modifikationen der Chromosome wür- den auch ähnliche Phänotypen oder zumindest die Wahrscheinlichkeit oder das Risiko der Entste- hung eines ähnlichen Phänotyps implizieren. 



   Vorteilhaft dient der Chromosomensatz als Werkzeug zur Durchführung von Struktur- bzw. 



  Funktionsanalysen einer Sequenzanordnung. Wie oben ausgeführt, kann die Analyse durch Gen- kartierung oder virtuelle Hybridisierung aufgrund der im virtuellen Chromosom enthaltenen Se- quenzdaten durchgeführt werden. 



   Auf weiters bevorzugte Weise dient der Chromosomensatz als Werkzeug zur Bestimmung des Einflusses eines bestimmten Faktors auf eine Sequenzanordnung. Beispielsweise kann ein exter- ner Faktor wie eine chemische Substanz, Energie mit verschiedenen Wellenlängen oder auch der Einfluss von Mikroorganismen auf zytogenetischer Basis analysiert und in den erfindungsgemässen Chromosomensatz transferiert oder mit diesem verglichen werden, wodurch Implikationen oder 

 <Desc/Clms Page number 7> 

 resultierende Phänotypen abgeleitet oder vorhergesehen werden können. 



   Die vorliegende Erfindung wird genauer anhand der folgenden Beispiele und Figuren beschrieben, auf die sie jedoch nicht beschränkt ist, worin:
Fig. 1 Bilder einer von menschlichen Chromosomen abgeleiteten DNA-Sequenz im Vergleich zu Trypsin/Giemsa-gebänderten Chromosomenbildern zeigt ;
Fig. 2 ein Modell von ungleichmässiger Kondensation von G-Bänder in Abhängigkeit von ihrem CG-Gehalt darstellt;
Fig. 3 virtuelle Chromosome im Vergleich zu den zytogenetischen und molekulargenetischen Karten zeigt;
Fig. 4 eine virtuelle in-situ-Hybridisierung zeigt;
Fig. 5 die Konstruktion von virtuellen Chromosomenabnormitäten zeigt ;   Fig. 6 eine grafische Schnittstelle zwischen zytogenen und molekulargenetischen Datensätzen   darstellt. 



   Beispiele 
Beispiel 1:
Herstellung von virtuellen Chromosomen auf der Basis von genetischen Daten
Zur Herstellung von virtuellen Chromosomen wurden die Sequenzdaten der August- und Dezember-2001- sowie April- und Juni-2002- Ausgaben des Humangenom-Arbeitsentwurfs (human genome working draft) heruntergeladen. Zur Analyse und Verarbeitung der Daten und der daraus resultierenden Bilder wurden Perl, Mathematica (Wolfram Scientific) und Photoshop (Adobe) verwendet. Unter Verwendung der Script-Sprache Perl wurden zuerst die Sequenzdaten jedes einzelnen Chromosoms in 200. 000 Basen lange Fraktionen unterteilt. Diese Grösse entspricht der geschätzten Durchschnittsgrösse einer DNA-Schleife und auch annähernd jener eines Isochors. 



  Dann wurde der CG-Gehalt aller Streifen prozentuell ermittelt, deren Sequenz zu mindestens 70 % vollständig war. Das traf praktisch in allen Fällen beginnend mit der Dezember-2001-Ausgabe zu. 



  Lücken aufgrund von nicht sequenzierten Nucleotiden (N's) wurden nicht in Betracht gezogen. Der CG-Gehalt der einzelnen Streifen reichte von 33 % bis 62 % bei einem Mittelwert von 41 %. Die Tabellen mit diesen Daten wurden zusammen mit den Informationen über die Segment- und Bandkoordinaten des jeweiligen Chromosoms in temporären Files gespeichert und mit Mathematica weiter berechnet und assembliert wie nachstehend gezeigt: 
 EMI7.1 
 
Entsprechend dem einzelnen CG-Gehalt wurde jedem Streifen ein Grauwert auf lineare normalisierte Weise zugeordnet, d. h. Streifen mit einem CG-Gehalt von 33 % wurden schwarz und jene mit einem CG-Gehalt von 62 % weiss.

   Die Übertragungsfunktion in Mathematica von Prozent CG auf den Grauwert ist die Summe aus (statistischer) Normalisierung und Kontrastverstärkung: 
BandsAvg = ListConvolve[FoldMask, StaticNormalize[ChrShades], {CenterElement, -CenterElement}, .41]/ / (Plus   &commat;&commat;     FoldMask)   
Die abgeleiteten Balken wurden dann innerhalb der jeweiligen Chromosomengrenzen, wie durch ihre Länge und zentromere Position definiert, integriert. Die zentromeren, heterochromatischen und Satelliten-Regionen, für die noch keine geeigneten Sequenzinformationen erhältlich sind, wurden entsprechend ihrer morphologischen Erscheinung künstlich ergänzt.

   Zur Glättung der Erscheinung der virtuellen Chromosome wurde ein Gausssches Faltungsfilter (N(0,1),22 Streifen in der Länge) angewendet: 
NiceUnitBand[Pos¯, Width¯, Stain¯, BitFields¯, Y¯, H¯, ChrNames¯ ] : = Block[{CL},
CL = Select[{ChrStartPos[ChrNames], ChrSatelite Pos[ChrNames]}- Join -
ChrCentroPosList[ChrNames] - Join - {ChrEndPos [ChrNames] }, NumberQ];

   

 <Desc/Clms Page number 8> 

 { 
Raster[Table[lf[False,   {Max[0,   Min[1, Schnitt[Stain] [x]]]},   {Max[0,   Min[1, Schnitt[ColorCorrection[Stain]] [x]]]}], (x, 0,1, 1/30}], {{Pos - Width/2, Y + H * (1 - Boundary[CL, Pos])}, {Pos + Width/2, Y + H - H * (1 - Boundary[CL, Pos])}},   ColorFunction , GrayLevel ],   
Maplndexed [   Rectangle[{Pos -   Width/2, - (&num;2[[1]] *10 +   1)},   {Pos + Width/2, - (&num;2[[1]] *10 + 9)}, 
Graphics[{} ,   Background#   of [&num;1 > = 0, Hue[&num;1], GrayLevel[1] ] ] & , BitFields ]}] 
Weiters wurden die   resultierenden     Schattierungen   dazu   verwendet,   nach und nach die wein- gen letzten Pixels an den Chromosomengrenzen zu füllen.

   Zur Konstrastverstärkung und Nachah- mung der Chromosomenbilder, wie sie durch ein Mikroskop wahrgenommen werden, wurde ein Normalisierungs- und nichtlineares Grauskalen-Korrekturfilter vom Gamma-Typ verwendet:   ColorCorrection[c¯   ]: = (* 1¯(c-1)^ 3*)   Interpolation[{{0,0},   {.1, .1),   {.2, .5},     {.5, .8},   {1, 1}, 
InterpolationOrder   #  1] [c] 
Um die Daten in Chromosomenform zu bringen: 
Boundary[CL¯, p¯ ] := Block[{r = 5000000, d}, d = Min[Abs[CL-p]]; 
 EMI8.1 
 
Als letzter Schritt wurden die jeweiligen Bilder dann in Photoshop importiert, assembliert und entsprechend arrangiert. 



   Beispiel 2 : 
Bilder von DNA-Sequenz-abgeleiteten menschlichen Chromosomen 
In Fig. 1 sind Trpysin/Giemsa-gebänderte Chromosomenbilder dargestellt, wobei für jedes Chromosom (a) ein ISCN-Referenzbild mit 850 Bänderstufen zeigt, (b) ihr abgeleitetes gerade gerichtetes Grauschattierungsmuster zeigt, (c) ein Vergleich mit ihren berechneten virtuellen Ge- genstücken der August-2001- und (d) Dezember-2001-, (e) April-2002- und (f) Juni-2002-Ausgabe ist (siehe http://genome.ucsc.edu/). 



   Trotz der hervorragenden allgemeinen Gesamtkonkordanz zwischen den gematchten Sätzen von Chromosomen-Homologen wurden einige örtliche Veränderungen und Unterschiede offenkun- dig, insbesondere zwischen virtuellen Chromosomen, die von unterschiedlichen Sequenzausgaben stammen. Die ursprünglich hervorragende Übereinstimmung zwischen dem Grauskalen- Bänderungsmuster der natürlichen Chromosome und der virtuellen Chromosome der Ausgabe vom August 2001 verschlechterte sich bei Verwendung der Ausgabe vom Dezember 2001 für Vergleichszwecke. Diese verblüffende Feststellung lässt sich dadurch erklären, dass die spätere Zusammenstellung bei CNBI und nicht bei USCS produziert wurde.

   Bei einem Vergleich mit der UCSC-Zusammenstellung zeigt die NCBI-Zusammenstellung eine etwas bessere lokale Ordnung und Orientierung, jedoch eine etwas schlechtere Verfolgung der Chromosomenniveaukarten. 



  Solche Verschiebungen von Sequenzabschnitten können somit das örtliche Bänderungsmuster merklich verändern, was besonders deutlich wird bei einem Vergleich der langen Arme der virtuel- len Chromosome 1 und 11 von verschiedenen Ausgaben. Die Lage der Zentromere der Chromo- some 5 (Ausgabe Dezember 2001),7 und 12 (beide Ausgabe 2002) verschob sich zu ungeraden Positionen. Bemerkenswert ist jedoch, dass sich die Vorlagerungen und ständigen Korrekturen in 

 <Desc/Clms Page number 9> 

 der Sequenzzusammenstellung ebenso signifikant verbesserten wie die Konkordanz zwischen den natürlichen und virtuellen Bänderungsmustern. Ein derartiger Vergleich von virtuellen Chromoso- men, die von verschiedenen Sequenzausgaben stammen, kann somit auch eine unabhängige Validierung der Sequenzkarte ermöglichen. 



   Beispiel 3 : 
Modellierung von ungleichmässiger Kondensation von G-Bänder in Abhängigkeit von ihrem CG- Gehalt 
Virtuelle Chromosome gestatten Struktur- und Funktionsanalysen des Genoms und schaffen Möglichkeiten zur Untersuchung des Einflusses verschiedener Faktoren auf das gross angelegte chromosomale Bänderungsmuster. Das hierin gezeigte Beispiel bezieht sich auf potentielle Wir- kungen der ungleichen Kontraktion von hellen und dunklen Bändern während der Chromosomen- kondensation. Die Analyse beruht auf der Vorstellung, dass dunkle Giemsa-Bänder bis zu elfmal mehr DNA enthalten können als die hellen Bänder und dass das DNA-Verdichtungsverhältnis in der Grössenordnung der Kubikwurzel der jeweiligen DNA-Länge liegt (siehe Fig. 2). 



   Zuerst wurden die Bilder des kürzesten (ISCNS, Bandstufe 500) und längsten (ISCNL, Band- stufe 850) ISCN-Chromosoms 7 in ein Grauskalenmuster durch Messen der Grauwerte entlang des blauen Pfads (a) transformiert. Nachdem diese zwei Chromosomenbilder auf dieselbe Länge gebracht worden waren, wurde ihr Bänderungsmuster mit jenem von virtuellen Homologen vergli- chen, die auf verschiedene Arten modifiziert wurden. In Abhängigkeit vom jeweiligen CG-Gehalt, und wie in der Grafik erläutert, (s. Fig. 2b) wurde die Länge der hellen und dunklen Bänder der virtuellen Chromosome linear gedehnt oder kondensiert, indem die Faktoren 0,3,0,5 bzw. 0,8 angewendet wurden, die annähernd einem 2,2-, 3,4- bzw. 5,8-fachen Unterschied in ihrer DNA- Länge entsprechen (s. Fig. 2c).

   Ein Vergleich der resultierenden Bänderungsmuster bestärkt frühere experimentelle Nachweise, dass die Chromosomenkondensation aller Wahrscheinlichkeit nach nicht nur auf CG-Gehalt-abhängige lineare Weise erfolgt. Er kann jedoch keine gute Erklä- rung für das verblüffende Muster liefern, das durch Dehnen von GTG-gebänderten Chromosomen erhalten wird. Es ist vorstellbar, dass es durch Bestimmung der Abstände zwischen hellen und dunklen Chromosomenbänder in verschiedenen Kontraktionsstufen einmal möglich sein wird, einen Faktor oder eine Formel abzuleiten, deren Plausibilität in der Folge durch einen Vergleich der Bilder von natürlichen Chromosomen mit den entsprechenden virtuellen Chromosomen überprüft werden kann.

   Auch wenn es sein kann, dass die ungleichmässige Verlängerung von kondensierten und dekondensierten dunklen und hellen Chromosomenbändern sogar visuell wahrnehmbar sind, besteht keine praktische Veranlassung für analytische Zwecke, da die präparationsabhängige Veränderung innerhalb der Chromosomenklasse selbst weiter ist als jene, die von der verzerrten künstlichen Dehnung mittels Computer resultiert. 



   Beispiel 4 : 
Virtuelle Chromosomen verknüpfen die zytogenetische und die molekulargenetisch Karte 
In Fig. 3a ist das ISCN-Chromosom 7 (Bandstufe 850) zusammen mit seinem virtuellen Gegen- stück und drei verschiedenen Ideogrammen gezeigt. Das Bänderungsmuster des linken Ideo- gramms basiert auf der Lage der Wendepunkte zwischen CG-reicheren und CG-ärmeren Regio- nen im Sequenz-basierten virtuellen Chromosom. Die Kurve folgt dem mittleren CG-Gehalt. Das UCSC-Ideogramm (Ausgabe vom August 2001) ist in der Mitte und das entsprechende ISCN (Bandstufe 850) auf der rechten Seite platziert. Die linke Hälfte des virtuellen Chromosoms zeigt die rohen, unverstärkten Grauwerte des jeweiligen CG-Gehalts, wohingegen in der rechten Hälfte der Kontrast entsprechend der in Diagramm (b) dargestellten Kurve verstärkt ist. Die dünnen horizontalen Linien liefern eine absolute 10 Mb-Skala.

   Wie oben für Fig. 2 erläutert, könnte es jedoch sein, dass die DNA nicht auf solch lineare Weise entlang der Bänder verteilt ist, wie diese Skala nahe legt. Es wird auch klar, dass die Breite und Verteilung von Bändern in Ideogramm- Darstellungen beträchtlich variieren kann, obwohl ihre Anzahl und Bezeichnung üblicherweise übereinstimmt. Es ist daher nicht möglich, jedes absolute oder relative chromosomale Auftreten auf irgendeinem Ideogramm genau zu positionieren. Virtuelle Chromosome lösen dieses Problem, indem sie die absolute Präzision der DNA-Sequenzpositionierung mit den willkürlichen Lageindika- toren irgendeiner Art Ideogramm verknüpfen, was durch die Linien verdeutlicht ist, die die Band- 

 <Desc/Clms Page number 10> 

 grenzen der drei in dieser Figur gezeigten Beispiele kombinieren. 



   Beispiel 5 :
Virtuelle in-situ-Hybridisierung
Da virtuelle Chromosome die DNA-Sequenz in sehr kondensierter Form symbolisieren, ist es nunmehr möglich, die genaue Position jeder Art von DNA-Sequenz oder Sequenzsatz unabhängig von der Anzahl und DNA-Sequenzlänge mit Hilfe der jeweiligen Nucleotid-Koordinaten mit einer bislang unbekannten zytogenetischen Präzision anzuzeigen. Ein Vergleichsbeispiel von konventioneller und virtueller FISH-Kartierung ist in Fig. 4 links für das MLL-Partnergen GRAF bei 5(q31) gezeigt, dessen ursprüngliche, zytogenetisch bestimmte Lage zeichnerisch auf eine CGH-Software (Vysis, Doners, Grove, USA) beschränkt war. Das   Metaphasenbild   ist oben, das CGH-Kartierungsbild in der Mitte und das virtuelle Chromosom 5 mit dem verlängerten natürlichen unten gezeigt. 



   Bei früheren Versuchen, die zytogenetische Kartenlage in bestehende genomische Datenbanken zu   integrieren,   war man auf eine   solche     Anzeige   vnn chromosomalen   Ereignissen   auf ldeogramm- Koordinatensystemen angewiesen, da es nicht möglich war, diese beiden Datensätze direkt zu verknüpfen. Hier ist die Verteilung von 77 von 82 Chromosom-7-CCAP-BAC-Klonen als Beispiel für die erzielbare Verbesserung bei der Zuordnung der absoluten und relativen Position eines ganzen Klonensatzes gezeigt. 



   Beispiel 6 :
Konstruktion von Abnormitäten virtueller Chromosome
Die Definition eines speziellen chromosomalen Ereignisses mit molekularer Präzision erleichtert nunmehr die genaue Rekonstruktion jeder Chromosomen-Umlagerung mit einer bekannten molekularen Defektstellenlage. Wie hier durch das Beispiel der Translokation t   (4;11)   (q21;q23) (s. Fig. 5) veranschaulicht, ist dies eine wichtige Voraussetzung für die potentielle Verwendung solcher virtueller Chromosomen-Umlagerungen in Mustererkennungssystemen und beim automatischen Karyotypisieren. Mit der aktuellen zytogenetischen Terminologie und Präzision kann die Lage der Defektstellen einer bestimmten Translokation nur willkürlich durch die Lage der betreffenden Bänder definiert werden.

   Je nach Sequenzfreisetzung umfasst das Band 4   (q21)   zwischen 11,5 und 14,2 Mb (6,0 % - 7,4 % von Chromosom 4) und das Band 11 (q23) zwischen 10,9 und 11,7 Mb (7,9 % - 8,5 % von Chromosom   11).  Ohne Kenntnis der genauen Position der beiden Gene AF4 und MLL, die infolge der Translokation zerstört und verschmelzt werden, innerhalb der Bänder könnten die Defektstellen irgendwo innerhalb dieser Bänder liegen. Zur Demonstration dieses Standpunkts wurden sie den äusseren Grenzen der fraglichen Bänder zugeordnet. Sehr wahrscheinlich ist das auch bereits eine der höchsten Auflösungen, die mit einer durchschnittlichen morphologischen Chromosomenanalyse erzielt werden kann.

   Verglichen mit der Länge und den Bänderungsmustern von Ableitungschromosomen, die von exakt positionierten molekularen Defektstellen (durch * angedeutet) stammen, können jene, die aus undefinierten Defektstellenzuordnungen resultieren, ziemlich anders aussehen. Sie wären daher sicherlich unbrauchbar für Zwecke des Vergleichs und neuerlichen Nachweises bei der Mustererkennung. 



   Beispiel 7 :
Grafische Schnittstelle zwischen zytogenetischen und molekulargenetischen Datensätzen
Als Spitzeneinheiten der Humansequenz decken virtuelle Chromosome die neun Grössenordnungen des kompletten Genoms auf stark kondensierte, leicht expandierbare und am natürlichsten vorstellbare "morphologische" Weise ab. Sie können daher als einzigartiges Vorfeld-Werkzeug für die Sichtbarmachung der in jeder Sequenz-Datenbank enthaltenen Informationen eingesetzt werden ; nämlich im Prinzip von einem einzigen Basenpaar bis zu ganzen Chromosomen auf zytogenetische Weise. Als Beispiel sind hier in einer 1-Mb-Skala die Verteilung der annähernd 15. 000 Gene und CpGs aus der UCSC-Datenbank entlang virtueller Chromosome und die entsprechenden UCSC-Farbideogramme gezeigt.

   Aus praktischen Gründen ist die Skala der Balken für die Gene nur in halber Höhe der CpG-Balken gezeigt und die Höhe dieser CpG-Balken am Chromosom 19 abgeschnitten. 



   Die vertikalen Balken auf der linken Seite der Chromosome zeigen die Grösse und Lage von heterochromatischen und Satellitenregionen an, die künstlich ergänzt wurden, da ihre Sequenz 

 <Desc/Clms Page number 11> 

 derzeit noch nicht verfügbar ist. Die feinen horizontalen Balken auf der linken Seite der Chromo- some deuten Sequenzlücken an. 



   PATENTANSPRÜCHE: 
1. Verfahren zur Herstellung eines virtuellen Chromosoms, das ein entsprechendes natürli- ches Chromosom repräsentiert, dadurch gekennzeichnet, dass es die folgenden Schritte umfasst : - Unterteilen von Sequenzdaten des natürlichen Chromosoms in Fraktionen mit einer Län- ge von mindestens 10. 000 bp, - Bestimmen des CG-Gehalts in jeder Fraktion, - Berechnen eines Werts zwischen einem Minimalwert und einem Maximalwert für jede 
Fraktion gemäss dem CG-Gehalt, und - Herstellen des virtuellen Chromosoms durch Darstellen jeder Fraktion mit dem Wert.

Claims (1)

  1. 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Wert ein Lichtwert ist.
    3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass der Maximalwert weiss, der Minimalwert schwarz und Werte dazwischen in Grauschattierungen dargestellt werden.
    4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass das natürli- che Chromosom in Fraktionen einer Länge von 10. 000 bis 1. 000.000 bp, vorzugsweise einer Länge von 50. 000 bis 500. 000 bp, noch bevorzugter einer Länge von 100. 000 bis 300. 000 bp unterteilt wird.
    5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass die Frakti- on mit einem CG-Gehalt von 30 bis 35 %, vorzugsweise 33 %, einem Minimalwert und die Fraktion mit einem CG-Gehalt von 60 bis 65 %, vorzugsweise 62 %, einem Maximalwert zugeordnet wird.
    6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass Fraktionen mit unbekannter Sequenz der Wert gemäss ihrer morphologischen Erscheinung zugeordnet wird.
    7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass nach der Herstellung des virtuellen Chromosoms ein Filter zur Glättung der Erscheinung, vorzugs- weise ein Gausssches Faltungsfilter, angewendet wird.
    8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass zur Herstel- lung des virtuellen Chromosoms ein Skalenkorrekturfilter angewendet wird.
    9. Virtuelles Chromosom oder Teil davon, das bzw. der durch Werte gemäss seinem CG- Gehalt dargestellt wird, dadurch gekennzeichnet, dass die Herstellung nach einem der Ansprüche 1 bis 6 erfolgt.
    10. Virtuelles Chromosom oder Teil davon nach Anspruch 9, dadurch gekennzeichnet, dass der Wert ein Lichtwert ist.
    11. Virtuelles Chromosom oder Teil davon nach Anspruch 10, dadurch gekennzeichnet, dass der Maximalwert weiss, der Minimalwert schwarz und Werte dazwischen in Grau- schattierungen dargestellt sind.
    12. Satz von virtuellen Chromosomen oder Teilen davon, dadurch gekennzeichnet, dass er zwei oder mehr Chromosome oder Teile davon nach einem der Ansprüche 9 bis 11um- fasst.
    13. Satz nach Anspruch 12, dadurch gekennzeichnet, dass er Chromosome oder Teile da- von umfasst, die für einen oder mehrere Organismen spezifisch sind.
    14. Satz nach Anspruch 13, dadurch gekennzeichnet, dass er 24 menschliche Chromosome oder Teile davon umfasst.
    15. Satz nach Anspruch 14, dadurch gekennzeichnet, dass er weiters zusätzliche modifizier- te Chromosome oder Teile davon, vorzugsweise Chromosome mit Translokationen, um- fasst.
    16. Verwendung eines Satzes von virtuellen Chromosomen nach einem der Ansprüche 12 bis 15 zur Katalogisierung von Chromosomenmodifikationen.
    17. Verwendung eines Satzes von virtuellen Chromosomen nach einem der Ansprüche 12 bis <Desc/Clms Page number 12> 15 zur virtuellen Kartierung der chromosomalen Position einer Sequenz.
    18. Verwendung eines Satzes von virtuellen Chromosomen nach einem der Ansprüche 12 bis 15 als Schnittstelle zwischen morphologischen und molekulargenetischen Daten.
    19. Verwendung nach Anspruch 18, dadurch gekennzeichnet, dass die morphologischen Daten von Informationen stammen, die auf dem Internationalen System für Humane Zyto- genetische Nomenklatur (ISCN) basieren.
    20. Verwendung nach einem der Ansprüche 16 bis 19, dadurch gekennzeichnet, dass der Chromosomensatz als Referenz zur Klassifizierung eines Phänotyps zu einer Sequenzan- ordnung dient.
    21. Verwendung nach einem der Ansprüche 16 bis 20, dadurch gekennzeichnet, dass der Chromosomensatz als Werkzeug zur Durchführung von Struktur- bzw. Funktionsanalysen einer Sequenzanordnung dient.
    22. Verwendung nach einem der Ansprüche 16 bis 21, dadurch gekennzeichnet, dass der Chromosomensatz ais Werkzeug zur Bestimmung des Einflusses eines bestimmten Fak- tors auf eine Sequenzanordnung dient.
    HIEZU 6 BLATT ZEICHNUNGEN
AT0143002A 2002-09-24 2002-09-24 Verfahren zur herstellung eines virtuellen chromosoms AT412476B (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
AT0143002A AT412476B (de) 2002-09-24 2002-09-24 Verfahren zur herstellung eines virtuellen chromosoms
EP03798163A EP1563444A2 (de) 2002-09-24 2003-09-16 Verfahren zur erzeugung von virtuellen chromosomen
AU2003275968A AU2003275968A1 (en) 2002-09-24 2003-09-16 Method for producing virtual chromosomes
PCT/EP2003/010254 WO2004029747A2 (en) 2002-09-24 2003-09-16 Method for producing virtual chromosomes

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
AT0143002A AT412476B (de) 2002-09-24 2002-09-24 Verfahren zur herstellung eines virtuellen chromosoms

Publications (2)

Publication Number Publication Date
ATA14302002A ATA14302002A (de) 2004-08-15
AT412476B true AT412476B (de) 2005-03-25

Family

ID=32034594

Family Applications (1)

Application Number Title Priority Date Filing Date
AT0143002A AT412476B (de) 2002-09-24 2002-09-24 Verfahren zur herstellung eines virtuellen chromosoms

Country Status (4)

Country Link
EP (1) EP1563444A2 (de)
AT (1) AT412476B (de)
AU (1) AU2003275968A1 (de)
WO (1) WO2004029747A2 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013138527A1 (en) * 2012-03-13 2013-09-19 The Chinese University Of Hong Kong Methods for analyzing massively parallel sequencing data for noninvasive prenatal diagnosis

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6136540A (en) * 1994-10-03 2000-10-24 Ikonisys Inc. Automated fluorescence in situ hybridization detection of genetic abnormalities

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6136540A (en) * 1994-10-03 2000-10-24 Ikonisys Inc. Automated fluorescence in situ hybridization detection of genetic abnormalities

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DAIGO ET AL. (DNA RES. 6(4) (1999), S. 227-233 *
HRABER ET AL. GENOME BIOLOGY 2(9) (2001): RESEARCH 0037.1-0037.14 *
JINGWEI ET AL. (PNAS 94 (1997), S. 6862-6867 *

Also Published As

Publication number Publication date
WO2004029747A3 (en) 2005-05-26
AU2003275968A8 (en) 2004-04-19
EP1563444A2 (de) 2005-08-17
WO2004029747A2 (en) 2004-04-08
ATA14302002A (de) 2004-08-15
AU2003275968A1 (en) 2004-04-19

Similar Documents

Publication Publication Date Title
DE69827913T2 (de) Systeme und Verfahren zur Ausrichtung eines abgetasteten Bildes
DE69904165T2 (de) Verfahren zur bewertung chemischer und biologischer tests
DE69733958T2 (de) Verfahren zur positionierung von klonen mittels molekularen kaemmens
DE60028768T2 (de) Verwendung des kammverfahrens zur identifizierung von dna replikationsstarts
Bass et al. A maize root tip system to study DNA replication programmes in somatic and endocycling nuclei during plant development
EP1934580A1 (de) Verfahren zur detektion von konturen in bildern biologischer zellen
DE102018104616A1 (de) Verfahren zum Aufteilen eines oder mehrerer Bilder einer Probe in nach Farbstoffen aufgeteilte Bilddaten, Computerprogrammprodukt, computerlesbares Medium, auf dem das Computerprogrammprodukt gespeichert ist, und System zum Aufteilen eines oder mehrerer Bilder einer Probe in nach Farbstoffen aufgeteilte Bilddaten
WO2016174084A1 (de) Verfahren zum generieren eines reflexionsreduzierten kontrastbildes und diesbezügliche vorrichtungen
DE102005024949A1 (de) Verfahren zur Darstellung von Strukturen innerhalb von Volumendatensätzen
EP1019544B1 (de) Verfahren zum vergleich der kopienzahl von nukleinsäuresequenzen
DE102018215770A1 (de) Bildbearbeitungsvorrichtung, Zell-Erkennungsvorrichtung, Zell-Erkennungsverfahren und Zell-Erkennungsprogramm
AT412476B (de) Verfahren zur herstellung eines virtuellen chromosoms
DE60026732T2 (de) Zellenreihen-extraktionsverfahren
DE102021125576A1 (de) Verfahren zur ordinalen Klassifizierung eines Mikroskopbildes und Mikroskopiesystem
DE69316028T2 (de) Methoden zur bestimmung des nukleotidgrösse in dna-fragmenten
DE102005015000A1 (de) Verfahren und System zur Analyse von arraybasierten Komparativhybridisierungsdaten
DE10315581B4 (de) Verfahren zur Qualitätsbestimmung von RNA-Proben
EP1369493A1 (de) Verfahren zur quantitiven Bestimmung des Methylierungsgrades von Cytosinen in CpG-Positionen
Midroit et al. Non-imaged based method for matching brains in a common anatomical space for cellular imagery
DE60009746T2 (de) Verfahren zur registrierung von abscheidungsmustern
DE102014108357B4 (de) Ganzkörperbildaufnahme- und Bildverarbeitungssystem sowie Verfahren zu dessen Betrieb
DE112020006088T5 (de) Computerimplementiertes verfahren zum umwandeln eines eingangsbildes in ein ausgangsbild basierend auf einem referenzbild
DE102011083635A1 (de) 3D-Visualisierung medizinischer 3D-Bilddaten
CH699132B1 (de) Computerimplementiertes Verfahren zur Suche von in mindestens einer Datenbank gespeicherten molekularbiologischen Informationen.
DE10052583B4 (de) Verfahren zur Optimierung der molekularen Multiplex-Diagnostik von Microtissue Arrays mit Hilfe von Virtual Cell Nucleus Imageing

Legal Events

Date Code Title Description
ELJ Ceased due to non-payment of the annual fee