DD245676A5 - Verfahren zur Identifizierung einer Testprobe genomischer DNA - Google Patents

Verfahren zur Identifizierung einer Testprobe genomischer DNA

Info

Publication number
DD245676A5
DD245676A5 DD245676A5 DD 245676 A5 DD245676 A5 DD 245676A5 DD 245676 A5 DD245676 A5 DD 245676A5
Authority
DD
German Democratic Republic
Prior art keywords
dna
sequence
core
fragments
probe
Prior art date
Application number
Other languages
English (en)
Publication date

Links

Abstract

Die Erfindung betrifft ein Verfahren zur Identifizierung einer Testprobe genomischer DNA, wobei die Existenz von DNA-Regionen mit Hypervariabilitaet ausgenutzt wird, die sonst Minisatellitenregionen genannt werden. Es wurde gefunden, dass viele derartige Regionen gleichzeitig in einer solchen Weise sondiert werden koennen, dass diese Variabilitaet unter Verwendung einer DNA- oder anderen Polynucleotidsonde nachgewiesen wird, deren wichtigster Bestandteil eine kurze Kernsequenz ist, die tandemartig mindestens dreimal und vorzugsweise mindestens zehnmal wiederholt wird. Durch die Sondierung werden Differenzen in der Genom-DNA an mehreren stark-polymorphen Minisatellitenregionen aufgedeckt, so dass ein individuumspezifisches DNA-"Erkennungszeichen" ("finderprint") erzeugt wird, das von allgemeinem Nutzen fuer genetische Identifizierungszwecke ist.

Description

Kern GGAGGTGGGCAGGAgG
33,6 (a)aGGGCtGGAGG
33,15 aGAGGTGGGCAGGtGG
33,5g GGAGGTGGGCAGGAGG
M13KernB GTGGGCAGGAAG
M13KernC TGGGCAG
M13KernD GGTGGGCAGGtGG worin T = T oder U ist.
Hierzu 21 Seiten Zeichnungen
Anwendungsgebiet der Erfindung
Die Erfindung betrifft ein Verfahren zur Identifizierung einer Testprobe genomischer DNA durch Bezugnahme auf einen oder mehrere Standards.
Charakteristik der bekannten technischen Lösungen
Das bisher wichtigste Verfahren zur Identifizierung genetischer Veränderungen im Genom-DNA besteht im Nachweis von Restriktions-Fragmentlängen-Polymorphismen (RFLPs). Siehe beispielsweise die Identifizierung der Stelle des für Huntington-Chorea-Erkrankung verantwortlichen DNA-Defektes von J. F. Gusella, u.a., Nature 306,234-238 (1983) und die Analyse von Prädisposition für Retinoblastom von W.K.Cavanee, u.a.. Nature 305, 779-784 (19.83).
Die meisten RFLPs resultieren aus geringfügigen Veränderungen in der DNA, normalerweise Basen-Substitutionen, die spezielle Restriktions-Endonuclease-Spaltungsstellen schaffen oder zerstören. Da die durchschnittliche Heterozygotie von Human-DNA gering ist (annähernd 0,001 je Basenpaar), werden Restriktions-Endonucleasen selten einen RFLP an einer bestimmten Stelle nachweisen. Selbst wenn sie nachgewiesen werden, sind die meisten RFLPs nur dimorph (Vorhandensein und Fehlen einer Restriktions-Endonuclease-Spaltungsstelle) mit einer durch Allel-Frequenzen bestimmten Heterouygotie, die niemals 50% überschreiten kann und die gewöhnlich viel geringer ist. Infolgedessen werden alle derartigen RPLPs bei der Stammbaumanalyse uni0nformativ sein, wenn kritische Individuen homozygot sind.
Eine genetische Analyse könnte durch zur Verfugung stehende Sonden für hypervariable Regionen der DNA, die multiallele Veränderung und entsprechend hohe Heterozygotie zeigen, beträchtlich vereinfacht werden. Die erste solche Region wurde von A. R.Wyman, u.a., Proc. Nat. Acad. Sei. USA 77, 6754-6758 (1980) zufällig aus einer Sammlung von wahllosen Segmenten von Human-DNA isoliert. Die strukturelle Basis für multiallele Veränderung an dieser Stelle ist noch nicht bekannt. Anschließend wurden, wieder durch Zufall, verschiedene andere stark variable Regionen nahe dem Human-Insulin-Gen (G. I. Bell, u.a., Nature 295,31-35 [1982]),Zeta-Globin-Genen (N. J.Proudfoot, u.a., Cell31,553-563 [1982]) und S. E. Y.Goodbourn u.a., Proc. Nat. Acad. Sei. USA 80, 5022-5026 [1983]) und c-Ha-ras-1 Onkogen (D. J.Capon, u.a., Nature 302,33-37 [1983]) entdeckt. In jedem Fall besteht die variable Region aus Tandem-Wiederholungen von einer kurzen Sequenz (einem „Minisatelliten"), und Polymorphismus ist auf Allel-Differenzen in der Anzahl der Wiederholungen zurückzuführen, die vermutlich durch mitotischen oder meiotischen ungleichmäßigen Austausch oder durch DNA-Gleiten während der Replikation verursacht werden. Die resultierende Veränderung der Minisatellitenlänge kann unter Anwendung einer beliebigen Restriktions-Endonuclease nachgewiesen werden, welche die Wiederholeinheit nicht spaltet.
Der Erfinder und seine Kollegen haben kürzlich einen kurzen, aus vier Tandem-Wiederholungen einer 33-BP-Sequenz bestehenden Minisatelliten in einem Intron des Human-Myoglobin-Gens beschrieben, siehe P.Weiler, u.a., EMBOJ. 3,439—446 (1983). Es wurde beobachtet, daß die 33-BP-Wiederholung eine schwache Ähnlichkeit in der Sequenz mit den oben erwähnten anderen Human-Minisatelliten zeigte, die kürzlich charakterisiert wurden. In dem Artikel wird vermutet, daß die Minisatelliten-Regionen auf Transposition zurückzuführen sein können. Wenn die 33-BP-Wiederholung im Human-Myoglobin-Gen umstellbar wäre, dann könnte sie eine Sonde für sich wiederholende Tandem-Regionen des Human-Genoms darstellen, die häufig mit multiallelem Polymorphismus infolge Veränderung der Wiederholanzahl einhergehen.
Human-Genom-DNA wurde mit einer DNA-Sonde sondiert, die Tandem-Wiederholungen der 33-BP-Sequenz von dem Myoglobin-Gen enthielt. Polymorphe Veränderung wurde an mehreren unterschiedlichen Regionen in der Genom-DNA von 3 P.ersonen (Vater, Mutter und Tochter) beobachtet, wobei die Veränderung in der Größe der größeren Fragmente (2-6 KB) auftritt. Die Werte stimmten mit gleichbleibend vererbbarem Polymorphismus infolge Längenveränderungen von mehr als einer der Minisatellitenregionen überein.
Darlegung des Wesens der Erfindung
Weitere Forschungsarbeiten haben ergeben, daß es möglich ist, Genom-DNA in einer solchen Weise zu sondieren, daß die Variabilität in den Minisatelliten oder hypervariablen Regionen viel wirksamer dargestellt werden kann als durch Anwendung der Myoglobin-Gen-33-BP-Wiederholungs-Sonde.
Die Erfindung basiert auf der Entdeckung, daß viele Minisatelliten in Human- oder Tier-Genom-DNA eine Region von DNA enthalten, die einen hohen Grad an Homologie zwischen unterschiedlichen Minisatelliten besitzt. Diese gemeinsame Kernregion hat eine geringe Länge, annähernd 16 Basenpaare. Es wurde jetzt gefunden, daß eine Sonde, die als Hauptbestandteil eine kurze Kernsequenz von mindestens dreimal tandemartig wiederholten Nucleotiden aufweist, zum Nachweis vieler unterschiedlicher Minisatellitenregionen in der Genom-DNA und mit einem so hohen Genauigkeitsgrad, daß Individuen identifiziert oder durch Bezugnahme auf Veränderungen in ihrer DNA in diesen Regionen eindeutig ermittelt werden können, dienen kann. Ein solches ausgezeichnetes Ergebnis war vollkommen unerwartet, weil durch vorhergehende Forschungsarbeiten Sonden erzeugt wurden, die nur einzelne Minisatellitenregionen in Genom-DNA nachweisen konnten. Diese bisherigen Sonden führten zu einem besseren Grad der Differenzierung als durch RFLPs möglich ist, aber nicht zu einer Charakterisierung (fingerprint), die im wesentlichen einmalig für ein Individuum ist. Bemerkenswerterweise würde gefunden, daß die erfindungsgemäße Kernsonde DNA durch Bezugnahme auf mehr als eine Minisatellitenregion oder hypervariable Stelle differenzieren kann, und es ist diese Entdeckung, die der erfinderischen Leistung einen hohen Grad von Unwahrscheinlichkeit verleiht, wodurch diese zu einer Erfindung von grundlegender wissenschaftlicher Neuartigkeit und Bedeutung wird.
Ist eine Kernsequenz bekannt, dann können DNA-Sonden erzeugt werden, die die Eigenschaft zur Hybridisierung mit Minisatellitenregionen von einer Vielzahl von Stellen in dem Genom besitzen. Allerdings reicht die bloße Erkennung oder Identifikation einer bestimmten Kernsequenz selbst nicht für die Herstellung einer einsatzfähigen Sonde aus. Es ist ebenfalls erforderlich, ein Polynucleotid zu erzeugen, das Tandem-Wiederholungen der Kernsequenz oder Derivate davon enthält. Solche Sonden können als Minisatelliten von Human-oder Tier-DNA isoliert werden, oder sie können auch durch synthetische Techniken hergestellt werden. Es müssen auch die zusätzlichen Einschränkungen festgelegt werden, die eine erfolgreiche Hybridisierung beeinträchtigen. Dazu gehören Kenntnisse über den möglicherweise tolerierbaren Grad der Homologie mit dem Konsensuskern und auch über die tolerierbare Länge jeder Nicht-Kem-DNA innerhalb der sich wiederholenden Einheit als Ganzes und ohne diese.
Somit betrifft die Erfindung die Erkenntnis und Entdeckung, (1) daß Kenntnisse über eine beliebige Kernsequenz in dieser Weise genutzt werden können. Das umfaßt die weitere Einschätzung;
(2) daß durch die Untersuchung verschiedener hypervariabler Stellen in einem Genom unterschiedliche Kernsequenzen mit dem erforderlichen Grad an Konsensus gefunden werden können;
(3) daß eine Familie von DNA-Sonden zusammengestellt werden kann, die unterschiedliche Spektren vom Polymorphismus erkennen können;
(4) daß eine bestimmte genetische Klassifizierung mit der einen Sonde erfolgreicher als mit einer anderen vorgenommen ' werden kann;
(5) daß durch die Verwendung von mehr als einer Sonde bei einer beliebigen Klassifizierung die Wahrscheinlichkeit der Identifizierung erhöht wird;
(6) daß durch eine weitere Untersuchung einer ersten Generation von erfolgreichen Sonden einfachere und erfolgreichere Sonden erzeugt werden können, z. B. durch Synthese.
So betrifft die Erfindung in einem ersten Aspekt ein Verfahren zur Herstellung eines Polynucleotide mit polymorphen Minisatelliten-längenspezifischen Bindungsmerkmalen, das umfaßt:
(I) Identifizierung einer natürlichen Tandem-Wiederholsequenz in DNA, die zu einer begrenzten Hybridisierung zu anderen polymorphen DNA-Regionen fähig ist,
(II) Identifizierung einer natürlichen Konsensuskernsequenz der Wiederholsequenz, die wahrscheinlich für eine derartige Bindung verantwortlich ist, und
(III) Isolierung oder künstlicher Aufbau einer vollständigen oder unvollständigen Tandemwiederholsequenz, abgeleitet von der natürlichen Konsensuskernsequenz mit Minisatelliten-Bindungseigenschaften, die eine geringere Genom-Stellen-Spezifität und höhere polymorphe Fragmentakzeptierung als die natürliche Wiederholsequenz aufweist.
Die Kernkomponente der Sonde kann in unterschiedlicher, auf den gleichen zugrundeliegenden Prinzipien basierender Weise definiert werden. Das wichtigste zugrundeliegende Prinzip ist, daß die Wiederholsequenz der Sonde aus einer Nucleotidsequenz von einer gemeinsamen Kern region besteht oder diese enthalten soll, die Minisatelliten sowohl von Human- als auch Tiergenom-DNA besitzt. Die gemeinsame Kernregion ist „gemeinsam" in dem Sinne, daß sie einen hohen Grad an Konsensus, z. B. mindestens 80%, wie zwischen einem Minisatelliten und einem anderen wiedergibt. Diese Minisatelliten sind nachweisbar, z. B. durch Sondierung von Genom-DNA-Fragmenten mit der Myoglobin-Gen-33-BP-Wiederholsequenz, so daß hybridisierte Fragmente entstehen, die hier als „A33-positive" Fragmente bezeichnet werden. Diese Fragmente und die 33-BP-Wiederholung des Myoglobin-Gens enthalten eine Kernsequenz von annähernd 16 gemeinsamen BP. Die X33-positiven Fragmente können inrerseits als Sonden von Genom-DNA zur Erzeugung weiterer Fragmente verwendet werden, die ebenfalls die gemeinsame Kernsequenz besitzen, allerdings möglicherweise mit einer geringen Abwandlung derselben.
Ein anderes Prinzip besagt, daß die Kem-Nucleotid-Sequenz nicht so kurz sein darf, daß sie nicht wirksam zu den Minisatellitenregionen der Proben-DNA hybridisieren aber auch nicht so lang sein darf, daß die den Polymorphismus nicht gut entdecken kann, z.B. daß die der 33-BP-Tandem wiederholung in dem Myoglobin-Genzuähnlich wird. Im allgemeinen sollte der Kern 6 Nucleotide bis zu dem Maximum haben, das in dem gemeinsamen Kern von Minisatelliten gefunden wurde, annähernd 16. Die Wiederholsequenz der Sonde muß nicht gänzlich aus dem Kern bestehen, sondern kann eine geringe Anzahl von flankierenden Nucleotiden an beiden Seiten der Kernsequenz enthalten. Die sich wiederholenden Einheiten brauchen nicht genaue Wiederholungen weder hinsichtlich der Anzahl noch der Art von Nucleotiden und auch nicht hinsichtlich der Kern- oder Nicht-Kern-Komponenten der sich wiederholenden Einheiten zu sein. Es ist aber zweckmäßig, sie hier als sich wiederholende Einheiten zu beschreiben und zu definieren, wenn das auch nur eine annähernde Bezeichnung ist. Der Block von η sich wiederholenden Einheiten kann an beiden Seiten von einer Nucleotid-Sequenz flankiert sein, deren Umfang und Art gewöhnlich irrelevant ist
Erfindungsgemäße Polynucleotide umfassen speziell diejenigen, die in jeder der folgenden Formen definiert werden:
ERSTE DEFINITION
Polynucleotide mit der allgemeinen Formel, gelesen in der 5' —> 3'-Richtung
H-(J-Kern-K)n L (1)
worin:
„Kern" eine Sequenz darstellt mit mindestens 6 aufeinanderfolgenden Nucleotiden, ausgewählt aus einer der folgenden Sequenzen, die in der gleichen Richtung gelesen werden:
GGAGGTGGCAGGAXG (2)
AGAGGTGGGCAGGTGG (3)
GGAGGYGGGCAGGAGG (4)
T(C)mGGAGGAXGG(G)pC (5A)
T(C)mGGAGGA(A)qGGGC (5B)
worin:
X A oder G ist, Y C oderT ist, m 0,1 oder 2 ist, ρ 0 oder 1 ist, q Ooder 1 ist, η mindestens 3 ist; J und K zusammen 0 bis 15 zusätzliche Nucleotide innerhalb der sich wiederholenden Einheit darstellen; und H und L je Ooder mindestens 1 zusätzliches, die sich wiederholenden Einheiten flankierendes Nucieotid darstellen, und vorausgesetzt, daß
(I) „Kern" und J und K nicht unbedingt die gleiche Sequenz oder Länge in jeder (J · Kern · K) sich wiederholenden Einheit haben;
(II) „Kern" auch eine Variant-Kernsequenz darstellen kann;
(III) die gesamten tatsächlichen Kernsequenzen in allen η sich wiederholenden Einheiten mindestens 70% Homologie mit den gesamten „echten" Kernsequenzen, wie oben in bezug auf die Formeln 2 bis 5 definiert, in der gleichen Anzahl von η sich wiederholenden Einheiten haben;
und Polynucleotide mit komplementärer Sequenz zur obigen.
ZWEITE DEFINITION
Polynucleotide mit der allgemeinen Formel
H-(J-Kern-K)n-L (1)
„Kern" eine Sequenz von 6 bis 16 aufeinanderfolgenden Nucleotiden darstellt, gelesen in dergleichen 5' —* 3' Richtung, ausgewählt aus (1) oder 5'/3'gemeinsamen Kernregion eines ersten Human-oder Tierminisatelliten, gewonnen durch Sondierung von Human- oder Tier-Genom-DNA mit einer Sonden-DNA, die eine Myoglobin-Tandemwiederholsequenz von annähernd 33 NT je Wiederholeinheit enthält, (2) der 5' -» 3' gemeinsamen Kernregion eines zweiten Human- oder Tierminisatelliten, gewonnen durch Sondierung von Human- oder Tier-DNA mit einer Sonden-DNA, die eine Tandemwiederholsequenz aus der gemeinsamen Kernregion des ersten Minisatelliten enthält, und (3) der 5'—»3'gemeinsamen Kernregion eines dritten Human- oder Tierminisatelliten, gewonnen durch Sondierung von Human-oder Tier-Genom-DNA mit einer Sonden-DNA, die eine Tandemwiederholsequenz aus der gemeinsamen Kernregion des zweiten Minisatelliten enthält, wobei jede der Tandemwiederholsequenzen eine Wiederholung von mindestens 3 Einheiten ist, und Polynucleotide mit komplementärer Sequenz zu der obigen.
DRITTE DEFINITION
Polynucleotide mit der allgemeinen Formel
H-(J-Kern-K)n-L (1)
„Kern" eine der Sequenzen mit mindestens 6 aufeinanderfolgenden Nucleotiden von innerhalb einer gemeinsamen Kern region von Minisatelliten von Human- oder Tier-Genom-DNA, die mindestens 75%, vorzugsweise 80%, Konsensus ergibt, darstellt; „Kern" nicht unbedingt die gleiche Sequenz in jeder sich wiederholenden Einheit haben muß, und alle anderen Symbole die oben erläuterte Bedeutung haben,
und Polynucleotide mit komplementärer Sequenz zu der obigen.
VIERTE DEFINITION
Polynucleotide mit mindestens drei Wiederholungen einer Sequenz von 6 bis 36NT, einschließlich einer abgeleiteten (5' —» 3') Kernsequenz, ausgewählt unter:
(5') GPGGGCWGGWXG (3') (6)
worin P nicht = G, W = A oder T und X = A oder G
oder eine Variante davon, vorausgesetzt, daß die gesamten tatsächlichen Kernsequenzen in allen Wiederholungen mindestens 70% Homologie mit den gesamten „echten" Kernsequenzen, definiert in bezug auf Formel (6), in der gleichen Anzahl von Wiederholungen aufweisen,
und Polynucleotide mit komplementärer Sequenz zu der obigen.
In den obigen Formeln und im Text wird die Sequenz in der üblichen Bezeichnung 5' -» 3' gezeigt.
Die Erfindung umfaßt Polynucleotide von DNA, RNA und von jeder anderen, zu DNA hybridisierbaren Art. Die Polynucleotide nach obiger Definition sind unmarkiert und können Doppelstrang (DS)- oder Einzelstrang (SS)-Form haben.
Die Erfindung umfaßt markierte Polynucleotide in SS-Form zur Verwendung als Sonden sowie ihre markierten DS-Vorläufer, von denen die SS-Sonden hergestellt werden können.
Vorzugsweise sind sie in einer beliebigen herkömmlichen Form 32P-radiomarkiert, können aber alternativ mit Hilfe anderer auf dem Gebiet der Hybridisierung allgemein bekannter Maßnahmen radiomarkiert werden, mit Biotin oder einem ähnlichen Stoff nach dem Verfahren von D. C. Ward, u.a., wie in Proceedings of the 1981ICN-UCLA Symposium on Developmental Biology using Purified Genes (Berichte des ICN-UCl-A Symposiums von 1981 über Entwicklurjgsbiologie unter Verwendung gereinigter Gene) in Colorado vom 15. bis 20. März 1981, Band XXII11981, Seiten 647 bis 658, Academic Press, Herausgeber Donald D. Brown, u. a., beschrieben wird, oder sogar enzym-markiert nach dem Verfahren von A. D. B. Malmcolm, u. a. Abstracts of the 604 th Biochemical Society Meeting (Berichte der 604.Tagung der Biochemischen Gesellschaft), Cambridge, England (Tagung vom 1.JuIi 1983) sein.
Somit betrifft die Erfindung in einem weiteren Aspekt eine Polynudeotid-Sonde, die für genetische Abstammungsbestimmungen von Human- oder Tier-DNA enthaltenden Proben von Nutzen ist und außer einer markierten oder Markiererkomponente (marker) ein Polynucleotid mit mindestens drei Tandemwiederholungen (einschließlich Varianten) von Sequenzen aufweist, die mit einer Minisatellitenregion des Human- oderTier-Genoms bis zu einem Grade homolog sind, daß die Hybridisierung der Sonde zu einem entsprechenden DNA-Fragment möglich ist, das durch Fragmentieren der Proben-DNA mit einer Restriktions-Endonuclease gewonnen wurde,
gekennzeichnet dadurch, daß
a) die Wiederholungen jeweils einen Kern enthalten, der zu mindestens 70% mit einer Konsensuskernregion von ähnlicher Länge homolog ist, die in einer Vielzahl von Minisatelliten von verschiedenen Genom-Stellen vorhanden ist;
b) der Kern 6 bis 16 Nucleotide lang ist;
c) die Gesamtanzahl von Nucleotiden innerhalb der sich wiederholenden Einheit, die nicht zum Kern beiträgt, höchstens 15 beträgt.
Die Erfindung betrifft auch ein Verfahren zur Identifizierung einer Probe von Human- oder Tier-Genom-DNÄ mit einer erfindungsgemäßen Sonde und zum Nachweis von hybridisierten Fragmenten der DNA.
Dieser Aspekt der Erfindung kann umfassen:
Fragmentierung von Gesamt-DNA von einer Zellmaterialprobe unter Verwendung einer Restriktions-Endonuclease, Hybridisierung stark variabler DNA-Fragmente mit einer Sonde nach obiger Definition, die neben einer markierten oder Markiererkomponente eine wiederholte Kernkomponente enthält, und
Bestimmung de» Kennzeichen- oder Markiererkonzentration, die an DNA-Fragmente verschiedener Länge gebunden ist, oder allgemeiner an Bänder von verschiedener Molekülgröße.
Normalerweise wird die fragmentierte DNA vor der Hybridisierung nach der Kettenlänge eingestuft oder aufgespalten, z. B.
durch Elektrophorese, und die Markiererkonzentration ermittelt, um ein charakteristisches Musterzu erhalten, von dem einzelne Elemente spezifischen genetischen Ursprungs sind.
Definitionen
Die folgenden in der Erfindung und den oben genannten früheren Spezifikationen angewandten Definitionen können eine Hilfe sein.
Hypervariabel
Eine Region von Human- oder Tier-DNA an einem erkannten Platz oder einer erkannten Stelle wird als hypervariabel bezeichnet, wenn sie in vielen verschiedenen Formen auftritt, z. B. hinsichtlich der Länge oder Sequenz.
Restriktions-Fragment-Längen-Polymorphismus (RELP)
Genetische Veränderung im Muster von Human- oder Tier-DNA-Fragmenten, die nach Elektrophorese getrennt und mit Hilfe einer Sonde ermittelt werden.
Polymorph
Man bezeichnet ein Gen oder ein anderes Segment einer DNA als Polymorph, wenn es von einem Individuum zum anderen Veränderung zeigt.
Wiederholung oder Tandemwiederholung (Sequenz)
Eine Polynucleotidsequenz, die serienweise vollkommen oder unvollkommen wiederholt wird.
Minisstellit
Ein Bereich menschlicher oder tierischer DNA, der von Tandemwiederholungen einer kurzen DNA-Sequenz umgeben ist. Alle Wiederholungseinheiten müssen nicht notwendigerweise vollkommene Identität zeigen.
Übereinstimmungskern (Sequenz)
Eine Sequenz, die als am nächsten kommend unter einer Anzahl von Wiederholungssequenzen bezeichnet werden kann; üblicherweise unter den Wiederholungseinheiten von zwei oder mehr Restriktionsenzymfragmenten unterschiedlichen Ursprungs oder Ortes.
Unvollkommene Wiederholung (Sequenz)
Eine Sequenz, die keine exakte Wiederholung entweder hinsichtlich Anzahl oder hinsichtlich Art der Nucleotide darstellt, jedoch erkennbar eine Wiederholung einer Übereinstimmungssequenz ist; üblicherweise eine Kemsequenz oder eine Wiederholung, die eine Kernsequenz enthält.
Variante
Eine tatsächliche Sequenz, die von einer definierten Wiederholungssequenz in einem geringen Grad abweicht (mehr als 50% Homologie).
Kern (Sequenz)
Ursprünglich ein einzelner kleiner eindeutiger Bereich der Sequenzähnlichkeit innerhalb einer Übereinstimmungs- ;
Wiederholungssequenz und durch Restriktionsenzymfragmente abgetrennt, dazu verwendet, die Übereinstimmungs-Wiederholungssequenz zu definieren sowie durch Minisstellithybridisierung mit jedem Fragment. Ausgedehnt darauf, auf daraus abgeleitete Wiederholungssafluenzen, z. B. definierte Kernsequenzen (unten) Bezug zu nehmen.
Definierter Kern (Sequenz)
Eine Kernsequenz mit vollständiger Übereinstimmung mit einer der Formeln (2) bis (8) innerhalb ihrer eigenen Länge.
Prozent Homologie
Im Vergleich zweier Sequenzen dergleichen Länge die Anzahl der Basenpaare (bp) minus Anzahl der bp-Substitutionen in einer, die notwendig ist, die andere zu ergeben, als Prozentsatz der Anzahl der Basenpaare (bps).
Nucleotid (nt) und Basenpaar (bp) werden synonym verwendet. Beide können DNA oder RNA bezeichnen. Die Abkürzungen C, A, G, T beziehen sich üblicherweise auf (Desoxy)Cytidin, (Desoxy)Adenosin, (Desoxy)Guanosin und entweder Desoxythymidin oder-Uridin.
Die Tandemwiederholungssequenz (künstlich oder natürlich isoliert) kann somit eine vollkommene Wiederholung sein, ist aber vorzugsweise eine unvollständige Wiederholung. Vorzugsweise sind mindestens zwei Wiederholungen unvollständige Wiederholungen der Konsensuskernsequenz. Es sind vorzugsweise mindestens drei Wiederholungen und noch besser mindestens 7 in der Sondensequenz vorhanden.
Die Herstellung einer Sonde kann die Isolierung eines natürlichen Minisatelliten durch ΚΙοηέη und die Identifizierung durch DNA-Sequenzierung erforderlich machen. Sie kann auch die Excision des verlangten Kernes und seine anschließende Umwandlung in eine Tandemwiederholung oder die Stimulierung von ungleichartigen Austauschvorgängen mit Kernfragmenten unterschiedlichen Ursprungs erfordern. Sie kann auch das Klonen des Polynucleotide umfassen.
Andererseits kann der Aufbauschritt auch das Synthetisieren der identifizierten Konsensuskernsequenz oder eines Fragmentes davon einschließen. Die Konsensuskernsequenz enthält vorzugsweise nicht weniger als 6BP und vorzugsweise nicht mehr als · 16BP. Eine Tandemwiederholung des synthetischen Kerns wird dann konstruiert.
In natürlicher Form kann das Polynucleotid aus einer Aufeinanderfolge von Vorgängen zu verschiedenen Zeiten, worauf Klonen erfolgreicher oderteilweise erfolgreicher Zwischenprodukte folgt, resultieren und kann Fragmente natürlicher oder synthetischer Herkunft enthalten, so daß das endgültige Polynucleotid wenig Ähnlichkeit mit dem Ausgangs-Minisatelliten haben kann.
Die erfindungsgemäßen Sonden sind für folgende Gebiete brauchbar:
1. Vaterschafts- und Mutterschaftsnachweis bei Menschen.
2. Familiengruppenverifizierung, z. B. bei Einwanderungskonflikten und Erbschaftsstreitigkeiten.
3. Zygotie-Prüfungen bei Zwillingen.
4. Prüfungen auf Inzucht bei Menschen.
5. Allgemeine Abstammungsanalysen bei Menschen.
6. Identifikation von Stellen von Erbkrankheiten bei Menschen, wo durch die Konstruktion spezifischer Sonden der Nachweis eines genetischen Defektes ermöglicht wird.
7. Gerichtsmedizin
(a) Eindeutige Bestimmung von Spermaproben von Vergewaltigungsopfern
(b) Eindeutige Bestimmung von Blut-, Haar- und Spermaproben, z. B. von verschmutzter Kleidung
(c) Identifizierung von menschlichen Überresten.
8. Zell-Chimarismus-Untersuchungen, z. B. Verfolgen von Spender- gegenüber Empfängerzellen nach Knochenmarktransplantation.
9. Viehzüchtungs- und Stammbaumanalysen/Bescheinigung der Echtheit. (Dazu könnten beispielsweise die laufende Kontrolle
und Überwachung von reinen Tierrassen und die Überprüfung von Stammbäumen im Falle von Rechtsstreitigkeiten, so z. B. bei der Rennpferd- und Hündezüchtung, gehören). Auch zur Bereitstellung genetischer Markierungssubstanzen, die einen Zusammenhang mit vererbten Merkmalen von wirtschaftlicher Bedeutung zeigen könnten.
10. Routinemäßige Qualitätskontrolle von Zellreihen gezüchteter Tiere, Überprüfung auf Kontamination reiner Zellreihen und für routinemäßige Identifikationsarbeiten.
11. Analyse von Tumorzellen und Tumoren in bezug auf molekulare Abnormitäten.
12. Man ist der Meinung, daß die Polynucleotide oder davon abgeleiteten Sonden eine potentielle Verwendung in der Pflanzenzüchtung finden werden.
Kurze Beschreibung der Zeichnungen:
Darin stellen dar:
Fig. 1 eine schematische Darstellung der Verfahrensweise zur Herstellung einer 33-BP-Wiederholsequenz des Myoglobin-Gens, ihr Einsatz in ein Plasmid und ihr Klonen;
Fig. 2 eine Photokopie einer Aufnahme von Autoradiogramm von Fragmenten der Genom-DNA-Hybridisierung zu verschiedenen DNA-Sonden, die auch einen Stammbaum verwandter Individuen zeigt, deren DNA in zwei der Autoradiogramme identifiziert wurde;
Fig. 3 Autoradiogramme von DNA-Proben von 3 nicht verwandten Menschen, die mit drei verschiedenen erfindungsgemäßen Sonden sondiert wurden;
Fig. 4 ein Autoradiogramm von DNA-Proben von 9 Menschen, von denen einige verwandt waren und von denen zwei eineiige Zwillinge waren, sondiert mit einer erfindungsgemäßen Sonde;
Fig. 5 Autoradiogramme von DNA-Proben von 2 Menschen und 17 Tieren, sondiert mit einer erfindungsgemäßen Sonde; Fig. 6 eine Reihe von Autoradiogrammen von DNA-Proben von Mitgliedern einer ghanesischen, in einen Einwanderungskonflikt verwickelten Familie, erfindungsgemäß sondiert;
Fig. 7 Autoradiogramme von DNA-Proben einer von Neurofibromatose befallenen blutsverwandten Gruppe; Fig. 8 Autoradiogramme von DNA von einem Gudscharati-Stamm, erzeugt zur Untersuchung von möglicher Mitvererbung von Minisatellitenfragmenten und erheblicher Persistenz von fetalem Hämoglobin (HPFH); und Fig.9a und 9b genetische Diagramme, die die Vererblichkeit von HPFH und verschiedenen Minisatelliten in einem großen Stamm zeigen;
Fig. 10 ein Diagramm, das die Herstellung eines geklonten künstlichen Minisatelliten zeigt; Fig. 11 eine Reihe von Autoradiogrammen von DNA-Proben von zwei nicht verwandten Nachgeburten, sondiert mit neuartigen synthetischen Sonden;
Fig. 12 eine Reihe vqn Autoradiogrammen von sondierten DNA-Proben von einer großen blutsverwandten Gruppe; Fig. 13 ein Autoradiogramm, das verschiedene DNA-Bandmuster zeigt, die bei Zwillingen unter Verwendung verschiedener Sonden erhalten wurden;
Fig. 14 ein Autoradiogramm, bei dem miteinsträngigerund mitdoppelsträngigen Sonden erzeugte Bandmuster verglichen werden;
Fig. 15 und 15A Autoradiogramme von DNA-Erkennungszeichen (fingerprints), erhalten von gerichtsmedizinischen Proben;" Fig. 16 ein Autoradiogramm, das von einer Hundefamilie erhaltene DNA-Erkennungszeichen (fingerprints) zeigt; Fig. 17 ein Autoradiogramm, das DNA-Erkennungszeichen (fingerprints) einer kurzhaarigen Hauskatzenfamilie zeigt; Fig. 18 ein Autoradiogramm, das von verschiedenen Schafen unter Verwendung von zwei verschiedenen Sonden gewonnene DNA-Erkennungszeichen (fingerprints) zeigt; ^
Fig. 19 ein Autoradiogramm, das DNA-Erkennungszeichen (fingerprints) von drei verschiedenen Schweinen zeigt; Fig.20 ein Autoradiogramm, das DNA-Erkennungszeichen (fingerprints) einer Kuh-Familie und weiterer Rinderzeigt; und Fig. 21 ein Fig. 20 ähnliches Autoradiogramm unter Verwendung anderer Sonden.
Eine Human-Genom-Sammlung von 10 bis 20KB Sau3A, teilweise von Human-DNA in Phage"\L47,1 geklont, wurde durch Hybridisierung mitder33-BP-Myoglobin-Wiederholsonde „pAV33,7" gescreent. Mindestens 40 start-bis-schwach hybridisierende Plaques wurden in einer Sammlung von 3 x 105Rekombinanten identifiziert. Eine willkürliche Auswahl von acht dieser positiven Plaques wurde gereinigt (λ33,1-15), und die Southern-Tüpfel-Analyse von Phagen-DNA wurde angewandt, um zu zeigen, daß die hybridisierende DNA in jedem Rekombinanten innerhalb einer einzigartigen kurzen (0,2-2KB) Region des . Rekombinanten lokalisiert war. Die Sequenz-Analyse zeigte, daß diese Region in jedem der acht Rekombinanten einen aus 3-29 Tandemkopien einer Wiederholsequenz, deren Länge von 16BP in λ33,15 bis 64 in λ33,4 reichte, bestehenden Minisatelliten enthielt. Die meisten Minisatelliten enthielten eine einheitliche Anzahl von Wiederholungen. In λ33,6 bestand die37-BP-Wiederholung ihrerseits aus einem divergierenden Trimer einer grundlegenden 12-BP-Einheit. Jeder A33-Rekombinant stellte eine andere Region des Human-Genoms dar, wie durch die jeden Minisatelliten flankierende klon-spezifische DNA-Sequenz bestätigt wurde.
Die acht geklonten Minisatellitenregionen befanden sich innerhalb von 0,5—2,2 KB Hinfl DNA-Fragmenten, die kleiner als die polymorphen2-6KB DNA-Fragmente sind, die durch pAV33,7 in Hinfl Digests von Human-DNA nachgewiesen werden können. Um bestimmen zu können, ob irgendeine der geklonten Minisatellitenregionen ebenfalls polymorph war, wurden 32P-markierte einsträngige DNA-Sonden von geeigneten M 13-Subklonen jedes Minisatelliten hergestellt und mit hoher Genauigkeit zu einer Gruppe von 14 nicht-verwandten Britisch-kaukasischen, mit Hinfl digerierten DNAn hybridisiert. Typische Hybridisierungsmuster zeigen, daß jede Sonde unter diesen Hybridisierungsbedingungen eine einzigartige Region des Human-Genoms entdeckt, und daß drei dieser Regionen stark polymorph sind
Nähere Einzelheiten der obigen Verfahrensweise sind in den Beispielen enthalten. Hinsichtlich der oben festgelegten Definitionen der Polynucleotide entsprechen die Definitionen der allgemeinen Formel
H- (J-C-K)n-L (8)
worin C eine Kernsequenz darstellt und die anderen Symbole die oben erläuterten Bedeutungen haben. In allen Definitionen kann die Kernsequenz in einer Einheit der nächsten gleichen oder sich von dieser unterscheiden. Sie kann beispielsweise ein zusätzliches Nucleotid oder zwei enthalten, ihr kann ein Nucleotid oder zwei fehlen, oder sie kann sich in (z. B.) 1 bis 4 Nucleotiden unterscheiden, wenn ein Vergleich mit einer für die sich wiederholenden Einheiten als Ganzes anwendbaren Konsensuskernsequenz angestellt wird.
Der Kern kann in verschiedener Weise definiert werden. Eine allgemeine Definition kann durch Bezugnahme auf die Verfahrensweise, durch die 'die Kernsequenz identifiziert werden kann, gewonnen werden. Eine Minisatellitenregion von Genom-DNA wird mit einer Sequenz wie
GGAGGTGGGCAGGAXG (2)
verglichen. Eine x-Nucleotide lange von dem Minisatelliten entnommene Sequenz, die die größte Homologie mit einem x-Nucleotiden zeigt, der von allen möglichen x-Nucleotid langen Sequenzen mit der Formel (2) ausgewählt wurde, wird als die
Kernsequenz angesehen. Das ist natürlich eine sehr begrenzte Möglichkeit für die Definierung des Kerns und sie sollte in einem oder wenigen Kernen von 6 Nucleotiden Länge, 1 oder wenigen von 7 Nucleotiden Länge und so weiter bis zu 16 Nucleotiden Länge resultieren („wenige", weil es in einigen Fällen mehr als eine Sequenz mit größter, z. B. 100%, Homologie geben wird). Um die entdeckte Möglichkeit von Veränderungen in der auf diese Weise definierten Kernsequenz aufzeigen zu können, wird vorausgesetzt, daß eine Veränderung bis zu einem solchen Ausmaß vorhanden sein kann, daß alle η sich wiederholenden Einheiten im Durchschnitt mindestens 70% Homologie ihrer Kerne mit Kernen nach obiger Definition aufweisen. Alle flankierenden Sequenzen, J und K, innerhalb der Wiederholeinheit werden nicht in die Betrachtung für Homologiezwecke einbezogen, wobei der Vergleich einzig zwischen Kernen angestellt wird. Die definierten Kerne können unterschiedliche Längen haben und können „gemischt" sein, d. h. sie können in einigen sich wiederholenden Einheiten homolog mit (z. B.) GGGCAGGAXG von Formel (2) und in anderen homolog mit (z.B.) GGGCAGGTGG von Formel (3) sein. Varianten sollten daher eher hinsichtlich der Homologien mit (Kern)n und nicht unbedingt mit „Kern" selbst betrachtet werden.
Die „erste", früher festgelegte Definition wurde von den obigen Erwägungen abgeleitet, aber dahingehend vereinfacht, daß der Kern als eine Sequenz von beliebiger Länge von 6 bis zum Maximum von 12-16, je nachdem, wie der Fall liegt, in den gezeigten Formeln (2) bis (5) definiert wird. Für Varianten gilt eine ähnliche Annahme.
Die „zweite" Definition definiert den Kern in bezug auf aufeinanderfolgende Hybridisierungsschritte, von denen jeder zusätzliche Minisatellitenfragmente erzeugen kann. Man wird leicht erkennen, daß es durch die Ausführung einer ausreichenden Anzahl von Hybridisierungen bei einer umfangreichen Sammlung von Human-Genom-DNA, Untersuchung einer ausreichenden Anzahl von hybridisierten Fragmenten, Herstellung von Sonden davon, erneuten Sondierung der Genom-DNA und so weiter, theoretisch unendlich viele Male möglich sein müßte, zu einem Bereich von Konsensuskernsequenzen zu gelangen, der weitgehend in Minisatelliten-DNAn repräsentiert ist. In der Praxis ist nicht anzunehmen, daß diese Vorgänge ungeheuer viele Male und in einem ungeheuer großen Umfang ausgeführt werden müssen, um zu einer ausreichend breiten Konsensuskernregion zu gelangen, und daher werden (willkürlich) nur 3 Sondierungsvorgänge in die Definition aufgenommen.
In der „dritten" Definition stellt W den Kern dar, und wird die Möglichkeit einer breit gefächerten Konsensuskernregion mit daran befindlichen Abwandlungen angenommen, die um nicht mehr als 25% (z. B. 4 Nucleotide von 16) abweichen. Ist eine Kernregion aus bis zu annähernd 16 Nucleotiden mit einer möglichen Abweichung bis zu 25% definiert worden, wird der Kern Walseine Sequenz von mindestens 6 aufeinanderfolgenden Nucleotiden von innerhalb dieser Region definiert.
Die „vierte" Definition betrifft eine neudefinierte Konsensuskernformel (6), die aus synthetische Polynucleotide betreffenden Untersuchungen ermittelt wurde.
Diese Untersuchungen haben zu weiteren Definitionen kürzerer Kernsequenzen geführt." So bleibt vorzugsweise die nachfolgende (5' —» 3') Sequenz:
PGGGCWG (7)
in allen sich wiederholenden Einheiten erhalten, wobei P und W die in der vierten Definition oben erläuterten Bedeutungen haben. P ist vorzugsweise T; W ist vorzugsweise A
Vorzugsweise bleibtauch die nachfolgende (5'-»3') Sequenz:
TGGGCA (8)
in allen sich wiederholenden Einheiten erhalten.
Nach einem weiteren erfindungsgemäßen Aspekt werden Polynucleotide, die mindestens drei Wiederholungen haben, einschließlich der nachfolgenden 5' —» 3' Kernsequenz:
GGPGGGCWGGWXG (7)
worin P = nicht G, W = AoderTundX = A oder G oder eine Variante davon, vorausgesetzt, daß die gesamten tatsächlichen Kernsequenzen in allen Wiederholungen mindestens 70% Homologie mit den gesamten „echten", in bezug auf Formel (7) definierten Kernsequenzen in der gleichen Anzahl von Wiederholungen aufweisen, und Polynucleotide mit komplementärer Sequenz zu der obigen zur Verfügung gestellt.
In allen obigen Definitionen ist der Kern mindestens 6 Nucleotide lang, vorzugsweise mindestens 7 oder 8, und am besten 12 oder mehr, z. B. 14 bis 16. Die Sequenz GGGCAGGAXG von Formel (2) (die 10 End-Nucleotide am 3'-Ende) ist eine Sequenz mit hohem Konsensus und erscheint besonders vielversprechend. Vorzugsweise enthält der Kern mindestens 6 und noch besser alle 10 Nucleotide dieser Sequenz.
Die Variantkerne haben vorzugsweise mindestens 75% und noch besser mindestens 80 oder 85% Homologie.
Die flankierenden Sequenzen J und K innerhalb jeder sich wiederholenden Einheit sind vorzugsweise weggelassen oder kurz gehalten, z.B. auf 0,1 oder 2 Nucleotide an jeder Seite, und vorzugsweise sollten J und Kzusammen nicht über 20, und noch besser über 15 liegen. Die Gesamtanzahl von Nucleotiden in der Summe von J + Kern + K innerhalb einer sich wiederholenden Einheit sollte vorzugsweise nicht über 36 und noch besser 31 und am besten 25 betragen.
Die Anzahl von Wiederholeinheiten η beträgt vorzugsweise mindestens 10, zweckmäßigerweise 10 bis 40, aber im Prinzip kann η jede beliebige Zahl sogar bis zu 10000 sein.
Die flankierenden Sequenzen H und L sind irrelevant. Sie können weggelassen werden, oder sie können in jeder Anzahl von Nucleotiden vorhanden sein, z. B. bis zu 20000, obwohl das Arbeiten mit einer so langen Sonde normalerweise nicht empfindlich wäre. Sie können DS-DNA enthalten, selbst wenn die Wiederholsequenzen von SS-DNA sind.
Für das Identifizierungsverfahren können bekannte Techniken der Sondierung angewandt werden, von denen die brauchbarste ist, die Proben-DNA mit Restriktionsenzym(en) (einem oder mehreren, wie angemessen) zu spalten, die die Tandemwiederholsequenzen nicht spalten, oder nur in einem irrelevanten Umfang, der ihre Fähigkeit, sondiert zu werden, nicht beeinträchtigt, spalten.
Ausführungsbeispiele
Durch die folgenden Beispiele wird die Erfindung erläutert, Temperaturen sind in 0C angegeben.
Beispiel 1
(1) Konstruktion einer lange Tandemwiederholsequenzen enthaltenden Sonde von dem Human-Myoglobin-Gen
Die Konstruktion dieser Sonde wird schematisch in Fig. 1 der Zeichnungen gezeigt, die fünf Stufen, (a) bis (e) markiert, darstellt. Das Ausgangs-Myoglobin-Gen (a) wird von P.Weiler, u.a., EMBO J., 3,439-446 (1984) beschrieben. Wie darin gezeigt wird, besitzt das Gen eine im ersten Intron gelegene Region, die aus vier Wiederholungen einer von fast identischen 9-BP-Sequenzen flankierten 33-BP-Sequenz besteht (r in Fig. 1). Diese Region wurde in einem 169-BP-Hinfl-Fragment isoliert (b), das end-repariert und durch Klonen in die Smal-Stelle des Plasmids pUC 13 verstärkt wurde, siehe J.Vieira, u. a., Gene 19,259-268 (1982). Ein Monomer wurde durch Spaltung der dritten und vierten Wiederholungen mit der Restriktions-Endonuclease Avail (A) isoliert (c). (Durch eine einfache Basensubstitution in den Wiederholungen 1 und 2 wird diese Stelle eliminiert und statt dessen eine Ddel [D] Stelle geschaffen.) Durch Ligation des33-BP-Monomeren über die nicht-identischen klebrigen Avall-Enden wurde ein Kopf-Schwanz-Polymer (d) erzeugt, das eine unbekannte Anzahl (n) von sich wiederholenden Einheiten besitzt. Mindestens 10 Wiederholungen enthaltende Polymere wurden durch präparative Agarose-Gel-Elektrophorese isoliert, end-repariert, in die Smal-Stelle von pUC 13 eingesetzt und in E.coli JM83 geklont, siehe J.Vieira, u. a., supra. Die Struktur des polymeren DNA-Inserts in dem resultierenden Plasmid, als pAV33,7 (e) bezeichnet, wurde durch Excision des Inserts an der Polyverbindungsstelle mit BamHI plus EcoRI Einfüllmarkierung mit a-32-P-dCTP an der BamHI-Stelle, und Partialdigestion mit Avail bestätigt. Markierte Partialdigest-Produkte wurden durch Elektrophorese auf einem 2%igen Agarosegel aufgelöst. Es wurde ermittelt, daß pAV33,7 23 Wiederholungen des 33-BP-Monomeren enthält, enthalten in einem 767 BP BamHI-EcoRI-Fragment, wie gezeigt (e).
(2) Sequenzierung einer Auswahl von Minisatellitenregionen des Human-Genoms durch die Myogiobin 33-BP-Wiederholsonde
Eine Sammlung von 10 bis 20 KB Human-DNA-Fragmenten, geklont in Bakteriophage λΙ.47,1, siehe P. Weiler, u. a., supra und W.A.M.Loenen, u.a., Gene 20,249-259 (1980), wurde durch Hybridisierung mit dem 767BP pAV33,7 Insert, beschrieben in Schritt (1) oben, gescreent, 32P-markiert in vitro nach dem Verfahren von P. Weller, u.a., supra. Eine Auswahl von acht positiven Plaques wurde gereinigt, um als λ33,1-15 bezeichnete Rekombinanten zu gewinnen. Jede derartige Phagen-DNA wurde einmal mit Hinfl oder Haelll digeriert, durch ein 1,5%iges Agarosegel elektrophoresiert, und 33-Wiederholungen-verwandte Sequenzen darin wurden durch Southem-Tüpfel-Hybridisierung mit pAV33,7 DNA lokalisiert. Jeder Rekombinant ergab ein einziges „\33-positives" Hinfl- und Haeill-Fragment, mit Ausnahme von λ33,4 und 11, die keine nachweisbaren positiven Haelll-Fragmente ergaben (infolge einer Haelll-Spaltungsstelle, die in den Wiederholregionen in diesen Rekombinanten vorhanden sind). Die \33-positiven Hinfl- und Haelll-Fragmente wurden mit Hilfe von präparativer Gelelektrophorese isoliert, wenn erfsrderlich end-repariert, und in die Smal-Stelle der doppelsträngigen DNA M13 MP8 stumpf-endig eingesetzt, J. Messing, u. a., Gene 19,269-276(1982). Positive SS-M 13-Rekombinanten wurden nach Transformation in E.coli JM101 isoliert und mit Hilfe der Didesoxynucleotid-Ketten-Terminationsmethode sequenziert. Alle \33-positiven Fragmente enthielten eine sich . wiederholende Tandemregion, die in einigen Fällen direkt sequenziert werden konnte. In anderen Fällen, in denen die Wiederholregion zu weit von der Sequenzierungs-Primer-Stelle entfernt war, wurden die M 13-lnserts durch Spaltung mit Restriktions-Endonucleasen verkürzt und neu-sequenziert.
Die Struktur der \33-positiven Fragmente wird unten in Form von 8 als λ33,1,33,3, 33,4,33,5, 33,6,33,10,33,11, und 33,15 bezeichneten Karten gezeigt. Das tatsächlich verwendete Restriktionsenzym und die Längen von Fragmenten in Nucleotiden waren λ33,1: Haelll, 2000; 33,3: Hinfl, 465; 33,4: Hinfl, 2000; 33,5: Hinfl, 1 600; 33,6: Haelll, 720; 33,10: Haelll, 720; 33,11: Hinfl, 1020; λ33,15: Hinfl, 1 220. Jede Karte zeigt wiederholte Sequenzen von Basen in der oberen Fallbeschreibung über einem rechtwinkligen Kasten. Die „Wiederholungen" sind hinsichtlich der Anzahl von Basen nicht unbedingt vollständig, und einige unterscheiden sich durch Substitution von Basen. Daher handelt es sich bei der über dem Kasten gezeigten wiederholten Sequenz um eine Konsensussequenz (con), wobei sie diejenige ist, mit der der größte Teil der vorgenommenen Sequenzierung übereinstimmt. Der Kasten zeigt, wie die Wiederholungen von dem Konsensus abweichen. Leerstellen in dem Kasten bezeichnen gefundene Übereinstimmung. Die Basensymbole A, C, G, T in dem Kasten bezeichnen Substitution durch diejenige Base für die eine, die darüber in der Konsensussequenz gezeigt wird. X = A oder G, Y = C oder T. - = ein im Vergleich mit dem Konsensus fehlendes Nucleotid. >>><<< (Fischgräten) Symbole deuten darauf hin, daß die Sequenzierung bisher noch nicht vorgenommen wurde, obwohl aus Autoradiogrammen der Sequenzierungs-Gele deutlich hervorgeht, daß es sich bei der Sequenz um eine „Wiederholung" des Konsensus handelt (wobei die Bezeichnung „Wiederholung" natürlich in der gleichen annähernden Weise wie oben angewandt wird). Die Fragmente λ33,3,33,5,33,10,33,11 und 33,15 wurden vollständig sequenziert, die anderen nur teilweise sequenziert. Die unter „con" an der linken Seite der Kästen befindlichen Zahlen sind die Wiederholanzahl der Sequenzen. Die untere Zahl in dieser Reihe bezeichnet.die Anzahl von Wiederholungen. So enthält λ33,1 26 Wiederholungen einer 62-Nucleotid (NT)-Sequenz, die in der oberen Fallbeschreibung über dem Kasten angegeben ist. Die in der unteren Fallbeschreibung oberhalb und unterhalb von jeder Karte gezeigte Sequenz ist die flankierende Sequenz, die an den 5'- bzw. 3'-Seiten des Wiederholsequenzblockes liegt, und diese flankierenden Sequenzen werden nicht wiederholt. Mit anderen Worten, die Struktur ist der des durch die flankierenden Sequenzen repräsentierten statistischen Copolymeren analog, in dem durch die Tandemwiederholungen repräsentierte Einheiten von Blockcopolymeren erscheinen.
(3) Entdeckung und Identifizierung einer gemeinsamen, kurzen „Kern"-Sequenz, die innerhalb der Wiederholsequenz jedes
\33-positiven Fragmentes liegt und einen Teil davon bildet
Die Wiederholsequenz jeder Region wurde mit der Myoglobin-33-BP-Wiederholsequenz in pAV33,7 und mit ihrer Umkehr-Ergänzung unter Verwendung der Punkt-Matrix-Analyse verglichen. Sehr bemerkenswert war es,' daß eine einzige kleine, unzweideutige Region von Sequenzähnlichkeit zwischen Myoglobin-33-BP-Wiederholsequenz und den Konsensuswiderholsequenzen der A33-positiven Fragmente gefunden wurde. In die gleiche Region teilten sich die Wiederholungen aller acht A33-Fragmente, und sie wird als der „gemeinsame Kern" bezeichnet. Die folgende Karte zeigt den Vergleich.
con
Lambda 33,1
ccgtgtcacccacaagcttctggggggtggggggtacgatgttcaggaaa AAG G GTG G G CAG G AAGTG GAGTGTGTG CCTGCTTCCCTTCCCTGTCTTGTCCTG GAAACTCA
con
gcagttgtggcatcccatccgtggagaaagcaagcccctgccccggcagg
Lambda 33,3
cctttcccttcctgccgtcagccctggaaaaaggttgtggggggagaaag con CCGGGAGGTGGGCAGGAAXGGGTGGAGXXGGG
gtagagaggtgaggggtggttcctccatagagaggagacctagcccactg
Lambda 33,4
ggcagggatgggggaccgggccagaccccagctgctgagcacgcgccacc TGCAGGGTGGGGAGGGCAG-AAAGAACCCCCGCGTGXAGGGGCACC-CACATCTGGGGCCACAGGA
G G A G A T G AATA CGA
TTT A AA GGATA
A A G AAG T
G GG C
G AA
A T GAAA A
1 A— G
2 GAA G
3
4
5
10
11
12
13
14
TGT
A A-
- A
- A
- G
- G
- G
T G T G
cctaagcaggttctggtggcctcctggctgggtgtaggcagaggctggct
Lambda 33,5
gagctaatgtttcgggggctgcactgggtcatgtgagtaatcatgagggc con YGGGCAGG-AGGGGGAGG
1 T CAG A τη A - A T A T
2 C A A A G
3 C G
4 T T - T
C T T T-
Ό 6 I T
7 T A A -
8 T -A -
9 T
10 C
11 C
12 CA
13 CA
14 CC
ccagtatcctgggaattcgtaatcatggtcatagctgtttcctgtgtgaa
Lambda 33,6 tacaatgtgagtagaggagacctcacatttgaccttggäaagt
TGGAGGAAGGGCTGGAGGAGGGCTCCGGAGGAAGGGC
ggttgctcctcactctgtggtctttgtctgtccagaccttcccttcttgg
Lambda 33,10
aagcatcaaacagggctgggtgtttagtccttttccacatctggctccca GAAGTAGGAGGTGGCTGGAGTGGGCAGGCAGGACTG-TCCCC
G G C A A CCA C G - C
G G
aggagacactgccctggtggctctgaccccctgcagcctcctatgctcta
Lambda 33,11
caggaggaggcagaaagtggcagaggagccctccaggccggagggacacg con CAGGAAGCAGTGAGGCCCTGGGCTGGTGGTGGG
cacgatgccttggggcagcactcacacacagtaagtgcccaagtcaaatga
Lambda 33,15
ggtggttttcaagaaagcgtttcatgcaatttgctttaaatgttaggaaa con GAGGTGGGCAGGTGGA
•1 T A T A T A
I 2 T
3
4
5 T
6 A
7 A
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
aatacctacagatgaggtgtgtgcttattctctgtgcaagatttcagagt
In der Karte wird die Gesamtheit jeder in Schritt (2) oben bestimmten Konsensussequenz gezeigt. Es handelt sich dabei um die Abschnitte, die sich tandemartig in der Myoglobin-33-BP-Sonde und in den aus Human-Genom-DNA isolierten A33-positiven Fragmenten wiederholen. Die Karte zeigt die gemeinsame Kernregion als 16 Nucleotide lang in der oberen Fallbeschreibung.
Gemeinsame Kernregion
33 bp myoglobin
ctaaa&ct
λ33»1 ccctgtcttgtcctggaaactca' X33,3 xxgggccg
>33,4 eatctggggccacaggatgcaggg
aggaagggct gta-ggaggtggct
.λ33,10 X33,11
#3,15
Gemeinsame
ggaggtgg
cctssrsct
eraregion
GGAGGIGQGGAGGiUG aagGGTGGGCAGGAAG GGAGGTGGGCAGGAAZ tGgGGaGGGCAGaAAG
ggagcTygggcaggagg GGAGGaGGGCtGGAGG GGA-GTGGGCAGGcAG GGtGGTGGCrCAGGAAG aGAGGTGVC-GCAGGt GG
U U-A IiU; -LU- -r'g-OüUlj.il-tVij * Diese Sequenz ist ein Trimer, daher tragen die flankierenden Regionen zum Kern bei.
gaccgaggt
tggagtgtgtgectgottccctt
gggtggag
aacccccgcgtgzag.gg.gcaccc5
,gggctccgg gactgtcccdgaa sagtgaggo
- 3*
Wieder gilt X = A oder G, Y = C oder T,-= ein fehlendes Nucleotid. Man wird feststellen, daß es einen erheblichen Übereinstimmungsbeweis für diese 16 Nucleotide gibt, von denen 8 100% Übereinstimmung aufweisen und ein neuntes „X" bis zu dem Grade übereinstimmt, daß es weder A noch G ist. Diese 9 Nucleotide sind in der untersten Zeile unterstrichen und zeigen die Nucleotide der gemeinsamen Kern region. Die gemeinsame Kern region wird von den Resten der Tandemwiederholeinheiten flankiert, die in der unteren Fallbeschreibung gezeigt werden. Der AnfangsVEndpunkt jedes Wiederholkonsensus ist durch das Symbol T identifiziert; im Falle von λ33,4 und λ33,15 gibt es eine nicht-einheitliche Anzahl von Wiederholungen, und die einzelnen Wiederholungsanfanas- und -endDunkte werden HaKmr Hi in-h h;o onrWon Q>,mh„ior7
bezeichnet. Man wird einsehen, daß die gemeinsame Kern region nur durch ausgeklügelte Analysen zu identifizieren war, da sie häufig nicht vollständig innerhalb einer einzigen Konsensussequenz der\33-positiven Fragmente liegt und sich über zwei aufeinanderfolgende Sequenzen der Myoglobin-Gen-33-BP-Wiederholung erstreckt.
Zur Darstellung des Umfanges an Übereinstimmung mit den als im Rahmen der Erfindung liegend definierten Polynucleotiden werden die verschiedenen Determinanten in der folgenden Tabelle 1 aufgeführt:
Tabelle 1 Kernlänge Formel Nr. % Homologie Wiederhollänge J&K η erfindungsgem.
Polynucleotide 16 2 100 33 17 4 X
33BPMyoglobin 16 2 81 62 46 26 X
33,1 16 2 100 32 16 6 X.
33,3 16 2 75 64 48 14 X
33,4 16 4 100 17 1 14 V
33,5 11 5 A, 5 B 100 18 0 18 V
33,6 15 2 88 41 26 5 X
33,10 16 2 94 33 17 3 X
33,11 16 3 100 16 0 29 V
33,15
Die unterstrichenen Zahlen bezeichnen unzulässige Längen.
(4) Entdeckung daß polymorphe Human-Genom-DNA-Fragmente durch Hybridisierung mit Sonden einzelner λ33-positiver Fragmente nachgewiesen werden können
Nach Fig. 2 wurde DNA von weißen Blutkörperchen gewonnen, die einer Stichprobe britischer Kaukasier (1-6) und von ausgewählten Mitgliedern eines großen britischen Asiatenstammes (7-18) entnommen wurde. Der Stammbaum wird in herkömmlicher Form gezeigt, wobei ein Quadrat einen Mann, der Kreis eine Frau bezeichnet und Heirat durch eine Linie zwischen beiden angezeigt wird. Zwei Heiraten zwischen Blutsverwandten, zwischen Vetter und Cousine ersten Grades, werden durch eine Doppellinie zwischen den Partnern gekennzeichnet. ΙΟ-μ,-Proben von DNA wurden mit Hinfl digeriert, durch ein 20 cm langes 1%iges Agarosegel elektrophoresiert, in situ denaturiert und durch Tüpfeln auf ein Sartorius-Nitrozellulosefilter übertragen. Einsträngige 32P-markierte Hybridisierungssonden wurden aus M 13-Rekombinanten, die Minisatelliten-(tandemartig sich wiederholende)-Regionen enthielten, hergestellt. Die wirklich verwendeten Sonden werden später beschrieben. Die Verfahrensweise war wie folgt. Annähernd 0,4^g M13-einstränige DNA wurden mit 4ng 17mer Sequenzierungs-Primer (M. L. Duckworth, u.a., Nucleic Acids Res., 9 1961-1706 [1981]) in 10μΙ 1OmM MgCI2,10mMTris-HCI (pH-Wert 8,0) 30 Minuten lang bei 6O0C getempert. Die Primer-Extension erfolgte durch die Zugabe von 16μΙ 80μΜ dATP, 80μΜ dGTP, 80μΜ dTTP, 1OmM Tris-HCI (pH-Wert 8,0), 0,1 mM EDTA plus 3μΙ (30 uCi)a-32P-dCTP (3000 Ci (ηΜοΓ1) und 1 μ\ von 5 Einheiten μΓ-1 Klenow-Fragment (Boehringer) und 15 Minuten Inkubieren bei 37°C. Die Extension wurde durch die Zugabe von 2,5jU.10,5mM dCTP und „Jagen" bei 370C über weitere 15 Minuten beendet. (Unter „Jagen" ist die Zugabe eines dNTP-Gemischs zur Vervollständigung des Kreises von DS DNA auf der Template von M13 SS DNA zu verstehen). Die DNA wurde an einer geeigneten Restriktions-Endonuclease-Stelle entweder im Insert oder in dem vom Insert entfernten M 13-Polylinker gespalten, durch die Zugabe von VioVol. 1,5M NaOH, 0,1 M EDTA denaturiert, und das 32P-markierte einsträngige vom Primer ausgehende DNA-Fragment wurde mit Hilfe der Elektrophorese durch ein 1,5%iges niedrig-schmelzendes Agarosegel (Sea Plaque) zurückgewonnen. Das herausgeschnittene Band (spezifische Aktivität >109cpm/^g DNA) wurde bei 1000C in Gegenwart von 1 mg alkali-abgetrennterTräger-Human-Placenta-DNA (abgetrennt in 0,3M NaOH, 2OmM EDTA bei 1000C, 5 Minuten lang, anschließend neutralisiert mit HCI) geschmolzen und direkt in die Hybridisierungskammer gegeben. Die Träger-DNA diente auch dazu, jene etwaige nachfolgende Hybridisierung zu sich wiederholenden DNA-Sequenzen zu unterdrücken. Als eigentliche Hybridisierungssonden wurden verwendet: (A) 33,1, ein annäherndes 2000 NT subgeklontes Haelll-Fragment, das den Minisatelliten (26 Wiederholungen einer 62-NT-Sequenz = 1 612 NT) plus annähernd 350 NT flankierende Human-DNA enthielt; (B) 33,4, ein 695 NT Nicht-Minisatelliten EcoRI-Fragment an der vom Primer entfernten Seite des Minisatelliten, enthalten in einem 2 015 NT Hinfl-Fragment; und (C, D, E) 33,15, ein 592 NT subgeklontes Fragment, das die λ 33,15 Minisatelliten-Sequenz (29 Wiederholungen einer 16-NT-Sequenz, die sich im Durchschnitt um zwei Nucleotide von der gemeinsamen, oben gezeigten Kernregion unterscheidet) plus 128 NT flankierende Human-DNA enthielt.
Die Hybridisierungen wurden wie von A.J.Jeffreys, u.a.. Cell 21,555-564 (1980) beschrieben ausgeführt, nur wurde Dextransulfat durch 6% (M/V) Polyethylenglycol 6000 ersetzt, um die Hintergrundmarkierung zu reduzieren. Die Filter A und B wurden über Nacht in 0,5x SSC bei 650C hybridisiert und in 0,2 χ SSC bei 650C gewaschen. Die Filter C-E wurden hybridisiert und bei 650C in 1 χ SSC gewaschen. Die Filter wurden 1 bis 3 Tage lang bei -800C autoradiographiert, wobei eine schnelle Wolfram-Verstärkerfolie verwendet wurde.
Wie in Fig. 2 gezeigt wird, entdeckte die wiederholte Kernsonde 33,15 ein extrem kompliziertes Profil von Hybridisierungsfragmenten in mit Hinfl digerierter Human-DNA. Nur die größten (4-20 KNT) Hinfl-Fragmente konnten vollständig aufgelöst werden, und diese zeigten extremen Polymorphismus bis zu dem Umfang, daß das Hybridisierungsprofil einen individuenspezifischen DNA-„Fingerabdruck" („fingerprint") lieferte.
Die Stammbaum-Analyse bestätigte die extreme polymorphe Veränderung, die so groß ist, daß alle Individuen, selbst innerhalb einer einzigen blutsverwandten Gruppe von Vettern-Heiraten ersten Graden (16 bis 18, Fig. 2), unterschieden werden können. Die Familien in Fig. 2 (D, E) zeigen, daß die meisten der großen Hinfl-Fragmente von jedem Elternteii auf nur einige der Nachkommen übertragen wurden, wodurch nachgewiesen wurde, daß die meisten dieser Fragmente im heterozygoten Zustand vorhanden sind und daß die Heterozygotie bei diesen großen hypervariablen Fragmenten annähernd 100% erreichen muß. Umgekehrt können alle Fragmente in den Nachkommen zurückverfolgt werden bis zu dem einen oder anderen Elternteil (mit nur einer Ausnahme), und somit bilden sie einen Satz von gleichbleibend vererbten genetischen Markierern. Kein Band wird speziell vom
Vater auf den Sohn oder vom Vater auf die Tochter übertragen, siehe Filter D, Fig. 2. Das schließt Y- bzw. X-Kopplung aus, und legt nahe, daß diese Minisatelliten-Fragmente im Ursprung vorwiegend autosomal sind. Wenn es auch bisher noch unbekannt ist, ob diese DNA-Fragmente ihren Ursprung in dem Satz von Autosomen haben, so stammen sie nicht von einer einzigen lokalisierten Region eines Autosoms. Stattdessen können Paare von Elternfragmenten identifiziert werden, die sich unabhängig im Nachkommen aufspalten, siehe Filter D, Fig.2. Um genau zu sein, ein Paar von Bändern AB in einem Elternteil (und bei dem anderen fehlend) kann nicht allelomorph sein, wenn mindestens ein AB oder— Nachkomme vorhanden ist; das Vorhandensein von A- oder -B-Rekombinant-Nachkommenschaft beweist weiterhin das Fehlen einer festen Kopplung zwischen A und B. Eine sorgfältige Prüfung des ursprünglichen Autoradiogramms dieser Familie, das in Fig. 2 D gezeigt wird, ergibt durch diese Kriterien mindestens 10 auflösbare Bänder inder Mutter, von denen 8 gegenseitig nicht-allelomorph und nicht eng gekoppelt sind. Zwei andere Bänder können je ein AIIeI von einem der 8 ungekoppelten Fragmente sein, da nur A- oder -B-Nachkommenschaft in der begrenzten Anzahl von analysierten Nachkommen beobachtet wurde, obwohl eine so kleine Probe nicht ausreichend für einen Beweis ist, daß solche Paare von Fragmenten AIIeIe einer einzigen Stelle sind. Das führt zu der Schlußfolgerung, daß die Kernsonde in der Lage ist, nützliche Informationen gleichzeitig an mindestens mehreren unterschiedlichen ungekoppelten hypervariablen Stellen zu liefern. Diese Schlußfolgerung wird eingehender in Beispiel 8 untersucht.
Im Gegensatz dazu ergaben die beiden anderen, nicht erfindungsgemäßen Sonden (Filter A und B, Fig. 2) nur ein Band oder zwei Bänder, und sie waren eindeutig nicht in der Lage, viele unterschiedliche polymorphe Regionen gleichzeitig zu entdecken, und somit sind sie für den allgemeinen diagnostischen Gebrauch nicht geeignet.
Beispiel 2 Die Verwendung zusätzlicher Varianten (Kern) in Sonden zum Nachweis neuer Reihen hypervariabler Regionen in Human-ONA
Es wurden zwei weitere Sonden, abgeleitet von geklonten A33-positiven Fragmenten, λ33,5 und λ33,6, analog zu Beispiel 1, Schritt (4) hergestellt. Die 33,5 Sonde bestand aus einem 308NT DNA-Fragment, geklont in M13MP8 und enthielt 14 Wiederholungen der oben genannten Konsensussequenz, bei der es sich im Prinzip um eine 17 NT lange Variante der gemeinsamen Kernsequenz zusammen mit 70 NT flankierender Human-DNA handelt. Die 33,6 Sonde enthielt 18 Wiederholungen einer 37 NT Sequenz, die ihrerseits aus 3 Wiederholungen einer annähernd auf 12 NT verkürzten Sequenz, abgeleitet von der gemeinsamen Kernregion, plus einem zusätzlichen TC an ihren 5'-Ende bestand. Die 18 χ 37 Wiederholblöcke wurden von 95 NT Human-DNA flankiert. Die Struktur der 37 NT Sequenz kann dargestellt werden als:
TGG AGG AGG GGC
TGG AGG A-G GGC(oderTGG AGG AGG G-C) TCCGG AGG AGG GGC
Diese Sonde wurde gleichfalls in M13MP8geklont.
In der späteren Beschreibung wird eine 1 T-NT-Konsensussequenz AGGGCTGGAGG für diese Sonde angegeben. Beide Sonden wurden mit 32P markiert und analog zu Beispiel !,Schritt (4) zu Human-DNA von einer Gruppe von 14 ' nichtverwandten Kaukasiern hybridisiert. Beide Sonden haben eine komplizierte Gruppe von hybridisierenden Fragmenten nachgewiesen, von denen viele extreme polymorphe Veränderungen zeigten. Verschiedene, durch 33,5 entdeckte Fragmente waren neu und bisher noch nicht mit Hilfe der 33,15-Kernsonde entdeckt worden. Die 33,6-Sonde entdeckte eine fast gänzlich neue Gruppe von Minisatelliten, und deren genaue Vererbung wurde durch die Stammbaumanalyse bestätigt (siehe Beispiel 8).
Durch die folgenden Beispiele wird die Erfindung weiter erläutert und erklärt.
Die Digestion der Proben-DNA wird vorzugsweise unter Verwendung einer Restriktions-Endonuclease ausgeführt, die 4 Basenpaare von Nucleotiden erkennt. Es wurde gefunden, daß das DNA-Erkennungs(fingerprint)-Muster für die längsten hypervariablen Fragmente weitgehend von der verwendeten 4-BP-Erkennungs-Restriktions-Endonuclease unabhängig ist. Das läßtauf jeden Fall vermuten, daß diese großen Fragmente nicht von längeren Minisatelliten stammen, sondern daß jedes einen vollständigen langen homogenen Minisatelliten enthält, der keine Restriktions-Endonuclease-Spaltungsstellen besitzt und von Human-DNA flankiert ist, äie die normale hohe Dichte von 4-BP-Spaltungsstellen aufweist. Das stimmt mit den in den vorhergehenden Beispielen und in Beispiel 8 zusammengestellten Ergebnissen überein, die zeigen, daß die meisten dieser großen Minisatellitenfragmente ungekoppelt sind und sich im Stammbaum unabhängig abspalten. Bei einer bevorzugten Ausführungsform wird eine Probe von DNA durch Verwendung von zwei verschiedenen Sonden bei getrennten Hybridisierungen, die zwei unterschiedliche Erkennungszeichen (fingerprints) ergeben, „doppelt-charakterisiert" („doubly fingerprinted"), zum Beispiel Sonden von Fragmenten Lambda 33,15 und 33,6. Durch diese Mittel wird die an sich schon geringe Wahrscheinlichkeit, daß zwei nicht-verwandte Individuen die gleichen Erkennungszeichen (fingerprints) haben, weiter verringert. Zum Beispiel wird in Beispiel 4 eine Wahrscheinlichkeit von nur 10~19 angegeben, selbst dann, wie es bevorzugt wird, wenn unvollständig-aufgelöste Hybridisierungs-DNA-Fragmente mit Längen von weniger als 4KB ignoriert werden. Die Erfindung umfaßt ein Verfahren für den Vaterschaftsnachweis. Annähernd die Hälfte der polymorphen Minisatellitenfragmente in einem Nachkommen stammen vom Vater, und diese väterlichen Fragmente können durch einen Vergleich der mütterlichen und Nachkommen DNA-Erkennungszeichen (fingerprints) identifiziert werden. Alle diese väterlichen Fragmente werden normalerweise in der DNA des Vaters vorhanden sein. Es wird angenommen, daß durch Verwendung einer Sonde 33,15 und von DNA-Fragmenten mit einer Länge von mindestens 4KB, die Wahrscheinlichkeit, daß der mutmaßliche Vater zufällig alle 6 vater-spezifischen DNA-Fragmente, die praktisch beim Nachkommen identifiziert werden, besitzt, in der Größenordnung von 10~5 liegt, und daß sie durch die Verwendung der beiden Sonden 33,6 und 33,15zur Größenordnung von 10~8 reduziert wird. Selbstverständlich werden die exakten Wahrscheinlichkeiten von der einwandfreien Auflösung und der Kompliziertheit der gewonnenen DNA-Muster abhängen und werden verbessert werden, wenn zusätzliche Vater-Fragmente mit einer Länge von weniger als 4KB analysiert werden oder wenn eine dritte Sonde verwendet wird. Ausreichend DNA (0,5 bis 5 Mikrogramm) kann schnell aus einem einzigen Tropfen Humanblut für die DNA-Erkennungsbestimmung (fingerprinting) isoliert werden. So wurden DNA-Erkennungszeichen (fingerprints) von einer wahllosen Gruppe von Individuen sowie zwei Leuten, deren DNA zuvor charakterisiert (fingerprinted) wurde, plus zwei Schwestern
erzeugt. Die beiden zuvor charakterisierten Individuen konnten einfach und eindeutig auf der Basis von Vergleichen der DNA-Erkennungszeichen (fingerprints) identifiziert werden, ebenso die beiden Schwestern, die eine beträchtliche Anzahl von Minisatellitenfragmenten gemeinsam besaßen.
Die DNA kann aus den verschiedensten Zellen einer bestimmten Person, die alle das gleiche Erkennungszeichen (fingerprint) ergeben, entnommen werden. So sind die DNA-Erkennungszeichen (fingerprints) für Sperma- und Blut-DNA nicht zu unterscheiden, was auch für die Muster eineiiger Zwillinge gilt. Außerdem werden die Muster anscheinend dauerhaft in gezüchteten Zellen aufrechterhalten, wie bei einem Vergleich von DNA-Erkennungszeichen (fingerprints) von Blut-DNA mit DNA, die aus vom Epstein-Barr-Virus transformierten Lymphoblastoid-Zellreihen dergleichen Person isoliert wurde, gezeigt wurde.
Tiere, auf die die Erfindung anwendbar ist, umfassen die meisten Säugetiere, Vögel, Amphibien und Fische. Beispiele sind Hühner, Hamster, Kaninchen, Mäuse, Sperlinge, Turmfalken, Frösche, Wassermolche und Fische. Im Falle von Hühnern wurde ein sehr komplizierter verschmierter Abschnitt von hybridisierenden DNA-Fragmenten erzeugt. Durch Digestion mit Haell wurde die Verschmierung beseitigt, und ein „sauberes" Erkennungszeichen (fingerprint) erhalten. Es ist daher wahrscheinlich, daß Hühner-DNA auch einen langen kernhaltigen Satelliten enthält, dessen Wiederholeinheiten eine oder mehrere Haelll-Spaltungsstellen enthalten; durch Spaltung mit Haelll wird daher dieser Satellit zu sehr kleinen DNA-Fragmenten reduziert, die vom Boden des Gels während der DNA-Elektrophorese wegwandern. Es ist gelegentlich möglich, daß andere Tiere verschmierte Bänder erzeugen und daß diese auflösbar sein werden, wenn die DNA mit entsprechenden Enzymen, die die längeren Fragmente spalten, digeriert wird
In den folgenden zusätzlichen Beispielen werden die Temperaturen in 0C angegeben.
Beispiel 3
DNA wurde aus frischen Human-Plazentasnach der Beschreibung von A.J.Jeffreys, Cell 18,1-10(1979) isoliert. Es wurden drei individuelle Plazentas, 1-3 markiert, verwendet. 8-Mikrogramm-Proben von DNA wurden mit Hinfl und/oder Sau3A in Gegenwart von 4mM Spermidintrichlorid zur Unterstützung der vollständigen Digestion digeriert, nach Phenolextraktion durch Ethanölpräzipitation zurückgewonnen und durch ein 20cm langes 0,6%iges Agarosegel mit 30V etwa 24 Stunden lang der Elektrophorese unterzogen, bis alle DNA-Fragmente von weniger als 1,5 KB Länge von dem Gel abelektrophorisiert waren. DNA wurde anschließend durch Tüpfeln auf ein Sartorius-Nitrozellulosefilter übertragen. Einsträngige M13-DNA-Sonden mit hoher spezifischer Aktivität (über 109cpm 32P/Mikrogramm DNA) wurden nach der Beschreibung in Beispiel 1 Schritt (4) hergestellt. Die genauen angewandten Sonden waren: (a) 33,5-Sonde, bestehend aus einem 220 NT Haelll DNA-Fragment, das den größten Teil des Lambda-33,5-Minisatelliten (17 NT χ 14 Wiederholungen) plus etwa 60 NT flankierende Human-DNA, subgeklont in die Smal-Stelle von MI3MP8 enthält; (b) 33,6-Sonde, bestehend aus einem 720 NT Haelll-Fragment, bestehend aus dem MinisatelNten plus etwa 50 NT flankierender Human-DNA, subgeklont in die Smal-Stelle von M13MP8; und (c) die gleiche 33,15-Sonde wie in Beispiel 1, Schritt (4), wobei es sich um ein 592-NT-Pstl-Ahalll-Fragment handelt, das den Minisatelliten plus 128 NT flankierende Human-DNA, subgeklont in M13MP19 DNA, digeriert mit Pstl plus Smal, enthält. Southern-Tüpfel-Hybridisierung und Waschen wurden in 1 x SSC bei 65°C nach der obigen Beschreibung für die Filter C-E in Beispiel 1, Schritt (4), vorgenommen. Die Filter wurden bei Raumtemperatur vier Tage lang ohne Verstärkungsfolie autoradiographiert. Jede Sonde erzeugte ein anderes Fragmentmuster, dessen Kompliziertheit weitgehend von der verwendeten Tetranucleotid-Restriktions-Endonuclease unabhängig ist. Figur 3 zeigt das erzielte Muster. Die Auflösung von polymorphen, weniger als 4KB langen Fragmenten wird in Doppeldigests mit Hinfl plus Sau3A verbessert, weil Hintergrundhybridisierung ausgeschaltet wird, die vermutlich durch relativ divergierte und invariante Hinfl Minisatellitenfragmente verursacht wurde, dieSau3A Spaltungsstellen innerhalb einer oder mehrerer Wiederholeinheiten angesammelt haben. Bei Doppeldigests kann die Anzahl der durch Sonde 33,15 entdeckten auflösbaren polymorphen Fragmente von etwa 15 auf etwa 23 pro Individuum erhöht werden, wobei allerdings ein Verlust von etwa 20% langer einfacher Digest-Minisatellitenfragmente, die wahrscheinlich eine Sau3A-Spaltungsstelle in den meisten oder allen Wiederholeinheiten enthalten, auftreten kann.
Beispiet 4
8-Mikrogramm-Proben von Human-Blut-DNA, die aus einer Stichprobe von 20 nicht verwandten britischen Kaukasieren entnommen worden war, wurden mit Hinfl digeriert und durch Southern-Tüpfeln mit der Minisatellitensonde 33,6 oder 33,15 nach der Beschreibung in Beispiel 3 hybridisiert. Jedes DNA-Erkennungszeichen (fingerprint) (Individuum A) wurde mit dem Muster in der benachbarten Gelspur (Individuum B) verglichen, und die Anzahl von Bändern in A, die bei B deutlich fehlten, plus diejenigen, die ein mitwanderndes Gegenstück von annähernd gleicher autoradiographischer Intensität in B hatten, wurden bewertet. Die in der folgenden Tabelle angeführten Ergebnisse sind Mittelwerte aller paarweisen Vergleiche. Einem kleinen Anteil (etwa 6%) von zusätzlichen schwach hybridisierenden Fragmenten in A entsprachen stark hybridisierende Fragmente in B, und weil es in solchen Fällen nicht möglich war, zu entscheiden, ob das Band in A ebenfalls in B vorhanden war, wurden solche Fragmente ignoriert. Wenn die mitwandernden Bänder in A und B immer identische AIIeIe der gleichen Minisatellitenstellesind, dann wird die mittlere Wahrscheinlichkeit x, daß ein AIIeI in A auch in B vorhanden ist, mit der mittleren Allel-Häufigkeit (Homozygotie) in Beziehung gesetzt q durch χ = 2q - q2,somitq = 1 - (1 - x)1/2. In der Praxiswird ein (unbekannter) Anteil von mitwandernden Bändern in A und B zufällig von einer anderen Minisatellitenstelle herrühren, und somit sind die Berechnungen der mittleren Allel-Häufigkeit und Homozygotie maximal und hängen von der elektrophoretischen Auflösung von Minisatellitenfragmenten ab.
Die in Tabelle 1 gezeigten Wahrscheinlichkeiten beziehen sich auf die gezeigten individuellen Größenfragmente von DNA. Um eine sich auf den am besten leserlichen Teil des Erkennungszeichens (fingerprint) beziehende Gesamtwahrscheinlichkeit, d. h. gesamte DNA mit einer Größe über4KB, zu erhalten, müssen die drei Figuren zusammengenommen werden. So beträgt beispielsweise die mittlere Wahrscheinlichkeit, daß alle von der Sonde 33,15 in Individuum A entdeckten Fragmente auch in B vorhanden sind, 0,082·9 χ 0,205·1 x 0,2767 = 3 x 10"11. Die Wahrscheinlichkeit, daß alle durch beide Sonden 33,15 und 33,6 in A entdeckten Fragmente auch in B vorhanden sind, beträgt 5 χ 10~19.
Tabelle 2
Ähnlichkeiten von Erkennungszeichen (fingerprints) zwischen beliebigen Paaren von Individuen
Sonde DNA-Fragment Anz. von Wahrscheinl. x, daß Maximale mittlere
Größe, Fragmenten je Indiv. Fragment in A in B Allel-Häufigkeit
KB "'"" +S.D. vorhanden ist (Homozygotie)
33,6 10-20 2,8+1,0 0,11 0,06
6-10 5,1 ±1,3 0,18 0,09
4-6 5,9 ±1,6 0,28 0,15
33,15 10-20 2,9 ±1,0 0,08 0,04
6-10 5,1 ±1,1 0,20 0,11
4-6 6,7 ±1,2 0,27 0,15
Beispiel 5
In diesem Beispiel wird die somatische Stabilität von DNA-Erkennungszeichen (fingerprints) und deren Anwendung beim Vaterschaftsnachweis erläutert.
Durch EB-Virus transformierte und in flüssigem Stickstoff aufbewahrte Lymphoblastoidzellreihen wurden nach 2 Jahren in flüssiger Kultur wiederhergestellt. Diese gezüchteten Lymphozyten wurden zweimal in normaler Salzlösung gewaschen; DNA von dem Lymphozyt-Pellet und von weißen Blutkörperchen wurde nach der Beschreibung von A.J.Jeffreys, Cell 18, (1979) vorbereitet. Sperma-DNA wurde in ähnlicher Weise gewonnen, nur wurde das von Samen gewonnene Sperma mit 1M2-Mercaptoethanol 5 Minuten lang bei Raumtemperatur vor der Lysis mit SDS behandelt. DNA-Erkennungszeichen (fingerprints) wurden nach der Beschreibung in Beispiel 3 hergestellt, wobei 5-Mikrogramm-Proben von mit Hinfl digerierter und mit Sonde 33,6 (a) oder 33,15 (b) hybridisierter DNA verwendet wurden.
Beispiele
In diesem Beispiel wird die Verwendung einer erfindungsgemäßen Sonde für den Nachweis stark polymorpher Regionen in der DNA verschiedener Vertebraten erläutert.
DNA-Proben wurden aus von Hühnern, Sperlingen und Turmfalken entnommenem Blut, von der Leber von Kaninchen und Mäusen, von Human-Plazehtas und von den ausgeweideten Kadavern von Fröschen und Fischen hergestellt. 8-Aig-Proben von DNA wurden mit Hinfl digeriert, jedoch nicht die Hühner-DNA, die mitHaelll digeriert wurde. Die Restriktions-Digests wurden durch ein 0,6%iges Agarosegel elektrophoresiert, denaturiert, auf ein Sartorius-Nitrozellulosefilter übertragen und wie oben beschrieben mit der Human-Minisatellitensonde 33,15 hybridisiert. Der Hybridisierungsvorgang erfolgt bei 65°C in 1 χ SSC. Die Ergebnisse von den folgenden Proben gehen aus Fig. 5 hervor:
1,2: nicht-verwandte Human-Plazenta-DNA
3: Kaninchen-DNA, von einer FrHybride von Alaska- und Weißen Wiener-Rassen
4: Kaninchen-DNA der Alaska-Rasse
5,6: Mäuse (Mus musculus) DNA: von zwei im Freien gefangenen griechischen Mäusen
7: Mäuse (Mus musculus) DNA: vom durch Inzucht erzeugten Stamm DBA-2
8: Mäuse (Mus musculus) DNA: vom durch Inzucht erzeugten Stamm C57/BL10
9,10: ' Hühner-DNA: NB die DNA wurde mitHaelll digeriert
11,12: Sperling-DNA
13,14,15: Turmfalken-DNA
16,17: Frosch (Xenopus tropicalis) DNA
18,19: Elritzen-DNA.
Wie man feststellen kann, wurden erfolgreiche variable DNA-Erkennungszeichen (fingerprints) von fast allen getesteten Vertebraten gewonnen, und sie sind offensichtlich ebenso informativ wie die Human-DNA-Erkennungszeichen (fingerprints).
Die mit Hinfl gespaltene Hühner-DNA erzeugte gleichfalls eine sehr komplizierte, allerdings weniger intensive Verschmierung von hybridisierender DNA (nicht gezeigt). Durch Digestion mit Hae11 wurde diese Verschmierung jedoch beseitigt und ein sauberes polymorphes Erkennungszeichen (fingerprint)-Muster erzielt.
Die beiden durch Inzucht gewonnenen Mäusestämme haben einfachere Erkennungszeichen (fingerprints) als die im Freien gefangenen Mäuse. Das war zu erwarten, weil die meisten hypervariablen Minisatellitenstellen bei der Wildform heterozygot, aber homozygot bei Züchtung sein werden, wodurch die Anzahl der hybridisierenden DNA-Fragmente bei gezüchteten Stämmen halbiert wird.
In den folgenden Beispielen wird die Anwendung bestimmter oben beschriebener Sonden weiter erklärt.
Beispiel 7
Darin wird die Anwendung der DNA-Erkennungszeichen (fingerprint)-Analyse in einem Einwanderungsfall beschrieben, dessen Lösung mit herkömmlichen genetischen Methoden sehr schwierig, wenn nicht unmöglich gewesen wäre.
Der Fall betraf einen ghanesischen Jungen, der im Vereinigten Königreich geboren war und nach Ghana zur Wiedervereinigung mit seinem Vater emigrierte und anschließend allein in das Vereinigte Königreich zurückkehrte, um wieder mit seiner Mutter, seinem Bruder und zwei Schwestern zusammenzuleben.
Es lagen aber Anzeichen für die Vermutung vor, daß ein Austausch stattgefunden hatte, entweder gegen einen nicht verwandten Jungen oder einen Sohn einer der Schwestern der Mutter, von denen alle in Ghana lebten. Infolgedessen erhielt der zurückgekehrte Junge keine Aufenthaltsgenehmigung für das Vereinigte Königreich. Auf Veranlassung des Rechtsanwaltes der Familie wurde eine Analyse zur Bestimmung der Vaterschaft des Jungen durchgeführt. Der Fall wurde doch dadurch kompliziert,
daß weder der Vater noch irgendeine der Schwestern der Mutter für die Analyse zur Verfügung standen. Dazu kam, daß die Mutter, obwohl sie überzeugt war, daß es sich bei dem Jungen um ihren Sohn handelte, nicht sicher über die Vaterschaft war. DNA-Erkennungszeichen (fingerprints) von Blut-DNA-Proben, die von den zur Verfügung stehenden Mitgliedern der Familie (der Mutter M, dem Bruder B und den Schwestern S1 und S 2 sowie dem betreffenden Jungen X) entnommen wurden, wurden daher durch Southern-Tüpfel-Hybridisierung auf zwei oben beschriebene Minisatellitensonden 33,6 und 33,15, von denen jede eine andere Gruppe von hypervariablen Minisatelliten in Human-DNA nachweist, hergestellt.
8-;u.g-Proben von Blut-DNA von der Mutter (M), dem fraglichen Jungen (X), seinem Bruder (B), den Schwestern (S 1 und S 2) und einer nicht-verwandten Person (U) wurden mit Hinfl digeriert, durch ein 0,7%iges Agarosegel elektrophoresiert und durch Southem-Tüpfeln auf die Sonden hybridisiert. Die Autoradiogramme sind in Fig. 6 zu sehen. In den DNA-Erkennungszeichen (fingerprints) der Mutter (M) vorhandene Fragmente sind durch eine kurze horizontale Linie gekennzeichnet; bei M fehlende, aber in mindestens einem der zweifelsfreien Verwandten (B, S1, S 2) vorhandene väterliche Fragmente sind mit einem langen Strich markiert. "Mütterliche" und väterliche auf X übertragene Fragmente sind durch einen Punkt gekennzeichnet. Die DNA-Erkennungszeichen (fingerprints) von X enthalten keine zusätzlichen aufgelösten Fragmente. Alle Fragmente wurden von den Originalautoradiogrammen, die mit verschiedenen Belichtungen angefertigt worden waren, bewertet; teilweise aufgelöste schwächere Bänder, vor allem zur Unterseite des Gels hin, die nicht zuverlässig bewertet werden konnten, wurden ignoriert. Der erste Sch ritt bestand in der Feststellung der Vaterschaft von X aus den Mustern hypervariabler Fragmente. Obwohl der Vater nicht zur Verfügung stand, konnten die meisten seiner DNA-Erkennungszeichen (fingerprints) von vaterspezifischen DNA-Fragmenten, die in mindestens einem der drei nicht angezweifelten Familienmitglieder (B, S1, S2) vorhanden waren, aber bei M fehlten, rekonstruiert werden. Von den auf diese Weise identifizierten 39 Vaterfragmenten war etwa die Hälfte in den DNA-Erkennungszeichen (fingerprints) von X vorhanden. Da DNA-Fragmente selten auf die DNA-Erkennungszeichen (fingerprints) von nicht-verwandten Personen verteilt sind (siehe Person U in Fig. 6), führt das unbedingt zu dem Schluß, daß X den gleichen Vater wie B, S1 und S 2 hat. Nach Abzug dieser vaterspezifischen DNA-Fragmente blieben 40 Fragmente bei X, von denen alle bei M vorhanden waren. Das ist wieder ein klarer Beweis, daß M die Mutter von X ist, und daß somit X, B, S1 und S2 echte Geschwister sind.
Es wurde oben gezeigt, daß die mittlere Wahrscheinlichkeit, daß ein Fragment in einem DNA-Erkennungszeichen (fingerprint) einer Person in einem zweiten willkürlich ausgewählten Individuum vorhanden ist, annähernd 0,2 bei Nordeuropäern beträgt. Die entsprechende Schätzung für den Vater und M ist 0,26, ein Zeichen, daß die DNA-Erkennungszeichen-Variabilität bei diesen Ghanesen sich nicht wesentlich von der von Nordeuropäern unterscheidet. Bei den folgenden Wahrscheinlichkeitsberechnungen wird die überaus konservative Annahme gemacht, daß alle Bänder mit einer einheitlichen Wahrscheinlichkeit von 0,26 (Quantelung folgt) aufgeteilt sind.
Die erste Frage ist, ob X mit dieser Familie verwandt ist. Die DNA-Erkennungszeichen (fingerprints) von X enthalten 61 bewertbare Fragmente, von denen alle bei M und/oder dem Vater vorhanden sind. Wenn X nicht verwandt ist, dann beträgt die Wahrscheinlichkeit, daß jedes seiner Bänder bei diesen Eltern vorhanden ist, 1-(1 - 0,26)2 = 0,45; die Wahrscheinlichkeit, daß M und/oder der Vater zufällig alle 61 der Bänder von X besitzen, ist daher'0,4561 = 7 χ 10"22. X ist eindeutig mit dieser Familie verwandt.
Das nächste Problem ist, ob eine nicht-verwandte Frau, und nicht M, die Mutter von X sein könnte. Die DNA-Erkennungszeichen (fingerprints) von X enthalten 40 „mütterliche" Fragmente, von denen wir annehmen, daß —25 speziell von der Mutter vererbt worden sind; die restlichen Fragmente verteilen sich auf die Mutter und den Vater und können daher nicht verwendet werden, um den Beweis für die Mutterschaft von M zu erbringen. Alle 25 mutterspezifischen Fragmente in X sind in M vorhanden. Die Chance, daß M nicht verwandt ist mit X, aber zufällig alle 25 Fragmente besitzt, beträgt daher 0,2625 = 2 χ 10~15. Daher müssen X und M verwandt sein.
Das letzte und schwierigste Problem ist, ob die Schwester von M, die für die Analyse nicht zur Verfügung stand, die Mutter von X sein könnte (der Vater müßte natürlich der Ehemann von M sein). Wenn Bänder auf wahllose Personen mjt einer mittleren Wahrscheinlichkeit von 0>26 verteilt sind^dann ist die entsprechende Chance, daß ein Fragment in einem Individuum auch bei einem Verwandten vorhanden ist, 0,62. Die Möglichkeiten, daß M die Schwester von X's echter Mutter ist und zufällig alle 25 mutterspezifischen Bänder von X enthält, betragen daherO,6225 = 3 x 10~6. Wirziehen daherüber jeden echtenZweifel erhaben die Schlußfolgerung, daß M die echte Mutter von X sein muß. Dieser Beweis wurde den Einwanderungsbehörden vorgelegt, die den Fall gegen X einstellten und ihm den Aufenthalt im Vereinigten Königreich und das Zusammensein mit seiner Familie erlaubten.
Dieser schwierige Fall zeigt, wie DNA-Erkennungszeichen (fingerprints) einen eindeutigen positiven Beweis für Verwandschaftsverhältnisse liefern können, selbst in einigen Fällen, in denen kritische Familienmitglieder fehlen. Der vorliegende Fall wurde durch die Tatsache vereinfacht, daß X den gleichen Vater wie seine Geschwister hatte, und daß sein Vater keine Bänder ausschließlich auf X übertragen hat (im DurchschnittwürdeVie der väterlichen Bänder so übertragen sein). Solche X-einzigartigen Fragmente würden, obwohl sie offensichtlich den Beweis für die Verwandtschaft zwischen X und M abschwächen, in der Praxis die Analyse nicht unbedingt in Frage stellen. Es wäre unwahrscheinlich, daß X mehr als 5 derartige väterliche Fragmente außer den 25 mutterspezifischen haben wird. Die Möglichkeiten, daß mindestens 25 von 30 spezifizierten Bändern zufällig bei X und M, wenn sie nicht verwandt sind, oder wenn M die Tante von X wäre, gleich sind, betragen 8 χ 10"11 bzw. 9 χ 1Q~3. Diese Analyse ist daher stichhaltig und würdein den meisten Fällen einen klaren Beweis für oder gegen eine behauptete Verwandtschaft liefern. Ungewöhnlich ist es natürlich, daß alle relevanten Mitglieder einer Familie zur Verfugung stehen werden, zum Beispiel bei Vaterschaftsstreitigkeiten oder bei Familien, die Schwierigkeiten hinsichtlich der Wiedervereinigung bei Einwanderung haben; DNA-Erkennungszeichen (fingerprints) werden fast immer in der Lage sein, solche Probleme zu lösen.
Quantelung von DNA-Erkennungszeichen (fingerprints)
61 DNA-FragmentewurdenbeiM bewertet und mit 39 Fragmenten, die speziell vom Vater vererbt worden waren, verglichen, Vs der heterozygoten DNA-Fragmente des Vaters werden nicht auf B, S1 oder S 2 übertragen, und somit ergibt die korrigierte Berechnung für die Anzahl von vaterspezifischen Fragmenten 39 χ ah = 45. Da die Gesamtanzahl von Fragmenten in den DNA-Erkennungszeichen von M und von dem Vater annähernd gleich sein müßte, beträgt dann die Anzahl von Fragmenten in M, die der Vater auch besitzt ~ (61 - 45) = 16. Die mittlere Wahrscheinlichkeit der Bandverteilung (x) auf M und den Vater beträgt daher /βι = 0,26, was mit früheren Berechnungen übereinstimmt, die vom Screenen einer Stichprobe von Nordeuropäern erhalten wurden (x = 0,2, Lit. 2).
Annähernd die Hälfte der 45 Vaterbänder wurden auf B, S1 und S 2 (18,24 bzw. 18) übertragen, wie für heterozygote Bänder zu erwarten war. Von den 61 Bändern in M war mehr als die Hälfte auf B, S1 und S 2 (32, 38 bzw. 39, Mittel = 36,3) vererbt worden, wie zu erwarten war, weil einige der Bänder von M auch der Vater haben wird und daher auf die meisten oder alle Kinder übertragen werden. Wenn die DNA-Erkennungszeichen von M η verteilte, auf alle Kinder übertragene Bänder enthalten, plus (61-n)heterozygote,aufdie Hälfte der Kinder übertagene Bänder, dann gilt η + 0,5(61 - η) = 36,3,weshalbn = 12,wasmitder Berechnung von 16 bei Mund dem Vater gemeinsamen vorhandenen Bändern übereinstimmt (siehe oben). Die DNA-Erkennungszeichen von X bestehen aus 21 vaterspezifischen Fragmenten plus 40 auch bei M vorhandenen Bändern. Der Anteil der letzteren Bänder, die mutterspezifisch sind und beim Vater nicht vorhanden sind, kann auf zwei Wegen berechnet werden. Erstens sollte die Anzahl der mutterspezifischen Bänder etwa gleich der für den Vater spezifischen Anzahl sein, das bedeutet 45/2 = 22,5. Zweitens η (—12) der 40 mütterlichen Bänder in X werden verteilte Mutter/Vater-Bänder sein (siehe oben), so daß 28 mutterspezifische Bänder in X übrigbleiben. Die Anzahl von Fragmenten, die X speziell von seiner Mutter erworben hat, beträgt daher ~25.
Wahrscheinlichkeit von Bandaufteilung: Die mittlere Wahrscheinlichkeit, daß einem Fragment in einem Individuum ein Band mit ähnlicher elektrophoretischer Mobilität und autoradiographischer Intensität in einer zweiten Stichprobenperson gleicht, wird als χ (x = 0,2 — 0,26, siehe oben) definiert. Größere Minisatellitenfragmente sind weniger häufig aufgeteilt, vermutlich infolge geringerer Allel-Häufigkeiten und besserer elektrophoretischer Auflösung, und somit ist die Fragment-Aufteilungs-Wahrscheinlichkeit χ heterogen. Weil fast alle Fragmente unabhängig vererbt werden, beträgt daher die maximale Wahrscheinlichkeit, daß alle η Fragmente in einem Individuum in einem zweiten Stichprobenindividuum vorhanden sind, xn; jegliche Heterogenität in χ wird diese Wahrscheinlichkeit herabsetzen.
Bandaufteilung zwischen Geschwistern: Wenn aufgeteilte Bänder immer identische AIIeIe der gleichen hypervariablen Stelle darstellen, dann steht χ mit der mittleren Allelhäufigkeitq durch χ = 2q — p2in Beziehung, somit kann gezeigt werden, daß die Wahrscheinlichkeit, daß ein bestimmtes Band in einem Individuum ebenfalls in seinen oder ihren Geschwistern vorhanden ist, (4 + 5q - 6q2 + q3)/4(2-q) beträgt.
Für χ = 0,26 beträgt q0,14, und der erwartete Anteil von in einem ersten Verwandten vorhandenen Bändern, die durch eine Aufzeichnung verteilt sind, ist 0,62. Diese Wahrscheinlichkeit wird etwas verringert, wenn stattdessen angenommen wird, daß auf Stichprobenpersonen verteilte Bänder niemals identische AIIeIe sind, das heißt, daß viele Minisatelliten AIIeIe der gleichen Größe besitzen.
Anwendung von DNA-Erkennungszeichen (fingerprints) zur Analyse von Erbkrankheiten
Um die Möglichkeit der Verwendung von DNA-Erkennungszeichen für die Kopplungsanalyse bei Menschen, insbesondere für die Suche nach hypervariablen DNA-Fragmenten, die mit der Krankheitsstelle bei großen Ahnenreihen cosegregieren, bestimmen zu können, wurden die DNA-Erkennungszeichen von zwei großen Familien untersucht, von denen eines für Neurofibromatose und das andere für erbliche Persistenz von Fetushämoglobin segregiert, die anscheinend durch ein Autosomominantgen, das nicht an das /3-Globingenbüschel gekoppelt ist, bestimmt werden.
Beispiele
Segretation von hypervariablen Minisatellitenfragmenten in den DNA-Erkennungszeichen einer an Neurofibromatose leidenden Familien
Mit Hinfl digerierte Blut-DNA-Proben wurden auf einem 35cm langen 0,7%igen Agarosegel elektrqphoresiert und durch Southern-Tüpfeln auf Minisatellitensonden 33,6 und 33,15 hybridisiert. DNA-Erkennungszeichen werden in Fig.7 für den nicht befallenen Vater (F), 5 Söhne (S) und 6Töchter (D) gezeigt; die befallene Mutter stand für die Untersuchung nicht zur Verfugung. An multiplen Neurofibromen leidende Nachkommen sind durch (+) gekennzeichnet; die übrigen Nachkommen zeigen keine Anzeichen von Neurofibromatose. Aufgelöste väterliche (O) und mütterliche (O) heterozygote DNA-Fragmente sind gekennzeichnet, und ihre Segregation in Nachkommen wurde direkt von mit kurzen, mittleren und langen Belichtungszeiten aufgenommenen Autoradiogrammen bewertet. Es wurden nur diejenigen DNA-Fragmente bewertet, deren Positionen und relative Intensitäten in jedem Nachkommen mit denen der Eltern übereinstimmten. Gekoppelte Paare AB von DNA-Fragmenten, die AB oder — in Nachkommen segregieren, sind durch eine durchgehende Linie verbunden; AIIeIe, die A- und -B segregieren, sind durch gestrichelte Linien verbunden. Ein mütterliches Fragment, das Anzeichenfür Kopplung in Verbindung mit Neurofibromatose zeigt, ist mit einem Sternchen markiert; alle sechs befallenen Nachkommen haben dieses Fragment geerbt, und vier von fünf nichtbefallenen Kindern haben dieses Band nicht, so daß sich eine Übereinstimmung von 10/n zwischen Vererbung dieses Bandes und Neurofibromatose ergibt.
Stoffe und Methoden DNA-Isolierung '
Frisches Blut wurde mit einem gleichen Volumen von 1 χ SSC(SSC, Kochsalz-Natriumcitrat, 0,15 M NaCI, 15mM Trinatriumcitrat, pH-Wert 7,0) verdünnt, auf Histopaque-1077 (Sigma) aufgetragen, und kemhaltige Zellen wurden durch Zentrifugieren gesammelt. Alternativ wurde gefrostetes Blut in 2VoI. 1 χ SSC aufgetaut und kemhaltige Zellen plus Kern 15 Minuten durch Zentrifugieren mit 10000 g pelletisiert. Hochmolekulare DNA wurde wie von Jeffreys, A. J. (1979), Cell 18,1-10, beschrieben hergestellt.
Southern-Tüpfelanalyse
5-jU.g-Proben von Human-DNA wurden mit 20 Einheiten Hinfl in Gegenwart von 4mM Spermidintrichlorid 2 Stunden lang bei 37°C digeriert und durch Phenolextraktion und Ethanolpräzipitation zurückgewonnen. Restriktionsdigests wurden in 16μΙ H2O plus 4μΙ Gelfüllmischung (12,5% Ficoll 400, 0,2% Bromphenolblau, 0,2 M Trisacetat, 0,1 M Na-Acetat, 1 mM EDTA, pH-Wert 8,3) und 2/nl 5mg/ml Ethidiumbromid gelöst und auf ein horizontales Agarosegel gegeben (0,7% Sigma Typ I Agarose in 4OmM Trisacetat, 2OmM Na-Acetat, 0,2 mM EDTA, 0,5^g/ml Ethidiumbromid (pH-Wert 8,3); Gele 0,7 cm dick und 20 oder 35cm lang). Nach einer Äquilibrierungszeit von 10 Minuten wurden die Gele 24 bis 48 h lang mit 2 V/cm elektrophoresiert, bis alle weniger als 1,5 KB langen DNA-Fragmente von dem Gel abelektrophoresiert waren. DNA wurde durch Auftröpfeln auf ein Nitrozellulosefilter (Sartorius, 0,45μΐη Porengröße) übertragen. 32P-markierte einsträngige Sonden-DNA wurde von den Humanminisatelliten M13-Rekombinanten 33,6 und 33,15 hergestellt zu Southern Tupfen in 1 χ SSC bei 650C hybridisiert und wie in der Hauptanmeldung beschrieben, autoradiographiert.
Datenanalyse
Die Speicherung von Segregationsdaten und die Analyse der Kopplung wurden auf einem BBC-Mikrocomputer, Modell B, vorgenommen.
Tabelle 3 enthält eine Zusammenstellung von Minisatellitenmarkierern in der Neurofibromatose-Familie.
Tabelle 3
Vater
Mutter
Sonde:
33,6
33,15
33,6
33,15
Anz. d. bewerteten Fragmente (n) 24 17 16 16
Anz. allelomorpher Paare (a) 3 3 2 4
Anz. gekoppelter Paare (b) 1 0 1 0
Anz. unterschiedl. bewerteter
Stellen (c) 20 14 13 12
Berechn. Gesamtanz. v. Stellen (N) 43 23 27 16
Die Anzahl von unterschiedlichen bewerteten Stellen (c) wird durch n-a-b angegeben. Das gesamte DNA-Erkennungszeichen (fingerprint), das unaufgelöste und daher nicht bewertete Fragmente umfaßt, wird von N heterozygoten Stellen (2 N Fragmenten) gewonnen. Angenommen, daß die bewerteten (n-b) eindeutigen Fragmente eine Stichprobe der 2 N Bänder in einem DNA-Erkennungszeichen (fingerprint) sind, dann steht die berechnete Gesamtanzahl durch eine bestimmte Sonde entdeckter hypervariabler Stellen N mit der Anzahl allelomorpher Paare a in Beziehung durch
(n-b) (n-b-1)
2a
+ 1
Tabelle 4: Segregation hypervariabler Fragmente in der Neurofibromatose-Familie
Übertragung von: Einzelfragment erwart. " Vater (AB oder— 0 30 20 10 Einzelfragment erwart. Mutter (AB oder—) 30 20 10
0,02 Paar erwart. 3 1 2 9 0,02 Paar erwart. 0' 1 6
an: beob. 0,2 U 15 5 8 19 beob. 0,2 U 3 5 13
Anz. Kinder (r) 0 1,1 beob. 45 18 22 31 (0) 0,9 beob. 0 10 13 19
0 0 3,3 (0) 90 47 49 51 1 2,6 (0) 2 26 27 28
1 1 6,7 4 127 89 85 76 2 5,2 0 8 47 45 38
2 1 9,2 16 127 121 114 95 3 7,2 5 24 64 59 45
3 5 9,2 48 90 121 114 95 5 7,2 26 48 64 59 45
4 8 6,7 90 45 89 85 76 6 5,2 48 68 47 45 38
5 12 3,3 113 15 47 49 51 5 2,6 61 68 26 27 28
6 10 1,1 120 3 18 22 31 6 0,9 77 48 10 13 19
7 4 0,2 89 0 5 8 19 4 0,2 52 24 3 5 13
δ 0 0,02 58 1 2 9 0 0,02 23 -- 8 0 1 6
9 0 19 0 7 2
10 (0) 53,0 + 2,4% 4 (0) !,7 % 1 0
11 (0) (0)
Übertragungs 47,7 ±2
häufigkeit:
Zur Untersuchung der Übertragungshäufigkeit von hypervariablen Fragmenten (Fig.7) wurde die Anzahl von Fragmenten, die durch die Sonden 33,6 und 33,15 aus η bewerteten entdeckt wurden, die auf genau r Kinder in der Gruppe von 11 übertragen wurden, mit der erwarteten, durch die binomische Verteilung
11Cr η ·· ^— bei einer angenommenen Übertragung von 50%, gegebenen Anzahl verglichen (Tabelle 4). In allen Kindern
vorhandene Fragmente können von homozygoten Stellen stammen und wurden ignoriert. Auf irgendeines der Kinder nicht übertragene mütterliche Fragmente konnten nicht bewertet werden, weil Mutter-DNA nicht zur Verfügung stand. Die durchschnittlichen Übertragungshäufigkeiten (+ S.E.M.) sind gleichfalls angeführt.
Die Kopplung zwischen Fragmenten AB wurde durch Bewertung der Anzahl von Nachkommen, die für AB tendierten (entweder AB oder—) untersucht, wobei alle möglichen paarweisen Vergleiche von väterlichen oder mütterlichen Fragmenten angewandt wurden, die zuerst AIIeIe und gekoppelte Bänder ausgeschlossen hat (d. h. c Stellen wurden in jedem Elternteil analysiert, siehe Tabelle 3, wodurch sich
c(c — 1) paarweise Vergleiche ergaben). Paare von Fragmenten, die in die Null- oder 11 -Kinder-Klassen fallen, stellen AIIeIe
bzw. eng gekoppelte Paare dar; nach Definition fallen keine Paare in beide Klassen. Die beobachtete Verteilung wird mit der
erwarteten verglichen, wenn alle c Stellen ungekoppelt sind (U), wobei die Anzahl von paarweisen Vergleichen, die genau r (AB oder—) Nachkommen ergeben, in diesem Fall durch die binomische Verteilung 11Cr eic — 1) —_ ! gegeben wird. Die Verteilung wird auch mit der erwarteten verglichen, wenn die c Stellen gebündelt und im
gleichen Abstand vorhanden sind, wobei die benachbarten Stellen durch eine Rekombinatfrequenz9 (10, 20 oder 3OcM auseinander) getrennt sind. Das Bündel wird daher über (c - 1) ψ Karteneinheiten verteilt sein, worin ψ= —1/21 η (1-2Θ). Füre Stellen (willkürlich an einem oder einem anderen AIIeI entnommen) wird die Anzahl von paarweisen Vergleichen, die genau r (AB und—) Nachkommen in der Gruppe von 11 ergeben, gegeben durch:
(c-i). "σ.
worin Xi die Rekombinationsfraktion zwischen zwei i Karteneinheiten auseinanderliegenden Stellen ist; x* wird durch die Eintragungsfunktion
χ, = V2(I -e"2"") gegeben.
Ergebnisse DNA-Erkennungszeichen (fingerprint)-Sonden
Zwei bei den vorliegenden Untersuchungen verwendete Minisatelliten-Hybridisierungssonden werden ausführlich in der Hauptanmeldung beschrieben. Sonde 33,15 besteht aus einem geklonten Human-Minisatelliten, der sich aus 29 Wiederholungen einer 16-BP-Variante der Kernsequenz zusammensetzt. Die Wiederholeinheit des Minisatelliten in Sonde 33,6 ist ein divergiertes Trimer des am besten erhaltenen 11 -BP-3' Endes der Kernsequenz und wird 18mal wiederholt. Die Sequenzen des Kerns und der Sondenwiederholeinheit sind:
A Kern GG AGGTGG GCAGGAGG
33.15 AGAGGTGGGCAGGTGG
33.16 AGGGCTGGAGG
Der Unterschied sowohl in der Sequenz als auch der Wiederhollänge der Sonden 33,6 und 33,15 resultiert in ihrer Entdeckung verschiedener Muster von langen hypervariablen Minisatellitenfragmenten in Hinfl-Digest von Human-DNA. Diese 4-BP-Restriktions-Endonuclease maximiert die Auflösung von variablen Minisatelliten durch die Freisetzung langer sich tandemartig wiederholender Minisatelliten in DNA-Fragmenten mit wenig flankierender DNA.
Analyse von DNA Erkennungszeichen (fingerprints) in einer großen blutsverwandten Gruppe
Zur Untersuchung der Segregation individueller Minisatelliten-DNA-Fragmente, wurde eine große Gruppe"von 11 englischen Personen auf Neurofibromatose (von Recklinghausen-Krankheit), eine Autosomdominant-Störung in Verbindung mit Tumoren desperiphären und zentralen Nervensystems, segregiert. Bisher wurden noch keine genetischen Markierer mit dieser Krankheit gekoppelt.
Blut-DNA-Erkennzeichen (fingerprints), nachgewiesen durch die Sonden 33,6 und 33,15, der 11 Kinder (6 befallen, 5 nicht befallen) wurden mit ihrem nicht befallenen Vater in Fig. 7 verglichen. Die Auflösung von Minisatelliten-DNA-Fragmenten wurde durch Elektrophorese in 35cm langen Agarosegelen maximiert.
Da viele dieser hypervariablen Minisatelliten, vor allem die größten DNA-Fragmente, niedrige Allel-Häufigkeiten besitzen und nur selten, wie vorausgesagt, bei nicht-verwandten Personen auftreten, sind viele dieser Fragmente in der Neurofibromatose-Familie im heterozygoten Zustand vorhanden und werden nur auf einige der Nachkommen übertragen. Obwohl die DNA der befallenen Mutter nicht zur Verfugung stand, konnten von der Mutter stammende Minisatellitenfragmente ohne Schwierigkeiten als in einigen Nachkommen vorhandene, aber beim Vater fehlende Fragmente identifiziert werden. Väterliche Fragmente konnten ähnlich identifiziert werden. Durch Anwendung der beiden Sonden 33,6 und 33,15 war es möglich, die Segregation von 41 väterlichen und 32 mütterlichen DNA-Fragmenten in dieser Familie zu bewerten (Fig. 7, Tabelle 3). Es sind zahlreiche zusätzliche polymorphe Fragmente vorhanden, aber sie wurden entweder von dem Gel abelektrophoresiert oder unvollständig aufgelöst und konnten daher nicht zuverlässig bewertet werden.
Heterozygote väterliche DNA-Fragmente wurden im Durchschnitt auf 53% der Nachkommen übertragen. Ähnlich zeigten die mütterlichen Fragmente eine Übertragung von 48%, was auch mit der 1:1 Segregation übereinstimmt (Tabelle 4). Außerdem folgte die Anzahl der Kinder, die jedes Fragment erhielten, der erwarteten binomischen Verteilung, in der der Anteil von elterlichen Fragmenten, die auf genau r Kinder in der Gruppe von 11 übertragen werden, 11Cr —— beträgt (Tabelle 4). Es wurde die Schlußfolgerung gezogen, daß diese DNA-Fragmente Mendelsche Vererbung zeigen, und
daß die Bewertung von elterlichen Bändern, vor allem der kleineren und weniger gut aufgelösten Fragmente, nicht wesentlich durch mögliche Fälle von Segregation von zwei oder mehr überlagerten Bändern, die eine scheinbare Übertragungshäufigkeit von >75% ergeben wurden, beeinflußt wird. Die einwandfreie Mutterschaft und Vaterschaft aller Kinder wird gleichfalls durch diese DNA-Erkennungszeichen (fingerprints) bestätigt.
Durch paarweise Vergleiche der Segregationsmuster alier väterlichen oder mütterlichen DNA-Fragmente in dieser großen Familie ist es möglich, allelomorphe Paare von Fragmenten plus Paare zu identifizieren, die eine enge Kopplung bei der Verbindung zeigen (die Chancen für eine zufällige Kosegregation eines bestimmten Paares von Bändern in dieser Gruppe beträgt 1:1024). Mehrere Fälle allelomorpher Paare von väterlichen und mütterlichen Fragmenten konnten mit beiden Sonden identifiziert werden (Fig. 7). Sonde 33,6 entdeckte auch ein gekoppeltes Paar von Fragmenten bei der Mutter und bei dem Vater. Eine ähnliche Kopplung wurde in einer zweiten Familie gefunden (siehe unten), so daß man annehmen könnte, daß mindestens eine der zu Sonde 33,6 hybridisierenden hypervariablen Regionen ein langer Minisatellit/Satellit ist, der (eine) innere Spaltungsstelle(n) für Hinfl enthält und daher gespalten wird, um zwei oder mehr Fragmente zu erzeugen, die in Familien als ein Minisatelliten „Haplotyp" kosegregieren. Keines der mit Hilfe von Sonde 33,15 bewerteten polymorphen DNA-Fragmente war in der Reihe der durch 33,6 entdeckten Fragmente vorhanden; irgendein derartiges, zu beiden Sonden hybridisiertes Fragment würde als Bänder gleicher Größe entdeckt worden sein, die von dem gleichen Elternteil auf die gleichen Kinder übertragen (d.h. „gekoppelt") wurden. Diese beiden Sonden hybridisieren dahe*r zu im wesentlichen vollkommen anderen Untergruppen von Human-Minisatelliten.
Durch Ausschaltung von Allelen und gekoppelten Fragmenten wurde gefolgert, daß 34 und 25 einzelne Stellen im Vater bzw. der Mutter bewertet wurden (Tabelle 3). Bei 80% der Stellen ist nur eines der beiden AIIeIe aufgelöst, und das zweite AIIeI befindet sich vermutlich in dem schlecht aufgelösten Komplex von kürzeren Minisatellitenfragmenten. Das besagt, daß große Unterschiede in den Minisatelliten-Allel-Längen Vorhandensein müssen, die vermutlich auf einen ungleichen Austausch in diesen sich wiederholenden Tandemregionen zurückzuführen sind; verschiedene in Fig.7 identifizierte allelomorphe Paare zeigen tatsächlich erhebliche Längendifferenzen. Von dem Anteil von Bändern, die paarweise zu Allelen zusammengefügt werden können, kann man berechnen, daß die Gesamtanzahl von heterozygoten Stellen, die in den gesamten, durch die Sonden 33,6 und 33,15 entdeckten DNA-Erkennungszeichen (fingerprints) vorhanden sind, annähernd 43 bis 66 beträgt, von denen annähernd die Hälfte im Vater und der Mutter bewertet werden können (Tabelle 3). Es ist nicht möglich, Allelismus zwischen väterlichen und mütterlichen Fragmenten in dieser Familie zu bestimmen.
Alle der bewerteten väterlichen Stellen sind autosomal und zeigen keine spezifische Übertragung weder an Töchter (X Kopplung) noch an Söhne (Y Kopplung). Außerdem segregieren alle Paare AB von väterlichen DNA-Fragmenten anscheinend unabhängig in Nachkommen, so daß durchschnittlich eine gleiche Anzahl von (AB,—)undA-,-B) Nachkommen entstehen; genaue Zahlen folgten der erwarteten binomischen Verteilung für ungekoppelte Stellen (Tabelle 4). Mütterliche DNA-Fragmente zeigten ein ähnliches Verhalten. Eine ausführlichere Analyse legt nahe, daß der minimale Abstand von Stelle zu Stelle bei diesen Stellen >1,30cM (46 Karteneinheiten) betragen müßte; durch jeden engeren Abstand würde eine erhebliche Anzahl von Paaren von Fragmenten erzeugt, die zum Kosegregieren tendieren (gekoppelt bei Verbindung) oder als Pseudo-Allele segregieren (gekoppelt bei Abstoßung) (Tabelle 4). Die auflösbaren Minisatellitenstellen müssen daher über mindestens die Hälfte des 300OcM langen Human-Genoms verteilt sein, und müssen daher über viele oder alle der Human-Autosomen verstreut sein. Ein mütterliches Minisatellitenfragment (Fig.7) zeigt schwache Anzeichen für Kopplung in Verbindung mit Neurofibromatose, wobei 10/11 Kinder für dieses Fragment und die Krankheit (Θ = 1OcM, ρ = 0,006) anfällig sind. Da jedoch 25 verschiedene mütterliche Stellen bewertet worden sind, ist die Wahrscheinlichkeit, daß ein AlIeI von mindestens einer dieser Stellen zufällig den beobachteten Grad von Kopplung bei Verbindung oder Abstoßung zeigt, hoch (p = 0,24).
Beispiel 9 DNA-Erkennungszeichen (fingerprints) einer erweiterten Familie: möglich Kopplung mit HPFH
Die Analyse von DNA-Erkennungszeichen (fingerprints) wurde auf eine größere, vier Generationen umfassende Familie von Gudscharati-Asiaten ausgedehnt, die sowohl für/3-Thalassämie als auch für angeborene Persistenz von Fetalhämoglobin (HPFH) segregiert.
Autoradiogramme von in Fig.8A und 8B gezeigten Ma^kierersegregationsmustern wurden wie folgt angefertigt. TOjug-Proben von Blut-DNA wurden mit Hinfl digeriert, und DNA-Erkennungszeichen (fingerprints) wurden wie in Fig. 7 beschrieben unter Verwendung von Sonde 33,6 (A) oder 33,15 (B) erzeugt. Die Elektrophorese wurde in einem verhältnismäßig kurzen Agarosegel (20cm) vorgenommen. Die Verwandtschaft zwischen den Personen ist in Fig. 9 angegeben. A, hypervariable Fragmente a, bund csind eng gekoppelt und sind entweder alle in jedem Mitglied der Familie vorhanden oder fehlen alle. B, Kosegregation von Band g und HPFH (H). Die Personen IV7 und IV8 sind eineiige Zwillinge und haben nicht unterscheidbare DNA-Erkennungszeichen (fingerprints).
Stoffe und Methoden entsprechen denen von Beispiel 8.
Die Kosegregationsanalyse ist in den Fig. 9A und 9 B wiedergegeben.
In Fig.9A wurde die Segregation von 30 hypervariablen Fragmenten von Il 4 und 27 Fragmenten von Il 5 in Nachkommen III 1-11 nach möglicher Kopplung von Paaren AB von elterlichen Fragmenten gescreent; mögliche Beispiele für Kopplung, die
wenigstens 6/7 (AB, ) Nachkommen zeigen, wurden weiter bei zusätzlichen Verwandten untersucht. Die beiden deutlichsten
Beispiele für Kopplung werden gezeigt (a-f, Vorhandensein von Fragmenten a-f in einer Person; · Fragment fehlt). Die Fragmente a-c und e,f zeigen jeweils einwandfreie Kosegregation; Fragment d tendiert zur Kosegregation mit a-c; aber die Gruppe IV1-4 ist nicht informativ, und die eineiigen Zwillinge IV 7,8 sind rekombinant, die a-c, aber nicht d geerbt haben. B, Vererbung von /3-Thalassämie-Merkmal (c, D)1 HPFH (H) und Minisatellitenfragment g. Personen wurden als von HPFH befallen bewertet, wenn sie > 1 % HbF (normal) oder >3% HbF (-Thalassämie-Merkmal) zeigten. HPFH und /3-Thalassämiemerkmal segregieren unabhängig in Hl 1-11 und IV 5-8 und werden durch ungekoppelte Stellen bestimmt. Fragment g kosegregiert einwandfrei mit HPFH in den untersuchten Personen.
Ergebnisse
Wie in Fig.9 A, B gezeigt, wird die Elevation von HbF unabhängig vom /3-Thalassämiemerkmai übertragen und wird anscheinend durch eine nicht mit dem /3-Globin-Genbüschel gekoppelte Autosom-Dominant-Stelle bestimmt. Über eine ähnliche sardinische Familie wurde von Gianni, u. a. EMBO J. 2,921-925 (1983) berichtet.
In Fig.8A und 8 B wurden 30 variable Fragmente in dem Großvater (Il 4) und 27 Fragmente in der Großmutter (Il 5) bewertet. Die Untersuchung ihrer sieben Nachkommen (III 1-11) zeigte, daß diese Fragmente von mindestens 22 einzelnen ungekoppelten väterlichen und 18 mütterlichen autosomalen Stellen stammten, wobei die für die Neurofibromatose-Familie beschriebenen
Kriterien angewandt wurden. Die übrigen DNA-Fragmente zeigten Anzeichen von Allelismus oder Kopplung an andere Fragmente, obwohl der Beweis mit dieser kleinen Gruppe nicht möglich ist (ein bestimmtes Paar von elterlichen DNA-Fragmenten hatte eine Chance von 1 /64, daß es zufällig entweder gekoppelt oder als AIIeIe in einer Gruppe von 7 übertragen wird). Ein weiterer Beweis für Kopplung wurde bei zusätzlichen Mitgliedern der Familie gesucht, und die beiden stärksten Fälle von Kupplung sind in den Fig.8 und 9 wiedergegeben. Von Sonde 33,6 entdeckte Fragmente a, b und c werden in vollständiger Kopplung von Il 4 auf seine Kinder (III 1-11) und dann die Enkel (IV 1-8) übertragen; es waren keine Rekombinanten in 14 informativen Nachkommen zu finden (p = 4 χ 10~9 bei drei kosegregierenden Bändern). Wie oben erläutert, könnte man vermuten, daß die Fragmente a-c einen von einer einzigen hypervariablen Stelle stammenden Minisatelliten „Haplotyp" darstellen. Das durch Sonde 33,15 entdeckte Band d zeigtauch Anzeichen für Kopplung an die Bänder a-c; allerdings ist ein Kind (IV1-4) uninformativ, weil beide Elternteile das Fragment d tragen und ein anderes (IV 5-8) ein Rekombinant enthält (eineiige Zwillinge IV 7,8). Der Beweisfür Kopplung zwischen Bandfd und dem a-c-Büschel ist somit schwach (0 = 1OcM, ρ = 0,01). Mütterliche Bänder e (nachgewiesen durch 33,6) und f (nachgewiesen durch 33,15) zeigen ebenfalls eine feste Kopplung sowohl in den Abkömmlingen von Il 4 und Il 5 als auch in weiteren verwandten Nachkommen III 15-20 und IV17-22 (20 informative Nachkommen, keine Rekombinanten, 0 = OcM, ρ = 10""6). Da die Sonden 33,6 und 33,15 unterschiedliche Gruppen von Minisatelliten entdeckten und nicht zu den Fragmenten e und f kreuz-hybridisieren, können diese Fragmente ein Beispiel für authentische Kopplung zwischen zwei unterschiedlichen autosomalen Minisatellitenstellen darstellen. Schließlich sind die beiden Kopplungsgruppen (Fragmente a-c und e-f) keine AIIeIe der gleichen Stelle. Person III 1 ist eine Verbindungs-Heterozygote, die sowohl das väterliche a-c-Büschel als auch das mütterliche e-f-Paar trägt; beide Büschel werden auf zwei seiner vier Kinder übertragen, woraus hervorgeht, daß sie nicht als AIIeIe segregieren, sondern statt dessen von zwei ungekoppelten hypervariablen Regionen herrühren müssen.
Keines der mütterlichen (Il 5) Minisatellitenfragmente zeigte signifikante Kopplung mit ß-Thalassämie-Merkmalen und sind daher nicht eng an das/3-Globin-Genbüschel an Chromosom 11 gekoppelt. Im Gegensatz dazu kosegregierte ein 8,6KB langes mütterliches Fragment (g) mit HPFH bei den sieben Nachkommen und bei drei informativen Gruppen von Enkeln (Fig.9). Bei 12 Nachkommmen waren keine Rekombinanten zu sehen, was auf enge Kopplung (0 = OcM, ρ = 2 χ 1O-4) schließen läßt. Selbst wenn man die Tatsache berücksichtigt, daß 17 Stellen in Il 5 untersucht worden sind, ist diese Kopplung noch signifikant (die Wahrscheinlichkeit, daß ein AIIeI von mindestens einer der 17 bewerteten Stellen zufällig Kosegregation mit HPFH zeigen wird, beträgt 0,004). Es wurde weiterhin überprüft, ob Fragment g in Il 5 ein einzelnes Minisatelliten-Allel ist und nicht zwei übereinandergelagerte segregierende DNA-Fragmente, indem die DNA-Erkennungszeichen (fingerprints) aller in Fig.9 gezeigten Personen, digeriert mit Sau3 A anstelle von Hinf I, untersucht wurden; jedes positive Erkennungszeichen (fingerprint) enthielt ein entsprechendes Sau3A Fragment mit einer ähnlichen Größe wie das Fragment g (8,2 KB gegenüber 8,6 KB), wie von einem einzelnen Minisatellitenfragment zu erwarten war.
Diskussion
Die Nachkommenschafts-Analyse bei Menschen zeigt, daß die durch Minisatellitensonden entdeckten DNA-Erkennungszeichen (fingerprints) zuverlässig für die Untersuchung der Segregation von multiplen heterozygoten DNA-Fragmenten selbst bei Familien verwendet werden können, bei denen der eine oder andere Elternteil für die Untersuchung nicht zur Verfügung steht. Durch die Anwendung von zwei derartigen Sonden können bis zu 34 hypervariable Stellen gleichzeitig bei einer einzigen Person analysiert werden, eine Rate von Gen-Markierer-Erzeugung, die viel höher liegt als die mit herkömmlichen Methoden einschließlich RFLPs in der Humangenetik erzielte. Durch die ständige Vererbung von variablen Minisatellitenfragmenten in Verbindung mit der geringen Populationshäufigkeit von individuellen Fragmenten sind sie ausgezeichnet für die Kopplungsanalyse geeignet, wie durch die Beispiele der bei den beiden untersuchten Familien entdeckten Kopplung gezeigt wurde. Es soll betont werden, daß obwohl diese hypervariablen Minisatelliten Rekombinations-Heißstellen sein können, die geschätzte Rate von an einem langen Minisatelliten erfolgendem Austausch (~ 0,001 je Garnet) nicht ausreicht, um die Kopplung zwischen einer Minisatellitenstelle und einem benachbarten Gen, z. B. einer Krankheitsstelle, erheblich zu stören. Es wird geschätzt, daß die Gesamtanzahl von zusammen durch die Minisatellitensonden 33,6 und 33,15 entdeckten hypervariablen Stellen annähernd 60 beträgt. Mindestens eines der beiden AIIeIe von etwa der Hälfte dieser Stellen kann in einem bestimmten DNA-Erkennungszeichen (fingerprint) aufgelöst werden, und daher folgt daraus, daß das Spektrum von untersuchten Stellen in unterschiedlichen DNA-Erkennungszeichen (fingerprints) nicht identisch sein wird. Die meisten oder alle derartigen Stellen sind genetisch ungekoppelt und müssen somit über einen erheblichen Teil des Human-Genoms verstreut sein. Ihre genaue Lage ist nicht bekannt, und man muß das Klonen und die regionale Lokalisierung von individuellen hypervariablen Minisatellitenstellen abwarten. Komischerweise wurden bisher keine Minisatelliten am X- oder Y-Chromosom in keiner der untersuchten Familien gefunden. Es wird geschätzt, daß annähernd 43 verschiedene Stellen auf mögliche Geschlechtskoppiung im Vater der Neurofibromatose-Familie zusammen mit Person Il 4 in derHPFH-Familie bewertet worden sind. Da X-und Y-Chromosomen zusammen ~ 5% des Genoms eines Mannes bilden, beträgt dann die Wahrscheinlichkeit, daß keine wahllos verteilten 43 Stellen an diesen Chromosomen sitzt, (0,9O)43 = 0,1; das offensichtliche Fehlen von geschlechtsgekoppelten Minisatelliten ist daher nicht von Bedeutung.
Diese verteilten hypervariablen Minisatellitenstellen sind für die Suche nach mit Krankheitsstellen gekoppelten Markierern gut geeignet, wie durch die vorläufigen Beispiele von Kopplung mit Neurofibromatose und HPFH gezeigt wird. Im Gegensatz zur herkömmlichen genetischen Einzel-Stellen-Analyse können Kopplungsdaten nichtzwischen nicht-verwandten kleinen Gruppen verteilt sein, weil ein anderes Minisatelliten-Allel wahrscheinlich mit der Krankheitsstelle in jedem Nachkommen assoziiert ist. Statt dessen sind DNA-Erkennungszeichen (fingerprints) nur für die Untersuchung der Kopplung, vor allem von Dominantstörungen, in einer großen Gruppe und am besten in einer einzigen großen Familie geeignet. Bisher gestatten die Sonden 33,6 und 33,15 die Bewertung von bis zu 34 autosomalen hypervariablen Stellen in einem Lebewesen. Die Chance, daß mindestens eine dieser Stellen eng mit einer bestimmten Krankheitsstelle (innerhalb 1OcM) gekoppelt ist, beträgt 20%, bei einer angenommenen wahllosen Verteilung von Minisatelliten in der 300OcM langen Human-Kopplungs-Karte. Bei erweiterten Gruppen wie der HPFH-Familie fällt diese Wahrscheinlichkeit auf ~ 10%, weil nur ein AIIeI der meisten Stellen bewertbar ist, und um Kopplung nachweisen zu können, müßte dieses AIIeI bei Kopplung mit der Krankheitsstelle verbunden sein. Um diese Wahrscheinlichkeit auf über 50% zu erhöhen, wäre die Bewertung von >104 hypervariablen Stellen in einer einzigen großen Familie und von > 208 Stellen in einer erweiterten Gruppe erforderlich. Diese
Werte liegen über der Gesamtanzahl von mit den beiden Minisatellitensonden bisher nachgewiesenen Stellen. Die Sonden 33,6 und 33,15 entdecken jedoch im wesentlichen vollkommen verschiedene Gruppen von hypervariablen Stellen, so daß man annehmen kann, daß die Gesamtanzahl von Human-Minisatelliten, die verschiedene Versionen der Kernsequenz enthalten, sehr groß sein kann.
Bei der herkömmlichen Human-Nachkommenschafts-Analyse unter Verwendung definierter Einzel-Stellen-Markierer, ergibt der Nachweis von Kopplung zwischen einem Markierer und der Krankheitsstelle gewöhnlich direkt die annähernde genomische Lage der Krankheitsgens, und das kann weiterhin durch die Analyse von weiteren Nachkommen ermittelt werden. Die Umkehrung gilt für DNA-Erkennungszeichen (fingerprints). Eine weitere Analyse für mögliche Kopplung zwischen einem hypervariablen DNA-Fragment und einer Krankheit ist über die Isolierung des Fragments durch präparative Gelelektrophorese und Klonen möglich. Stellenspezifische Hybridisierungssonden können dann aus dem isolierten Minisatelliten entweder unter Anwendung von einmaligen Sequenz-DNA-Segmenten, die den Minisatelliten unmittelbar flankieren, oder durch Anwendung des gesamten Minisatelliten bei sehr scharfer Hybridisierung entwickelt werden. Solche stellenspezifischen Sonden können zur Erweiterung der Kopplungsdaten in zusätzlichen Familien und zur Lokalisierung des Minisatelliten innerhalb des Human-Genoms verwendet werden. Diese Möglichkeit wurde kürzlich durch Klonen des8,2KBSau3A Minisatellitenfragmentes, das scheinbar an die HPFH-Stelle in der Gujdscharati-Familie gekoppelt ist, bestätigt.
Wie oben beschrieben wurde, erzeugen die Sonden 33,5,33,6 sowie 33,15, von denen jede aus einem Human-Minisatelliten besteht, der sich in jedem Fall aus einer anderen Variante der Kernsequenz zusammensetzt, unterschiedliche DNA-Erkennungszeichen (fingerprints) und entdecken daher unterschiedliche Gruppen von hypervariablen Minisatellitenregionen in Human-DNA und der anderer Vertebrates Vor allem die Sonden 33,6 und 33,15 entdecken weitgehend oder vollkommen verschiedene Gruppen von Minisatelliten (siehe die dritte Anmeldung und „DNA ,Erkennungszeichen' (,fingerprints') und Kopplungsanalyse in Human-Nachkommenschaften", von A.J.Jeffreys, V.Wilson, S.L.Thein, D.J.Weatherall & B.A. J. Ponder) infolge der Differenzen, die sowohl hinsichtlich der Länge als auch der genauen Sequenz des in jeder Sonde vorhandenen wiederholten Kernes vorhanden sind.
Um untersuchen zu können, ob die Möglichkeit besteht, weitere hypervariable Regionen unter Verwendung von Tandemwiederholungen von anderen Versionen der Kernsequenz entdecken zu können, wurde eine Reihe synthetischere Minisatelliten hergestellt.
Beispiel 10 Synthese und Klonen eines künstlichen Minisatelliten
Der Versuch, Mehrkernsonden herzustellen, wird in Fig. 10 dargestellt, in der der Weg für die Herstellung einer geklonten Tandemwiederholung der Kreuzungs-Heißstellen-Initiator-Sequenz (Chi, GCTGGTGG) von E.coli gezeigt wird. Für die Schritte zur Erzeugung einer Poly-Chi-Sonde wurden Standard-DNA-Techniken angewandt und betrafen:
1. Ein synthetisches Oligonucleotid, das eine Tandemwiederholung der 8 Nucleotide langen Chi-Sequenz enthielt, wurde nach dem Verfahren von H. W. D. Matthes, u.a., (1984) (EMBO J. 3,801-805) und D. G. Brenner & W. V. Shaw (1985) EMBO J. 4,561-568 hergestellt Ein zweites aus einem Dimer der komplementären Sequenz von Chi bestehendes Oligonucleotid wurde gleichfalls synthetisiert.
2. Diese beiden Oligonucleotide wurden bei 37°C in 1OmM MgC^, 10 mM Tris-HCI (pH-Wert 8,0) miteinander verschmolzen, um ein kurzes doppelsträngiges Segment von DNA zu bilden. Die Sequenz des zweiten Oligonucleotids wurde gewählt, um ein verschmolzenes Molekül mit 3-Nucleotid-langen 5' vorstehenden, für die Kopf-Schwanz-Ligation geeigneten Termini zu schaffen.
3. Die 5'-Termini wurden unter Verwendung von T4Polynucleotidkinase plus ATP phosphoryliert.
4. Getemperte DNA-Fragmente wurden in einer Kopf-Schwanz-Art unter Verwendung von T4DNA-Ligase plus ATP miteinander ligiert, um ein wiederholtes Chi-Polymer zu erzeugen.
5. Ligierte Polymere wurden durch Elektrophorese durch ein 1,5%igesAgarosegel nach der Größe getrennt, und Polymere mit einer Länge über 150 Basenpaare wurden durch Elektrophorese auf DE 81 Papier isoliert (Dretzen, G., Bellard, M., Sassone-Corri, P., &Chambon, P., 1981, Anal. Biochem. 112, 295-298).
6. Die zurückgewonnenen langen Polymere wurden durch Einfüll-Reparatur unter Verwendung des Klenow-Fragmentes von E.coli DNA Polymerase I stumpf-beendet und in die Smal-Stelle von M13MP19 RF DNA ligiert. (J. Messing & J. Vieira, 1982, Gene 19.269-276). Ligierte DNA wurde in E.coli JM101 transformiert und einsträngige Phagen-DNAvon individuellen weißen Plaques isoliert.
7. Der DNA-Insert jedes geklonten Isolats wurde mit Hilfe der Didesoxynucleotidmethode sequenziert (M. D. Biggin, T. J. Gibson & H. F. Hong, 1983, Proc. Nat. Acad. Sei. USA 80, 3963-3965), um die Länge, Orientierung und Sequenz des polymeren Inserts zu bestimmen. Eine Rekombinant M13-Phage wurde gefunden und als M13-Kern A bezeichnet, die 50 Tandemwiederholungen der in der ausgereiften einsträngigen Phagen-DNA 5'-» 3' ausgerichteten Chi-Sequenz enthielt (d. h. der Insert ist Poly(Chi) und nicht Poly (komplementär von Chi).
8. Eine 32P-markierte einsträngige Hybridisierungssonde wurde durch Primer-Extension unter Anwendung der gleichen Methoden wie zur Herstellung der Sonden von Phage 33,6 und 33,15 hergestellt.
Beispiele 11 bis 15 Herstellung von fünf weiteren künstlichen Minisatelliten
Unter Anwendung der obigen Technik wurden fünf weitere Versionen der Kernsequenz synthetisiert und als Polykern-Rekombinanten in M13 geklont, um Rekombinanten in M13 geklont, um Rekombinanten M13-Kern A-F zu gewinnen. Die Kernvarianten wurden so gewählt, daß sie sowohl hinsichtlich der Länge als auch der genauen Sequenz des Kernes variieren. Tabelle 5 enthält eine Zusammenstellung der Wiederholsequenz in Klonen M13-Kern A-F im Vergleich mit der Kernsequenz und mitfrüher verwendeten, in den früheren Anmeldungen beschriebenen Sonden 33,5,33,6 und 33,15. Die am stärksten invarianten Basen in der Kernsequenz sind unterstrichen. Die Orientierung jedes Insert in dem Vektor M13MP19 ist gleichfalls angegeben (-», Insert ist Poly(kern); <—, Insert ist die komplementäre Sequenz von Poly(kem). In der unteren Beschreibung angegebene Basen bezeichnen Abweichungen von der Kernsequenz. Kurze Charakterisierungen jeder Sequenz sind in den „Bemerkungen" zusammengefaßt.
Tabelle 5: Charakterisierung von sechs künstlichen Minisatellitensonden (M13.Kern A-F)
Homologie (%) BP Anz.Orien- Bemerkungen
Wieder-tierung holungen
Kern GGAGGTGGGCAGGAAG 16
G
33,6 (a)a GGGCt GGAGG
33,15 a GAGGTGGGCAGGt GG
33,5 g GGAGGTGGGCAGGAGG
M13.KernA TGGGCt GG
M13.KernB GTGGGCAGGAAG
M13.KemC TGGGCAG
M13.KemD GGTGGGCAGGt GG
M13.KernE a GGGCA
M13.KernF AGGcaGGtAGGtGG 14
11(12) 3x18
16 29
17 14
δ 50
12 7
7 47
13 5
6 34
100
(82) Chi
(87,5) Kurzer Kern
(91) Sehr kurzer
87,5 Kern
100 Kurz 33,15
100 Sehr kurze
33,6/33,15
92 Hybride
83 Kurz 33,15,
TGGGCA unter
brochen
71
Beispiel 16 Hybridisierung von M13.Kern A-F zu mit Hinfl digerierter Human-DNA
Bei einem anfänglichen Screening wurden DNA-Digests von zwei nicht-verwandten Individuen mit 33,15 und mit jeder der Sonden M13.Kern A-F sondiert. 8^g-Proben von DNA von zwei nichtverwandten Plazentas (1,2) wurden mit Hinfl digeriert, durch ein 0,7%iges Agarosegel elektrophoresiert, Southern-getüpfelt und zu jeder mit 32P markierten Sonde nach dem in der Hauptanmeldung beschriebenen Verfahren hybridisiert. Die gewonnenen Autoradiogramme sind in Fig. 11 enthalten. Alle Sonden entdeckten multiple DNA-Fragmente in jedem Individuum.
Ergebnisse
Die Sonden B, C und D entdeckten jeweils ein Erkennungszeichen (fingerprint) von DNA-Fragmenten, das bei den beiden Individuen erheblich differierte; das Erkennungszeichen (fingerprint) variierte auch von Sonde zu Sonde, obwohl einige Fragmente von mehr als einer Sonde entdeckt wurden und bis zu einem gewissen Grade mit der Gruppe der von Sonde 33,15 entdeckten hypervariablen Fragmenten eine Überlappung zeigten. Man schlußfolgert, daß die Sonden B-D alle für die DNA-Erkennung (fingerprinting) geeignet sind und zusammen die Anzahl von hypervariablen Minisatelliten, die bei Menschen und anderen Vertebraten untersucht werden können, erweitern werden. Von Interesse ist hier das mit Kern C gewonnene erfolgreiche Erkennungszeichen (fingerprint), das nur das mittlere am besten erhaltene 7-Basenpaar-Segment der Kernsequenz enthält.
Durch weitere Kürzung des Kernes zur Gewinnung der6-Basenpaar-Wiederholung in Kern.E wurde das DNA-Erkennungszeichenmuster vollständig verändert, um eine Gruppe von Fragmenten zu enthüllen, die meistens auf die beiden getesteten Individuen verteilt sind (d. h. diese Fragmente zeigen keine extreme polymorphe Veränderung). Daher ist Kern E vermutlich nicht so brauchbar wie eine Sonde für die DNA-Erkennungszeichen-Analyse wie die zuvor verwendeten Sonden 33,5, 33,6 und 33,15. Das läßt auch auf eine praktische Mindestforderung von 7-Basenpaaren von Kernsequenzen für eine allgemein erfolgreiche DNA-Erkennung (fingerprinting) schließen. Durch eine Zerreißung der mittleren am besten erhaltenen Region des Kernes (M 13.Kern F) scheint auch die Kompliziertheit und Variabilität des DNA-Erkennungszeichenmusters reduziert zu werden. M13.Kern A (Poly Chi) erzeugt ein neuartiges und intensives Muster von hybridisierenden DNA-Fragmenten. Viele dieser Fragmente sind sehr groß (>15KB) und schlecht aufgelöst und können ohne weiteres von einer herkömmlichen langen Satellitensequenz stammen, die die zufällige Hinfl-Spaltungsstelle enthält. Einige DNA-Fragmente zeigen individuelle Variabilität.
Beispiel 17
Weitere Untersuchung von Kern A
Die von M13.Kern A erzeugten Muster wurden weiterhin bei der von Neurofibromatose befallenen Familie analysiert, die auch unter Verwendung der Sonden 33,6 und 33,15 umfassend charakterisiert wurde (siehe Beispiel 8 und Fig. 7). In Fig. 12 werden DNA-Erkennungszeichen (fingerprints) von Hinfl Digests von DNA von dem Vater (F), sechs Töchtern (D) und fünf Söhnen (S) gezeigt. Von Neurofibromatose befallene Personen, einem vererbten Autosomdominat-Krebs, sind mit + gekennzeichnet; DNA von der befallenen Mutter stand nicht zur Verfügung. Segregation von väterlichen (·) und mütterlichen (o) Bändern ist gekennzeichnet. Durch eine durchgehende Linie verbundene Bänder sind gekoppelt, und die durch gestrichelte Linien verbundenen segregrieren als AIIeIe. Mit(x) gekennzeichnete Bänder wurden kürzlich unter Verwendung von Sonde 33,15 entdeckt.
Ergebnisse
Im Gegensatz zu den mit den Sonden 33,6 und 33,15 gewonnenen DNA-Erkennungszeichen (fingerprints) ist der Grad der Variabilität verhältnismäßig gering, wobei viele Fragmente an alle Nachkommen übertragen werden (d. h. diese Fragmente sind gemeinsam, nicht selten, in der Population vorhanden und oftmals im homozygoten Zustand vorhanden). Die Segregation von 6 heterozygoten väterlichen und 9 heterozygoten mütterlichen Bändern konnte in der Gruppe der 11 Kinder bewertet werden.
Eines der väterlichen und ein allelomorphes Paar der mütterlichen Bänder wurde früher mit Sonde 33,15 entdeckt. Nach Eliminierung allelomorpher und gekoppelter Paare von Bändern stehen 2 neue väterliche Stellen und 6 neue mütterliche Stellen zur Verfügung, die bisher weder mit Sonde 33,6 noch mit 33,15 bewertet wurden, im Vergleich zu 34 väterlichen und 25 mütterlichen früher bewerteten Stellen. Die Poly-Chi-Sonde ist daher bei der Gen-Analyse bei Menschen nur von begrenztem Nutzen.
Die Ergebnisse der Beispiele 16 und 17 bestätigen die Bedeutung der neun in der obersten Reihe von Tabelle 5 unterstrichenen und früher auf Seite 18 der Hauptanmeldung erörterten Dominant-Nucleotide. Es ist ein langer Weg zurückzulegen, um die in der Hauptanmeldung gemachte Voraussage, daß eine Mindestsequenz von sechs Nucleotiden in einem erfolgreichen Sondenkern erforderlich ist, bestätigen zu können. Somit ist Kern E ein Vertreter mit minimaler Nützlichkeit, und es ist möglich, daß andere Sequenzen von sechs Nucleotiden eine schwach verbesserte Brauchbarkeit zeigen könnten, z. B. die Sequenz TGGGCA, die später erklärt wird. Die Erhöhung auf sieben Nucleotide ist im Rahmen der Erfindung ziemlich dramatisch. In einem Versuch, die wichtigsten Punkte einer brauchbaren Kemsequenz zu definieren, können die Varianten X und Y, die oben zur Kennzeichnung alternativer Nucleotide verwendet wurden, mit Erfolg zu einer vollständigen logischen Gruppe erweitert werden, wie anschließend gezeigt wird:
X = AoderG P = nichtG
Y = CoderT (Q = nicht A) W = AoderT (R = nichtC)
V = C oder G (S = nicht T)
(O = alles)
( ) = in der folgenden Diskussion nicht verwendet. *
Durch Anwendung dieser Terminologie kann von einem erfindungsgemäßen Aspekt gesagt werden, daß er ein Polynucleotid betrifft, das die folgende wiederholte Kemsequenz:
GPGGGCWGGWXG (6)
enthält. Die obige kennzeichnet natürlich die repräsentativste Zwölf-Nucleotid-Sequenz. Es wurde jedoch gezeigt, daß der Sieben-Nucleotid-Kem C gleichfalls sehr brauchbar ist, und um diesen mit „erlaubten" Varianten von der obigen Zwölf-Kernsequenz mit einzubeziehen, kann ein Aspekt so ausgelegt werden, daß er auch ein Polynucleotid, das Wiederholungen der unten aufgeführten Sieben-Kernsequenz aufweist
PGGGCWG (7)
umfaßt.
Vorzugsweise wird P natürlich gleich T wie in Kern C sein. Die andere günstigste Möglichkeit wäre A.
Wegen der Deutlichkeit wurde die prozentuale Homologie auch in Tabelle 3 angegeben. Hinsichtlich der künstlichen Sonden dieser Anmeldung sollte beachtet werden, daß es sich bei den Wiederholungen um genaue Wiederholungen handelt, so daß die Homologie des Minisatelliten als Ganzes durch die Homologie der Kemsequenz angegeben werden kann. Das war nicht unbedingt bei den früheren Sonden 33,6,33,15 und 33,5 der Fall, bei denen die Homologie in Klammern angegeben wurde. Das ist auf zwischen den Wiederholungen auftretende Varianten zurückzuführen. Kern F deutet vielleicht auf eine minimale prozentuale Homologie für die Brauchbarkeit hin. Dieses Fehlen von Konsensus wurde vermutlich durch das Zerreißen der mittleren/in dem Kern vorhandenen Gruppierung
TGGGCA (8)
übertrieben. Es ist bemerkenswert, daß die obige Gruppierung in den erfolgreichsten Sonden B, C und D vorhanden ist und in allen weniger erfolgreichen A, E und Fzerrissen ist. Es ist daher zu erwarten, daß erfolgreichere Sonden mit einem Minimum von 70% Gesamthomologie mit Formel (6) zu erzeugen sein müßte
Es ist bemerkenswert, daß die mittlere Sechs-Polynucleotidgruppierung von Formel (8)
TGGGCA
in Kern E gleichfalls zerrissen wurde. Es könnte möglich sein, daß eine Sechs-Nucleotid-Kernsequenz wie oben erfolgreicher sein würde, obwohl die Erhöhung der Länge von.sechs auf sieben Nucleotide sich als ein stärker vorherrschendes Merkmal erweisen könnte.
Daher kann von einem erfindungsgemäßen Aspekt gesagt werden, daß er ein Polynucleotid, das Wiederholungen der Kemsequenz TGGGCA aufweist, betrifft.
Allgemeiner kann gesagt werden, daß die Erfindung in einem Aspekt ein Polynucleotid nach der „ersten" Definition oben betrifft, in dem die Sequenz TGGGCA in allen sich wiederholenden Sequenzen vorhanden ist.
Unter einem anderen Aspekt betrachtet, kann von der Erfindung gesagt werden, daß sie eine Modifikation des Polynucleotide von der „ersten" Definition oben betrifft, in dem „Kern" eine Sequenz von mindestens sechs aufeinanderfolgenden Nucleotiden, gelesen in der gleichen 5' —» 3' Richtung, ausgewählt aus der in Formel (2) gezeigten Sequenz, darstellt; „Kern" muß nicht unbedingt die gleiche Sequenz in jeder sich wiederholenden Einheit haben, vorausgesetzt, daß alle Einheiten die Sequenz TGGGCA enthalten.
Vorzugsweise werden die übrigen Gruppen jeder Einheit mindestens 70% Homologie mit der Sequenz von Formel (6) (oder noch besser von Formel [2]) innerhalb der Grenzen der Gesamteinheitslänge aufweisen.
Bestimmung von Zwillingszygotie bei der Geburt
Die Bestimmung von Zygotie bei Zwillingen ist nicht nur für epidemiologische, genetische und geburtshilfliche Untersuchungen von Bedeutung, sondern auch wegen der Differenz in der Prognose zwischen monozygOten und dizygoten Zwillingen. Monozygote oder eineiige Zwillinge haben ein geringeres Geburtsgewicht, bereiten größere medizinische Schwierigkeiten und weisen höhere Sterblichkeitsraten als dizygote Zwillinge auf. Bei Kaukasiern sind etwa 30% der neugeborenen Zwillinge von unterschiedlichem Geschlecht und somit dizygot. Eine Untersuchung der Plazentamembran zeigt, daß weitere 20% der Fälle monochorionisch sind, und diese sind immer monozygot. Die übrigen 50%, ein Anteil der verhältnismäßig konstant auf Populationen verteilt ist, haben gleiches Geschlecht, haben diamniotische dichorionische Plazentas und können entweder mono-oder dizygot sein. Es wurde eine Vielzahl von Methoden zur Bestimmung von Zygotie in diesen Fällen angewandt, wobei das allgemeine Aussehen, Erkennungszeichenermittlung (fingerprinting), Hauttransplantation, Geschmackprüfung und Bestimmung genetischer Markierer vorgenommen wurden. Das letztere ist am zuverlässigsten mit einer Genauigkeit von 95 bis 98%. Normalerweise müssen jedoch sehr viele derartige Markierer untersucht werden, weil die meisten Protein- und Antigenvarianten verhältnismäßig geringe mittlere Heterozygotien haben.
In den folgenden Beispielen wurden DNA von zwölf Paaren neugeborener Zwillinge unter Verwendung der oben beschriebenen Minisatelliten-DNA-Sonden untersucht. Erzielte DNA-„Fingerabdrücke" demonstrieren eine solche Variabilität zwischen Personen, daß nur monozygote Zwillinge identische Muster zeigen. In den sieben Fällen, in denen Zygotie durch Geschlechtsbeobachtungen oder Plazentauntersuchungen bestimmt werden konnte, stimmten die DNA-Ergebnisse mit diesen Ermittlungen überein. Bei den anderen fünf Zwillingspaaren und bei den zwei Gruppen von Drillingen ermöglichte die DNA-Analyse eine rasche Bestimmung von Zygotie. Erfindungsgemäße DNA-Sonden bieten somit einen einfachen genetischen Test, der eine positive Bestimmung von Zygotie in allen Fällen von mehrkeimiger Schwangerschaft ermöglichen sollte.
Beispiel 18
Einsträngige-DNA-Sonden 33,6 und 33,15 wurden zur Bestimmung von Zygotie bei zwölf Paaren neugeborener Zwillinge verwendet, worüber Einzelheiten in Tabelle 6 zu finden sind.
Tabelle 6 Schwangerschaftszeit Ges
Fall 38 Wochen FF
1 38 Wochen MF
2 30 Wochen MM
3 33 Wochen FF
4 40 Wochen FF
5 37 Wochen MF
6 32 Wochen FF
7 34 Wochen MF
8 39 Wochen MM
9 38 Wochen MF
10 27 Wochen MM
11 35 Wochen FM
12
Plazentation*
DNA-Muster
Monochorionisch Dochorionisch Dichorionisch Monochorionisch Dichorionisch Dichorionisch Dichorionisch Dichorionisch Dichorionisch Dichorionisch Dichorionisch Dichorionisch
Identisch
Nichtidentisch
Identisch
Identisch
Nichtidentisch
Nichtidentisch
Identisch
Nichtidentisch
Nichtidentisch
Nichtidentisch
Identisch
Nichtidentisch
* Alle Plazentas waren diamnionisch
Bei Entbindung entnommene Nabelschnur-Blutproben oder peripherale Blutproben (0,5 bis 1,0 ml), die von jedem Baby am Tage nach der Geburt gewonnen wurden, wurden zur DNA-Extraktion verwendet. Plazentas wurden untersucht, um zu bestimmen, ob sie mono- oder diamniotisch oder chorionisch waren. DNA wurde mit Hilfe von Standard-Verfahren extrahiert (Old, J. M., Higgs, D. R., Gene analysis in D.J.Weatherall, Herausg.TheThalassaemias. Methods in Haematology [Die Thalassämie. Verfahren in der Hämatologie], Churchill Livingstone, 1983) und 10 bis 15^g wurden mit Hinfl digeriert. Die Proben wurden durch ein 22cm langes 0,6%igesAgarosegel bei 45V etwa 36 Stunden lang elektrophoresiert, bis alle < 1,5 KB langen DNA-Fragmente vom Gel abelektrochoresiert worden waren. DNA wurde durch Tüpfeln auf ein Nitrozellulosefilter übertragen und zwei Stunden lang unter Vakuum getrocknet. Dieeinsträngigen DNA-Sonden, 33,15 und 33,6 wurden nach obiger Beschreibung mit 32P markiert. Die Ergebnisse sind in Fig. 13 dargestellt.
In Fig. 13 zeigen die Lanes 1,2 die DNA-Bandmuster, die bei jedem Zwilling im Falle 1 unter Anwendung dereinsträngigen 33,6-Minisatellitensonde gewonnen wurden. Lanes 3 bis 19 zeigen die mit der einsträngigen 33,15-Sonde erzielten „Fingerprints": — Fall 1, Lanes 3,4; Fall 2 Lanes 5, 6; Fall 3, Lanes 7, 8; Fall 4, Lanes 9,10; Fall 5, Lanes 11,12; Fall 6, Lanes 13, 14; Fall 7, Lanes 15,16. Lanes 17 bis 19 sind drei Drillinge von weiblichem, männlichem und weiblichem Geschlecht. Ein Vergleich der Lanes 1 und 2 mit den Lanes 3 und 4 zeigt, daß die beiden Sonden 33,6 und 33,15 verschiedene Gruppen von Minisatellitenbändern entdecken. Größenmarkierer sind in Kilobasen angegeben.
In sieben Fällen (siehe Tabelle 6) konnte Zygotie einfach durch Untersuchung des Geschlechts der Zwillinge und ihrer Plazentamembranen bestimmt werden. Alle Zwillinge mit monochorionischen (oder monoamniotischen) Plazentas (z. B. Fall 1) sind monozygot, obwohl nur etwa 50% der monozygoten Zwillinge monochorionische Plazentas haben (2). Folglich mußten die Zwillinge im Fall 1 monozygot sein, und sie zeigten identische DNA-Muster bei beiden Sonden 33,15 und 33,6 (Fig. 1). In fünf Fällen hatten die Zwillinge unterschiedliches Geschlecht und zeigten bei beiden Sonden 33,15 und 33,6 unterschiedliche Bandmuster. In den Fällen 3,5,7,9 und 11 wiesen die Zwillinge das gleiche Geschlecht auf und hatten dichorionische Plazentas, daher konnten sie weder mono- noch dizygot sein. DNA-Analysen zeigten, daß zwei Paare von Zwillingen (Fälle 5 und 9) unterschiedliche Bandmuster hatten und daher dizygot waren, während identische Bänder in den drei anderen Fällen (Fällen 3,7 und 11) auf Monozygotie deuteten.
Zwei Gruppen von neugeborenen Drillingen wurden in gleicher Weise untersucht. In beiden Fällen hatte die Mutter Fruchtbarkeitsmedikamente zur Herbeiführung einer Schwangerschaft eingenommen, und jeder Drilling zeigte ein einmaliges Bandmuster (z.B. Lane 17 bis 19, Fig. 13).
Die Ergebnisse gehen aus Fig. 14 hervor, in der Lanes 1 und 2 die Ergebnisse bei Verwendung von einsträngiger33,15 und die Lanes 3 und 4 die Ergebnisse bei Verwendung von doppelsträngiger 33,15 zeigen.
Beispiel 19
Obwohl sowohl ein- als auch doppelsträngige Sonden für die Erarbeitung jeder Diagnose ausreichten, konnten mehr Bänder mit radioaktiveren einsträngigen Sonden unterschieden werden (Fig. 14).
Als Alternative zu diesen einsträngigen Sonden wurde die Möglichkeit untersucht, die entsprechenden doppelsträngigen Sonden einzusetzen, die in den meisten Laboratorien bekannter sind. Bei den verwendeten doppelsträngigen DNA-Sonden handelte es sich um I) ein doppelsträngiges 600BP Pstl — Ahalll-Fragment, das den „Kem"-Minisatelliten von λ33,15, enthielt, und I!) ein doppelsträngiges 720 BPHaelll-Fragment, das den „Kern"-Minisatelliten von λ33,6 enthielt. Diese wurden durch Einschnitt-Translation zu einer spezifischen Aktivität von 0,5 bis 1,0 χ 109cpm 32VIpQ DNA markiert. Die Bedingungen für die Prähybridisierung und die Hybridisierung entsprachen den in dem oben identifizierten Standardverfahren beschriebenen, nur wurden 1 χ SSC und 10 % Dextransulfat in dem Hybridisierungspuffer für die doppelsträngigen Sonden verwendet. Die Filter wurden 1 Stunde lang in 1 χ SSC bei 65°C gewaschen und mit Verstärkerfolien 1 bis 3 Tage lang bei -70°C autoradiographiert.
Diskussion der Beispiele 18 und 19
In den sieben Fällen, in denen Zygotie unabhängig bestimmt werden konnte, stimmten die DNA-Ergebnisse mit den aufgrund von Beobachtungen des Geschlechts und von Plazentauntersuchungen gezogenen Schlußfolgerungen überein. Bei den anderen fünf Paaren war eine eindeutig klare Bestimmung von Zygotie mit Hilfe der Minisatellitensonden möglich. In ähnlicher Weise konnten von den beiden untersuchten Drillings-Gruppen nachgewiesen werden, daß sie trizygot sind. In den 50% der Fälle, in denen Zwillingszygotie weder anhand des ungleichen Geschlechts (dizygot) noch einer monochorionischen Plazenta (monozygot) bestimmt werden kann, muß eine genetische Analyse angewandt werden. Der Informationswert solcher Tests ist dem Umfang von Polymorphismusan den untersuchten Genstellen und der Anzahl der getesteten Stellen proportional. Bei mehrfachen Antigen- und Enzymbestimmungen roter Blutkörperchen können Genauigkeiten in bezug auf von Zygotie in der Größenordnung von 95 bis 98% erreicht werden, allerdings nur, wenn die relevanten Allelhäufigkeiten in der Population bekannt sind (Nylander, P. P. S., The phenomenon of twinning (das Phänomen von symmetrischer Zellteilung). In: Barron, S. L., Thomson, A. M., Herausgeber, Obstetrical Epidemiology (Epidemologie in der Geburtshilfe). London, Academic Press, 1983:143-165). Auch die Analyse hinsichtlich mehrfachem Restriktionsenzym-Stellenpolymorphismus ergibt mit mehreren verschiedenen DNA-Sonden einen erheblichen Prozentsatz von „falscher positiver" Diagnose von Monozygotie (Derom, C, Bakker, E., Vlietinek, R., Derom, R., Van der Berghe, HI,Thiery, M., Pearson, P., Zygosity determination in newborn twins using DNA variants [Bestimmung von Zygotie bei neugeborenen Zwillingen unter Verwendung von DNA-Varianten]), J. Med. Genet., 1985,22: 279-282). Durch erfindungsgemäße Minisatellitensonden wird dieses Problem wegen der großen Anzahl und der beträchtlichen Variabilität der hypervariablen DNA-Segmente, die sie entdecken, gelöst. Wie bereits oben beschrieben, sind hybridisierende Minisatellitenfragmente nur selten zwischen willkürlich ausgewählten Personen verteilt (vergleiche auch nicht verwandte Personen in Fig. 13). Es wurde oben- schon gezeigt, daß die Chancen gegen zwei nicht verwandte Personen, die identische DNA Erkennungszeichen (fingerprints) mit beiden Sonden 33,6 und 33,15 zeigen, die verschiedene Gruppen hypervariabler Stellen entdecken, daher astronomisch sind (p < 1018, siehe Beispiel 4). Bei blutsverwandten Gruppen, die etwa die Hälfte ihrer Fragmente gemeinsam besitzen, beträgt die Wahrscheinlichkeit einer solchen „falschen positiven" Diagnose von genetischer Identität <10~8. Daher wird durch die kombinierte Verwendung der einsträngigen Hybridisierungssonden 33,6 unS 33,15 eine Genauigkeit erzielt, die.einige Größenordnungen höher als bei bisherigen genetischen Tests liegt. Selbst bei der Anwendung der konventionelleren doppelsträngigen Minisatellitensonden, die nicht zu den durch die einsträngigen Sonden entdeckten schwächeren Bändern hybridisieren können (Fig. 14), können noch genügend Informationen aus DNA-Erkennungszeichen (fingerprints) gewonnen werden, um die Rate an „falscher Monozygotie" auf < 10~4 zu senken.
Ein weiterer Vorteil dieser Methode der Zygotie-Bestimmung liegt darin, daß nur sehr wenig Probe für die Analyse erforderlich ist. Die Hälfte eines Milliliters von peripherem oder Nabelschnurblut ergab immer ausreichend DNA. Durch Schaffung dieser unkomplizierten Mittel zur Bestimmung von Zygotie bei neugeborenen sowie älteren Zwillingen und Drillingen müßten genauere epidemiologische Studien über die Determinanten und die Einflüsse für verschiedene Arten von Mehrfachschwangerschaft möglich sein.
In den folgenden Beispielen werden Molekülmasse-Markierer in den Autoradiogrammen nicht angegeben, aber der wirksame allgemeine Bereich betrug 1,5 bis 2OkB wie bei anderen Ergebnissen.
Anwendung von DNA-Erkennungszeichenermittlung (fingerprinting) in der Gerichtswissenschaft Durch .die individuelle Spezifität der durch die Minisatellitensonden 33,6 und 33,15 entdeckten DNA-Erkennungszeichen (fingerprints) sind diese ideal für die Personenidentifizierung in der Gerichtswissenschaft geeignet. Die einzige Unsicherheit besteht darin, ob DNA in einer ausreichend gut erhaltenen Form, beispielsweise in getrocknetem Blut oder Samenspuren, überlebt, um die DNA-Erkennungszeichen-Analyse durchführen zu können. Um die Möglichkeit, gerichtliche Proben analysieren zu können, zu bestimmen, wurde eine Versuchsstudie mit von Dr. Peter Gill vom Home Office Central Research Establishment, Aldermaston, gelieferten DNA-Proben durchgeführt.
Beispiel 20
Getrocknetes Blut und Samenspuren von Kleidung wurden vor der von Dr. Gill ausgeführten DNA-Extraktion (Lysis mit SDS in Gegenwart von 1 M DTT, gefolgt von Phenolextraktion und Ethanolpräzipitation) verschieden lange bei Raumtemperatur gehalten. DNA wurde ebenfalls aus frischen Haarwurzeln und von vor und nach Geschlechtsverkehr gemachten Vagina-Abstrichen extrahiert. Die DNA-Proben wurden mit Hinfl digeriert, durch ein 0,8%iges Agarosegel elektrophoresiert und auf ein Nitrozellulosefilter getüpfelt. Das Filter wurde mit 32P-markierter einsträngiger Sonde 33,15 unter Anwendung der oben beschriebenen Standard-Technik hybridisiert.
Bei den elektrophoresierten Proben handelte es sich um:
1. 40μ\ Samenspuren an Kleidung, 4 Wochen alt
2. 40μΙ frischer Samen
3. 60μ.Ι frisches Blut
'4. 60μΙ Blutspuren an Kleidung, 4 Wochen alt
5. 60μΙ Blutspuren an Kleidung, 2 Jahre alt
6. 15 Haarwurzeln
N. B. 1 bis 6 waren von dem gleichen Mann entnommen worden.
7. 60μΙ Blutspuren an Kleidung, männlicher, frisch.
8. Vaginaabstrich von 11, eine Stunde nach Geschlechtsverkehr mit 7 angefertigt
9. Wie bei 8, aber 7 h nach Geschlechtsverkehr
10. Vaginaabstrich von 11
11. 60μ,Ι Blutspuren an Kleidung, weiblicher, frisch.
Die gewonnenen DNA-Erkennungszeichen sind in Fig. 15 dargestellt. Für jede zur Analyse vorgesehene Probe wurde ausreichend DNA (~0,5 bis 3/u.g) extrahiert. DNA in bis zu 2 Jahre alten getrockneten Blutspuren und in bis zu 1 Monat altem getrocknetem Samen war nicht erheblich verschlechtert und ergab identische DNA-Erkennungszeichen (fingerprints)(wie sie ausfrischem Blut und Samen der gleichen Person erzielt wurden. Ein DNA-Erkennungszeichen (fingerprint) könnte ebenfalls von nur 15 Haarwurzeln gewonnen werden.
Die nach dem Geschlechtsverkehr angefertigten Vaginaabstriche ergaben auch ein nicht verschlechtertes DNA-Erkennungszeichen (fingerprint). Die Abstrichmuster entsprachen aber hauptsächlich dem des Blutes der Frau und nicht des Mannes, was besagt, daß der größte Teil der von den Abstrichen gesammelten DNA von während des Abstriches abgestreiften Vaginaepithelzellen und nicht von Sperma stammte. Trotzdem konnten drei nicht-weibliche Bänder in den nach-koitalen Proben entdeckt werden; diese entsprachen den Hauptbändern im Blut des Mannes und mußten vom Sperma stammen; solche Bänder konnten in einer 7 Stunden nach dem Geschlechtsverkehr entnommenen Probe entdeckt werden.
Diskussion
Diese vorläufigen Ergebnisse zeigen, daß DNA in den verschiedensten gerichtsmedizinischen Proben gut erhalten bleibt und daß die DNA-Erkennungszeichenermittlung (DNA-fingerprinting) für Identifizierungszwecke bei wenigstens einigen gerichtsmedizinischen Proben anwendbar ist. Zum Beispiel ist jetzt eine positive Identifizierung eines Frauenschänders anhand von Samenspuren von der Kleidung eines Opfers möglich. Die Situation ist bei Vaginaabstrichen von Vergewaltigungsopfern wegen der Verunreinigung von Vagina-DNA weniger sicher; jedoch müßte durch die Entfernung dieser weiblichen DNA durch SDS-Lysis vor der für die Isolierung von Sperma-DNA erforderlichen 2-DTT- oder Mercaptoethanol-vermittelten Reduktion von Sperma ein deutlicheres Sperma-DNA-Erkennungszeichen erzeugt werden. Die Identifizierung von Frauenschändern müßte dann durch die DNA-Erkennungszeichen-Analyse von Samenspuren und/oder Vagina-Abstrichen möglich sein. In einer neueren Studie in Zusammenarbeit mit Dr. Gill ist kürzlich bestätigt worden, daß klare „fingerprints" von Sperma-DNA von Vagina-Abstrichen nach Geschlechtsverkehr unter Anwendung einer vorbereitenden Trennungstechnik, wie sie allgemein oben beschrieben wird, gewonnen werden können.
Fig. 15 A zeigt DNA-Erkennungszeichen (Lane 3) von zwei 61/2h nach Geschlechtsverkehr gemachten Vagina-Abstrichen. In Lane 1 wird ein Erkennungszeichen (fingerprint) von einer Blutprobe vom männlichen Partner gezeigt, und in Lane 2 wird ein DNA-Erkennungszeichen vom Blut des weiblichen Partners gezeigt. Weibliche Zellkerne aus den Abstrichen wurden vorzugsweise durch vorbereitende Inkubation in einem SDS/Proteinase-K-Gemisch lysiert. Spermakerne sprechen auf diese Behandlung nicht an und können daher von der weiblichen Komponente durch Zentrifugieren getrennt werden. Spermakerne wurden anschließend durch Behandlung mit einem SDS/Proteinase-K/DTT-Gemisch lysiert.
Es ist offensichtlich, daß dieserTrennungsvorgang ein voller Erfolg war. Der Sperma-DNA-Erkennungszeichen (fingerprints) von durch Samen verunreinigten Vagina-Abstrichen entsprachen genau den von dem Blut des männlichen Partners gewonnenen Erkennungszeichen (fingerprints).
DNA-Erkennungszeichen (fingerprints) von wirtschaftlich wichtigen Tieren, die unter Anwendung von Human-Minisatellitensonden gewonnen wurden
Beispiele 21 bis 25
DNA-Proben wurden aus von Hunden, Katzen, Schafen, Schweinen, Pferden und Rindern entnommenem Blut angefertigt. 8/xg-Proben wurden mit einer geeigneten Restriktions-Endonuclease(Hinfl, wenn nichts anderes angegeben wird) digeriert, und die Restriktionsdigests wurden nach der Phenolextraktion durch Ethanolpräzipitation zurückgewonnen. Die Restriktionsdigests wurden erneut in Wasser gelöst, durch ein 0,7%iges Agarosegel elektrophoresiert, denaturiert, auf ein Schleicher-Schuell-Nitrozellulosefilter übertragen und wie oben mit 32P-markierten Human-Minisatelliten-Sonden 33,6 oder 33,15 hybridisiert.
Beispiel 21 Hunde
Die von einer Hundefamilie mit Hilfe von Sonde 33,6 gewonnenen DNA-Erkennungszeichen (fingerprints) sind in Fig. 16 dargestellt.
Bei den elektrophoresierten Proben handelte es sich um: Lane LBeagle-Vater Lane 2. Windhund-Mutter
Lane 3,4, 5 „Greagle", junge Hunde dieser Eltern (jeweils weiblich, männlich, männlich) Ein ausführliches DNA-Erkennungszeichen (fingerprint), in der Komplexität denen von Human-DNA abgeleiteten ähnlich, wurde von jedem Hund gewonnen. Die DNA-Erkennungszeichen zeigten eine erhebliche Variabilität, wie man aus einem Vergleich der vom Vater und der Mutter gewonnenen Muster (Lanes 1,2) ersehen· kann. Alle drei Nachkommen haben andere DNA-Erkennungszeichen (fingerprints), die in jedem Fall aus Bändern bestehen, von denen alle bis auf den Vater und/oder die Mutter zurückverfolgt werden können. Diese DNA-Erkennungszeichen sind daher für den Vaterschaftsnachweis und die Stammbaumanalyse bei Hunden wie bei Menschen von Nutzen.
Die DNAn in den Proben 1 bis 3 waren leicht abgebaut, wodurch vorzugsweise die Intensitäten der größten (am langsamsten wandernden) Bänder verringert wurden. Trotz dieses Abbaues konnte die Übertragung von Bändern von den Eltern auf die Nachkommen ohne weiteres bestimmt werden.
Beispiel 22 Katzen
Fig. 17 zeigt DNA-Erkennungszeichen (fingerprints) von einer kurzhaarigen Hauskatzenfamilie unter Verwendung von Sonde 33,6 (links) und Sonde 33,15 (rechts)
Lane I. Mutter
Lane 2. Vater
Lane 3. Kätzchen
Beide Sonden 33,6 und 33,15 erzeugen informative DNA-Erkennungszeichen. Die meisten Bänder bei den Kätzchen können als vom Vater oder der Mutter stammend bewertet werden, und daher eignen sich diese DNA-Erkennungszeichen für die Stammbaumprüfung sowie für die individuelle Identifizierung bei Katzen.
Beispiel 23 Schafe
Von verschiedenen Schafen unter Anwendung der Sonden 33,6 (links) und 33,15 (rechts) gewonnene DNA-Erkennungszeichen werden in Fig.18 gezeigt. Als Proben dienten: Lane 1. Weiblicher Mischling Lane 2. Weiblicher Mischling Lane 3. Weibliches Dorset Lane 4. Weibliches Hampshire χ Dorset Lane 5. Männliches Dorset
Individuum-spezifische DNA-Erkennungszeichen wurden mit beiden Sonden von jedem Schaf gewonnen. Die DNA-Erkennungszeichen sind schwächer und weniger komplex als Human-DNA-Erkennungszeichen, aber trotzdem für die Identifizierung und für genetische Zwecke von Nutzen. Sonde 33,6 entdeckt ein oder zwei intensive polymorphe Bänder in jedem Schaf, zusätzlich zu dem Bereich schwächerer Bänder. Diese Bänder stammen vermutlich von einer einzigen Minisatellitenstelle, die zufällig einen sehr hohen Grad von Homologie mit Sonde 33,6 zeigt.
Beispiel 24 Schweine und Pferde
Fig. 19 zeigt DNA-Erkennungszeichen von drei verschiedenen Schweinen (Lanes 1 bis 3) und drei verschiedenen Pferden (Lanes 4 bis 6) (Geschlecht und Züchtung nicht spezifiziert). Beide Sonden 33,6 und 33,15 erzeugen individuumspezifische DNA-Erkennungszeichen bei jeder Spezies. Die DNA-Erkennungszeichen sind, besonders bei Sonde 33,15, schwach und enthalten im Vergleich zu den entsprechenden Human-DNA-Erkennungszeichen sehr wenige Bänder, abertrotzdem wird die kombinierte Verwendung beider Sonden für die Individuum-Identifizierung von Nutzen sein.
Beispiel 25 Rinder
Fig. 20 zeigt DNA-Erkennungszeichen von Hinfl-DNA-Digests, die mit Hilfe von Sonde 33,6 von einer Kuh-Familie und von weiteren Rindern gewonnen wurden. Als Proben dienten: (Lane 1. Mensch) Lane 2. Muttertier Lane 3. Vatertier Lane 4. Kalb von 1 und 2 Lane 5. Angus-Bulle Lane 6. Friesischer Bulle
Wie bei Schafen, Schweinen und Pferden wurde auch hier ein ziemlich einfaches, aber trotzdem tierspezifisches DNA-Erkennungszeichen für jedes Tier gefunden. Bei dem Kalb konnten alle Bänder bis zurück zu dem Muttertier und/oder dem Vatertier verfolgt werden, eine Bestätigung für den Stammbaum des Tieres
Fig. 21 zeigt Ergebnisse mit Sonde 33,15 bei dergleichen Kuh-DNA. Individuelle Lanes sind gekennzeichnet:
1. Muttertier
2. Vatertier
3. Kalb von 1 und 2 4.'Angus-Bulle
5. Friesischer Bulle (6. Mensch)
Mit Sonde 33,15 wurde ein intensives und nichtauflösbar-komplexes Muster hybridisierender DNA-Bänder in mit Hinfl digerierter Kuh-DNA erzeugt. In einem BgIII Digest ist dieses intensive Signal hauptsächlich auf sehr große DNA-Fragmente beschränkt, woraus vermutet werden kann, daß dieses Signal von einer gebüschelten Sequenz oder Region stammt, am wahrscheinlichsten einer herkömmlichen Satelliten-DNA. Eine kurze autoradiographische Aufnahme des Hinfl Digests zeigt eine „Leiter" von Bändern zur Unterseite des Gels hin, mit einer Periodizität zwischen „Sprossen" von 45 bis 50 Basenpaaren (Daten nicht angegeben). Somit stammt das intensive Signal höchst wahrscheinlich von einem Satelliten mit einer 45 bis 50 Basenpaare langen Wiederholeinheit. Das intensive Signal ist weitgehend in mit Pvull, Ddel oder AIuI digerierter Kuh-DNA vernichtet, so daß die Satelliten-DNA-Wiederholeinheit vermutlich eine oder mehrere Stellen für jede dieser Restriktions-Endonucleasen, aber nicht
für Hinfl oder BgIII enthält. Dieses sind genau die Eigenschaften des 1,720 Kuhsatelliten (E. Posch! und R.E.Streek, „Prototype sequence of bovine 1,720 satellite DNA" [Prototyp-Sequenz von Schweine—1,720 Satelliten-DNA], J.Mol. Biol., 143,147-153; 1980), der aus 100000 Tandemwiederholungen einer 46-Basenpaar-Wiederholeinheit besteht. Vergleiche der Sequenz von der 1,720 Wiederholeinheit mit der Kernsonde-33,6-Wiederholeinheit und der 33,15-Wiederholeinheit werden im folgenden gegeben:
Kern
core GGAGGTGGGCAGGAiIG Hhal Ddel
Λ Γ7ΟΑ ΠΊ1Π1 "I ΓΙ 1 ΓΤΠ Λ ΓΠΛ< Λ PPP Λ P ' Φ Λ ', Λ,ΊΛΛΛΠ ι Π P tnp rnp ρ η η pn ρ p-FfiP ί
I j ( <c!U Q 'J. CrLrO Lf ACjl-tiXO-n. LrUu ίΐίί ji.1 Jj-iiLrl/ ir'-rU O .du Lr X j X U UrV jOjwi L/x
33,15 AGAGGTGGGCAGGTGG
33,6, AGGGOTGGAGG
Wie man sehen kann, enthält die 1,720-Satelliten-Wiederholeinheit eine nahezu vollständige Kopie der 3'-Region der Kernsequenz (Übereinstimmungen sind oben durch * gekennzeichnet). Diese Region in der 1,720-Wiederholung gibt eine ausgezeichnete Übereinstimmung mit der Wiederholeinheit von 33,15, aber eine weniger gute Übereinstimmung mit 33,6. Daraus erklärt sich, warum 1,720-Satelliten-DNA durch Sonde 33,15 aber nicht durch Sonde 33,6 entdeckt wird (Fig. 20). (Die 1,720-Satelliten-Wiederholeinheit [wie die des Myoglobin Λ33 Minisatelliten] enthält zu viele Nucleotide an jeder Seite des Kernes [H + J in Formel [1] >15] als daß sie als Multistellen-Sonde gemäß der Erfindung wirken könnte.) Zur Entdeckung von Kuh-Minisatelliten, die zu Sonde 33,15 hybridisieren, wurde Kuh-DNA mit AIuI oder Ddel digeriert, um den 1,720-Satelliten auf 46-Basenpaar-Monomere zu reduzieren, die sich von der Unterseite dieses Gels abelektrophoresieren. Fig. 21 zeigt, daß klare DNA-Erkennungszeichen tatsächlich für jedes dieser Restriktionsenzyme von Kalb-DNA gewonnen wurden (Nr.3). Jedoch stammten nahezu alle diese Bänder von Variantblöcken von 1,720-Satelliten-DNA, eingebettet in normaler 1,720-DNA, die die AIuI und Ddel Stellen in jeder Wiederholung verloren haben (vielleicht durch Mutation einer oder einer anderen der oben gezeigten unterstrichenen Basen, die die überlappenden ASuI und Ddel Stellen vernichten würden). Das könnte der Grund für die folgende Fakten sein:
a. Tatsächlich identische Kalb-DNA-Erkennungszeichen wurden bei Verwendung von AIuI und Ddel gewonnen.
b. Die größten Fragmente hybridisieren beständig intensiver als die kleineren (weil sie entsprechend mehr 1,720-Satelliten-Wiederholeinheiten enthalten; das größte Kalb-DNA-Fragment enthält ~440 dieser Einheiten). Bei Menschen nimmt die Bandintensität nicht fortlaufend mit der Größe zu (Fig. 21).
c. Fast alle diese Kalb-DNA-Erkennungszeichenfragmente werden durch Hhal eliminiert, die einmal innerhalb der 1,720-Wiederholeinheit spaltet (siehe oben, Daten nicht angegeben).
d. Das Vatertier (Nr. 2) hat fast keine hybridisierenden Fragmentein einem Alul-Digest. Das könnte bedeuten, daß die diese Variantwiederholblöcke enthaltende Region von 1,720-Satelliten-DNA bei diesem Tier ausgetilgt wurde.
e. Die Muttertier-(Nr. 1) und Kalb-(Nr.3) DNA-Erkennungszeichen sind nahezu identisch. Das Muttertier ist wahrscheinlich wegen einer Tilgung heterozygot, die der beim Vatertier gemachten Feststellung äquivalent ist, und hat zufällig das nichtgetilgte Chromosom (und daher alle Bänder) auf das Kalb übertragen. Daher sind alle diese Bänder gekoppelt und werden nicht unabhängig auf Nachkommen übertragen, wie es bei Menschen der Fall ist.
Trotzdem zeigen alle fünf getesteten Rinder unterschiedliche „Satelliten"-DNA-Erkennungszeichenmuster, und daher können diese ungewöhnlichen Typen von Erkennungszeichen bei der Individuen-Identifizierung von Nutzen sein, allerdings nicht für die Bereitstellung von Multi-Stellen-Markierer-Informationen.
Bestimmte Sonden können zufriedenstellend arbeiten, wenn η nicht unbedingt gleich 3 in Formel (1) ist. In jeder solchen Sonde kann wenigstens ein Paar von Wiederholungen von (J. Kern. K) durch eine keinen Kern enthaltenden DNA-Sequenz von mindestens zwei weiteren Wiederholungen getrennt sein. Daher kann eine ausreichend lange Sonde konstruiert werden, in der (J. Kern. K)-Sequenzen paarweise, durch „Nicht-Kern"-DNA-Sequenzen getrennt, angeordnet sind.

Claims (32)

  1. (1) dem gewöhnlichen Kernbereich eines ersten menschlichen odertierischen Minisatelliten, den man durch Sondieren von menschlicher odertierischer genomischer DNA mit einer Sonde erhält, die eine Myoglobin-Tandemwiederholungssequenz von annähernd 33nt pro Wiederholungseinheit enthält.
    1. Verfahren zur Identifizierung einer Testprobe genomischer DNA durch Bezugnahme auf einen oder mehrere Standard(s), wozu gehört Sondieren der Testprobe mit einer Polynucleotidsonde, die (unter Einfluß, falls erforderlich, einer markierten oder Kennkomponente) ein Polynucleotid enthält, das wenigstens drei Tandemwiederholungen (keine notwendigerweise genauen Wiederholungen) von Sequenzen aufweist, die homolog mit einem Minisatellitenbereich eines Gens bis zu einem Grade sind, der die Hybridisierung der Sonde damit gestattet.
    Feststellen der hybridisierten Fragmente der DNA und Vergleich der hybridisierten Fragmente mit einem Standard oder Standards, dadurch gekennzeichnet, daß
    a) die Proben-DNA mittels einem oder mehreren Restriktionsenzym(en) fragmentiert wird, die in keinem erheblichen Grade eine der Tandemwiederholungen entsprechende Sequenz spalten;
    b) die Wiederholungen jeweils einen Kern enthalten, der zu wenigstens 70% mit einem Übereinstimmungskernbereich ähnlicher Länge homolog ist, der in einer Vielzahl von Minisatelliten unterschiedlicher genomischer Orte vorhanden ist;
    c) der Kern 6 bis 16 Nucleotide lang ist;
    d) die Gesamtzahl der dem Kern nicht angehörenden Nucleotide innerhalb der Wiederholungseinheit nicht mehr als 15 beträgt;
    e) die hybridisierten Fragmente die Proben-DNA durch Bezug auf mehr als einen polymorphen Minisatellitenbereich oder hypervariablen Ort differenzieren.
    -1- 245 678
    Patentansprüche:
  2. (2) dem gewöhnlichen Kernbereich eines zweiten menschlichen oder tierischen Minisatelliten, den man durch Sondieren von menschlicher odertierischer DNA mit einer Sonde erhält, die eine (1) umfassende Tandemwiederholungssequenz
    ' enthält,
    2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Genom sich auf das menschliche oder tierische Genom bezieht und die Proben von menschlicher oder tierischer genomischer DNA herrühren.
  3. (3) dem gewöhnlichen Kernbereich eines dritten menschlichen oder tierischen Minisatelliten, den man durch Sondieren von menschlicher odertierischer genomischer DNA mit einer Sonde erhält, die eine (2) umfassende Tandemwiederholungssequenz enthält,
    wobei jede Tandemwiederholungssequenz eine Wiederholung von zumindest 3 Einheiten ist, oder ein Polynucleotid komplementärer Sequenz zu dem obigen.
    3. Verfahren nach Anspruch 1 oder 2 zum Beweis der Identität oder andererseits des Testprobenspenders bei einem oder mehreren Standardprobenspendern, dadurch gekennzeichnet, daß die Standardprobe(n) ähnlich fragmentiert sind und ein Vergleich von den entsprechenden Proben zu den hybridisierten Fragmenten gezogen wird.
  4. 4. Verfahren nach Anspruch 1 oder 2 zum Beweis eines Familienzusammenhanges zwischen dem Testprobenspender und einem oder mehreren Standardprobenspendern, dadurch gekennzeichnet, daß die Standardproben ähnlich fragmentiert sind und ein Vergleich von den entsprechenden Proben zu den hybridisierten Fragmenten gezogen wird.
  5. (5') GPGGGCWGGWXG (3') (6)
    ausgewählt wurde, worin P nicht G darstellt, W gleich A oder T oder U und X gleich A oder G ist, oder einer Variante davon, vorausgesetzt, daß die gesamten tatsächlichen Kemsequenzen in allen Wiederholungen wenigstens 70% Homologie im Durchschnitt zu den gesamten „wahren" Kemsequenzen zeigen, die in Formel (6) definiert wurden,
    sowie Polynucleotide komplementärer Sequenz zu dem obigen.
    5. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß ein krankes, abnormes oder mit einem charakteristischen Merkmal behaftetes Fragment, das durch den Vergleich individueller Fragmente beobachtet wurde, die von einer oder mehreren der genannten Sonden in einer Familien- oder Stammbaumanalyse produziert wurden, isoliert wird, um eine zweite Sonde zu erhalten, die ortspezifisch für einen Minisatellitenbereich des mit der ererbten Krankheit, Abnormität oder dem charakteristischen Mer.kmal behafteten menschlichen oder tierischen Genoms ist.
  6. 6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß die zweite Sonde von einem der Fragmente erhalten wird, von dem beobachtet wurde, daß es mit einer mit Krebs einhergehenden Chromosomen- oder DNA-Abnormität behaftet ist.
  7. 7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß der Vergleich mit Mustern positiver Fragmente erfolgt, die unter Verwendung von wenigstens zwei unterschiedlichen der genannten Sonden erhalten wurden.
  8. 8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß wenigstens die Wiederholungseinheiten der Sonde einzelsträngig sind.
  9. 9. Verfahren nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, daß die Sonde vollständig einzelsträngig ist.
  10. 10. Verfahren nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, daß das Polynucleotid die allgemeine Formel, im 5' —>3'-Sinne gelesen,
    *
    H-(J-Kern-K)n-L ' (1)
    aufweist, worin „Kern" eine Sequenz darstellt, die wenigstens sechs aufeinanderfolgende Nucleotide besitzt, die unter den folgenden, im gleichen Sinne gelesenen Sequenzen ausgewählt wurde:
    GGAGGTGGGCAGGAXG (2)
    AGAGGTGGGCAGGTGG (3)
    GGAGGYGGGCAGGAGG (4)
    T(C)mGGAGGÄXGG(G)pC · ' (5A)
    T(C)mGGAGGA(A)qGGGC (5B)
    worin
    * (a) X gleich A oder G ist, Y ist C oder T, T = Toder U, m ist 0,1 oder 2, ρ ist 0 oder 1, q ist 0 oder 1, η ist wenigstens 3;
    (b) J und K stellen gemeinsam 0 bis 15 zusätzliche Nucleotide innerhalb der Wiederholungseinheit dar;
    (c) H und L stellen jeweils 0 oder wenigstens 1 zusätzliches Nucleotid dar, das die Wiederholungseinheiten flankiert;
    (d) Die Wiederholungseinheit (J · Kern · Kerfordertwederhinsichtlich der Zahl noch hinsichtlich der Art der Nucleotide eine exakte Wiederholung, vorausgesetzt, daß das Polynucleotid eine erkennbare Wiederholungsübereinstimmung aufweist;
    (e) „Kern" kann auch eine variierte Kernsequenz darstellen, vorausgesetzt, daß die tatsächlichen Kernsequenzen in allen Wiederholungseinheiten eine durchschnittlich wenigstens 70%ige Homologie besitzen mit „wahren" Kernsequenzen, wie sie oben hinsichtlich der Formeln 2 bis 5 definiert wurden;
    oder ein Polynucleotid mit komplementärer Sequenz zu dem obigen.
  11. 11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, daß die Gesamtanzahl der in jeder (J · Kern · K)-Wiederholungssequenz vorhandenen Nucleotide 25 nicht überschreitet.
  12. 12. Verfahren nach Anspruch 10, dadurch gekennzeichnet, daß der Kern ein Maximum von 16 Nucleotiden aufweist.
  13. 13. Verfahren nach Anspruch 10, dadurch gekennzeichnet, daß der Kern eine Sequenz von wenigstens 7 der genannten aufeinanderfolgenden Nucleotide darstellt.
  14. 14. Verfahren nach Anspruch 10, dadurch gekennzeichnet, daß der Kern eine Sequenz von wenigstens 12 der genannten aufeinanderfolgenden Nucleotide aufweist.
  15. 15. Verfahren nach Anspruch 10, dadurch gekennzeichnet, daß der Kern eine Sequenz von 14 bis 16 der gesamten aufeinanderfolgenden Nucleotide aufweist, ausgewählt aus der in den Formeln (2), (3) oder (4) dargestellten Sequenz.
  16. 16. Verfahren nach einem der Ansprüche 10 bis 15, dadurch gekennzeichnet, daß die tatsächlichen Kernsequenzen wenigstens 80% Homologie mit den wahren Kemsequenzen aufweisen.
  17. 17. Verfahren nach Anspruch 16, dadurch gekennzeichnet, daß J null oder eins und K null oder eins ist.
  18. 18. Verfahren nach einem der Ansprüche 10 bis 17, dadurch gekennzeichnet, daß die Gesamtanzahl der in jeder (J · Kern · K)-Wiederholungseinheit vorhandenen Nucleotide 20 nicht überschreitet.
  19. 19. Verfahren nach einem der Ansprüche 1 bis 18, dadurch gekennzeichnet, daß das Polynucleotid die allgemeine Formel, gelesen im 5' -> 3'-Sinne,
    H-(J-Kern-K)n-L (1)
    aufweist, worin „Kern" eine Sequenz von 6 bis 16 aufeinanderfolgenden Nucleotiden darstellt, gelesen im gleichen Sinne, ausgewählt unter
  20. 20. Verfahren nach einem der Ansprüche 1 bis 19, dadurch gekennzeichnet, daß das Polynucleotid die allgemeine Formel, gelesen im 5'—» 3'-Sinne,
    H-(J-Kern-K)n-L ^ (1)
    aufweist, worin
    „Kern" eine der Sequenzen mit wenigstens 6 aufeinanderfolgenden Nucleotiden darstellt aus innerhalb eines gewöhnlichen Kernbereiches einer Vielzahl von Mihisatelliten menschlicher oder tierischer genomischer DNA, die wenigstens 75% Aufeinanderfolge zeigt;
    „Kern" nicht notwendigerweise die gleiche Sequenz in jeder Wiederholungseinheit hat und alle anderen Symbole die in Anspruch 10 gegebenen Definitionen aufweisen,
    und Polynucleotide komplementäre Sequenz zu dem obigen.
  21. 21. Verfahren nach einem der Ansprüche 1 bis 20, dadurch gekennzeichnet, daß das Polynucleotid wenigstens drei Wiederholungen einer Sequenz von 6 bis 31 nt aufweist, einschließlich einer aufeinanderfolgenden (5' —» 3')-Kernsequenz, die innerhalb
  22. 22. Verfahren nach Anspruch 21, dadurch gekennzeichnet, daß jede Wiederholung oder variierte Wiederholung die Sequenz, der Formel (6) enthält.
  23. 23. Verfahren nach einem der Ansprüche 1 bis 22, dadurch gekennzeichnet, daß die aufeinanderfolgende (5' —» 3')-Sequenz
    PGGGCWG (7)
    in allen Wiederholungseinheiten des Polynucleotide erhalten bleibt, wobei P und W die in Anspruch 21 genannte Bedeutung haben.
  24. 24. Verfahren nach einem der Ansprüche 21 bis 23, dadurch gekennzeichnet, daß P gleich T oder U ist.
  25. . 25. Verfahren nach einem der Ansprüche 21 bis 24, dadurch gekennzeichnet, daß W gleich A ist.
  26. 26. Verfahren nach einem der Ansprüche 21 bis 25, dadurch gekennzeichnet, daß die genannte aufeinanderfolgende Kernsequenz oder erhalten bleibende Sequenz mit der Wiederholungssequenz identisch ist.
  27. 27. Verfahren nach einem der Ansprüche 1 bis 26, dadurch gekennzeichnet, daß das Polynucleotid wenigstens drei Wiederholungen einer Sequenz aufweist, die 31 nt nicht überschreitet, einschließlich der aufeinanderfolgenden 5' —» 3'-Kernsequenz
    GGPGGGCWGGWXG (T)
    worin P nicht C darstelle, W gleich A oder T oder U und X gleich A oder G ist, oder eine Variante davon, vorausgesetzt, daß die gesamten tatsächlichen Kernsequenzen in allen Wiederholungen wenigstens 70% Homologie im Durchschnitt mit „wahren" Kernsequenzen zeigen, die in Formel (7) definiert wurden, sowie Polynucleotide komplementärer Sequenz zu dem obigen.
  28. 28. Verfahren nach Anspruch 27, dadurch gekennzeichnet, daß W am 5'-Ende A und am 3'-Ende T oder U darstellt.
  29. 29. Verfahren nach einem der Ansprüche 1 bis 28, dadurch gekennzeichnet, daß eine der aufeinanderfolgenden (5' '-^ 3')-Sequenzen TGGCCA und AGGGCT in allen Wiederholungseinheiten der Sonde erhalten bleibt.
  30. 30. Verfahren nach einem der Ansprüche 1 bis 29, dadurch gekennzeichnet, daß das Polynucleotid nach einem Verfahren hergestellt wurde, bestehend aus
    (a) Identifizieren einer natürlichen Tandemwiederholungssequenz in DNA, die zu beschränkter Habridisierung an andere polymorphe DNA-Bereiche in der Lage ist.
    (b) Identifizieren einer natürlichen aufeinanderfolgenden Kernsequenz der Wiederholungssequenz, die mutmaßlich für eine derartige Bindung verantwortlich ist, und
    (c) Isolieren oder künstlicher Aufbau einer vollkommenen oder unvollkommenen Tandemwiederholungssequenz, abgeleitet aus der natürlichen Übereinstimmungskernsequenz mit Minisatellit-Bindungseigenschaften, die geringere Genom-Ortsspezifität und höhere polymorphe Fragmentannahme zeigt als die natürliche Wiederholungssequenz.
  31. 31. Verfahren nach einem der Ansprüche 1 bis 30, dadurch gekennzeichnet, daß die Sonde eine Modifikation der Sonde gemäß Anspruch 10 oder Anspruch 21 ist, in der wenigstens ein Paar derTandemwiederholungen (J · Kern · K) aus wenigstens zwei weiteren Wiederholungen mittels einer Sequenz abgetrennt wurde, die keinen Kern enthält, wobei η nicht notwendigerweise gleich drei ist, wobei alle anderen Zwänge vorhanden sind.
  32. 32. Verfahren nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, daß die Probe hauptsächlich aus zumindest drei Wiederholungen einer Sequenz besteht, die aus den folgenden (einschließlich komplementärer Sequenzen) ausgewählt sind.

Family

ID=

Similar Documents

Publication Publication Date Title
US5413908A (en) Method of characterizing genomic DNA by reference to a genetic variable
DE69230873T3 (de) Selektive Restriktionsfragmentenamplifikation: generelles Verfahren für DNS-Fingerprinting
DE69833856T2 (de) Verfahren zur bestimmung von nukleinsäuresequenzen in urin
DE3834636C2 (de)
Jones et al. Microsatellite analysis of maternity and the mating system in the Gulf pipefish Syngnathus scovelli, a species with male pregnancy and sex‐role reversal
DE69733958T2 (de) Verfahren zur positionierung von klonen mittels molekularen kaemmens
DE68929299T3 (de) Multiple genomische DNA-Verstärkung zum Nachweis einer Deletion
DE69434314T2 (de) Polymorphismus von mononukleotiden und ihre verwendung in der genanalyse
Kashi et al. Large restriction fragments containing poly-TG are highly polymorphic in a variety of vertebrates
DE60014067T2 (de) Zusammensetzungen und verfahren zur genetischen analyse
DE69936539T2 (de) Auswahl von tieren nach parental geprägten merkmalen
DE3407196A1 (de) Verfahren zur identifizierung einzelner mitglieder einer spezies von organismen
DE3904270A1 (de) Verfahren zur markierung bestimmter chromosomen unter verwendung repetetiver rekombinations dns
EP0342717A2 (de) Polynukleotidproben
DD245676A5 (de) Verfahren zur Identifizierung einer Testprobe genomischer DNA
EP1537246B1 (de) Verfahren zur Amplifikation genetischer Information mittels an mehrere Stellen im Genom bindende Primer
DE10017675A1 (de) Verfahren zur Identifizierung und Isolierung von Genomfragmenten mit Kopplungsungleichgewicht
DE10000001A1 (de) DNA-Matrizes und deren Verwendung zur Untersuchung von Individuen einer Population
DD263792A5 (de) Verfahren zur Kennzeichnung einer Testprobe genomer DNS
JPH0463680B2 (de)
DE10155999C2 (de) Verfahren zur Bestimmung der Beschaffenheit und Qualität des Fundaments und Exterieurs bei Huf- und Klauentieren
DE3919169A1 (de) Verfahren zur ermittlung eines genorts variabler laenge in einer dna-sequenz sowie gegebenenfalls markierte nucleotidsequenzen zur identifizierung eines derartigen genorts
Gibbs Mutation at a hypervariable mouse minisatellite
EP1659185A1 (de) Genetischer Test zur Taubheit von Hunden
Bhebhe Isolation of molecular genetic markers and a search for possible associations with parasite resistance and quantitative trait loci in Capra hircus