Mikrosatellitenmarker für genetische Analysen und zur Unterscheidung von Rosen
Der Erfindung betrifft neuartige genetische Marker für genetische Analysen und zur Unterscheidung von Rosen.
Mögliche Anwendungsgebiete sind marker-gestützte Selektion und Herkunfts- und Nariationsanalysen in Pflanzenzüchtung, Gartenbau und Landwirtschaft.
Stand der Technik
Rosa ist eine Gattung mit über 20 Arten allein in Deutschland, deren taxonomische Einteilung sich noch weitgehend in der Diskussion befindet (Haeupler H., Muer T., Bildatlas der Farn- und Blütenpflanzen Deutschlands). Die Gattung umfaßt Arten unterschiedlicher Ploidiestufen und unterschiedlichster geographischer Herkunft. Eine Nielzahl von Wildrosenarten kommt auf allen Kontinenten der Νordhalbkugel vor. Zudem sind natürliche Hybriden von im selben Habitat vorkommenden Rosenarten häufig, wodurch die Definition klar differenzierter Arten zusätzlich erschwert wird.
Andererseits ist die leichte Kreuzbarkeit von verschiedenen Rosenarten die Grundlage der großen Nielfalt von durch Züchtung entstandenen Sorten. Diese Nielfalt umfaßt Sorten mit unterschiedlicher Blütenfarbe und -form, unterschiedlicher Blühdauer (jährlich nur einmal blühend oder remontierend), Pflanzengröße und Wuchsform (Strauch-, Hecken-, Beet-, Kletter-, Bodendeckerrosen usw.), Art der Belaubung und Bestachelung, Aussehen der Früchte (Hagebutten), Winterhärte, Krankheitsresistenz und Ansprüchen an die Bodenqualität.
Für eine sichere Bestimmung von Arten und Sorten (die meist Ergebnisse komplexer Kreuzungen sind) ist in den meisten Fällen Blüte, Frucht, Bestachelung, Belaubung und Wuchsform mit einzubeziehen. Somit ist im Allgemeinen auch für den Fachmann kurzfristig lediglich eine Zuordnung zu einer Gruppe von Arten und Sorten möglich, nicht aber eine eindeutige Bestimmung.
Aufgabe-Lösungszusammenhang
Die Aufgabe der Erfindung besteht darin, neue Mikrosatellitenmarker zur genetischen Analyse von Pflanzen der Gattung Rosa bereitzustellen.
Die Aufgabe der Erfindung wird gemäß den Ansprüchen realisiert.
Wesen der Erfindung
Die erfindungsgemäßen Marker basieren auf der Amplifikation bestimmter hypervariabler Genomabschnitte, den sogenannten Mikrosatelliten, mit Hilfe der Polymerasekettenreaktion (PCR). Zur spezifischen Amplifikation werden für jeden Mikrosatelliten-Locus zwei Primer, jeweils links und rechts in den flankierenden Sequenzen benötigt. Diese Primer sind im Durchschnitt 23 +/- 5 Basen lang und durch ihre Sequenzen definiert. Ein Mikrosatellitenmarker ist im Prinzip eine sequence tagged site (STS), welche durch zwei spezifische Primer definiert ist. Diese Primer flankieren, jeweils links und rechts eine sogenannte Mikrosatellitensequenz. Eine Mikrosatellitensequenz ist definiert als tandemrepetitive Wiederholung einer Di-, Trioder Tetranukleotidsequenz, beispielsweise (GA)n, wobei n 8 ist. Es treten auch zusammengesetzte Mikrosatellitensequenzen auf, beispielsweise (GT)n(AT)n , sowie imperfekte Sequenzen, bei welchen einzelne Basen mutiert sind, beispielswise (GT)„CA(AT)n. Zwischen verschiedenen Linien und Sorten kommt es zu Variationen der Anzahl der Repeats an einem bestimmten Locus. Dies führt nach Amplifikation des Mikrosatelliten mittels der spezifischen Primer in den flankierenden Sequenzen zu PCR-Produkten verschiedener Länge und damit zu Polymorphismus. Diese Polymorphismen werden stabil vererbt und können daher als genetische Marker verwendet werden. In manchen Fällen treten auch Nullallele (kein sichtbares Fragment) auf, wenn Mutationen innerhalb der Bindungsstelle für die Primer vorhanden sind.
Über die biologische Funktion dieser der repetitiven Fraktion des Genoms zugeordneten Motive gibt es bisher keine gesicherten Erkenntnisse. Es wurde jedoch festgestellt, daß die Anzahl der Wiederholungen eines Mikrosatellitenmotivs zwischen nah verwandten Arten, Sorten und Linien variabler ist als der übrige (insbesondere codierende) Teil des
Genoms. So könnten z.B. drei Rosensorten einen Mikrosatelliten tragen, der in der Länge variiert (12, 14 und 17 Wiederholungen des Motivs GT), dessen flankierende Sequenzen aber in allen drei Sorten identisch sind. Somit kann durch PCR relativ leicht ein Längenunterschied nachgewiesen werden: ein Primerpaar bestehend aus je einem Primer links und rechts von der Mikrosatellitensequenz wird zur Amplifikation eines DNA-Fragments aus jeder der drei Linien verwendet.
Diese Fragmente unterscheiden sich dann in ihrer Länge: das Produkt der zweiten Sorte ist um 4 bp grösser als das der ersten Sorte, das Produkt der dritten Sorte um 10 bp. Dieser Längenunterschied (Längenpolymorphismus) kann z.B. durch verschiedene Techniken der hochauflösenden Elektrophorese (z.B. Kapillarelektrophorese) nachgewiesen werden. Damit sind diese drei Rosensorten eindeutig unterscheidbar, und zwar in jeder Entwicklungs- und Verarbeitungsstufe, aus der DNA gewonnen werden kann (Blatt, Blüte, Frucht, Same, Keimling, evtl. auch Rosenöl, Hagebuttenmarmelade, Tee, Trockensträuße usw.).
Die Auftrennung und Detektion der erhaltenen PCR-Produkte kann mit verschiedenen technischen Varianten durchgeführt werden. Für die Auftrennung der Fragmente können hochauflösende Agarosegele, native Polyacrylamidgele oder denaturierende Polyacrylamidgele (=Sequenziergele) verwendet werden. Die Auftrennung kann auch auf massenspektrometrischem Wege durchgeführt werden. Die Detektion der Fragmente kann je nach Trennungssystem über Ethidiumbromidfärbung, Silberfarbung oder bei radioaktiver Markierung der PCR-Fragmente über Autoradiographie erfolgen. Eine weitere sehr effektive Variante der Auftrennung und Detektion besteht im Einsatz eines automatischen Sequenziergerätes mit farbstoff- bzw. fluoreszenzmarkierten Primem. Hierzu ist erforderlich, einen Primer aus jedem MikrosateUiten-Primerpaar farbstoff- bzw. fluoreszenzmarkiert zu synthetisieren. Aus der PCR-Amplifikation resultiert ein markiertes Produkt, welches von dem Sequenziergerät detektiert werden kann. Dabei werden für jede Probe farbstoff- bzw. fluoreszenzmarkierte Größenstandards in derselben Spur mit aufgetrennt. Eine spezielle Software erlaubt es danach, die absolute Größe jedes aufgetrennten Fragmentes zu berechnen und somit auch Fragmente zwischen verschiedenen Gelläufen zu vergleichen. Mit dieser Methode können pro Tag mehrere hundert Proben weitgehend automatisch analysiert werden.
Untersucht man eine größere Zahl von Sorten, so geht diese Eindeutigkeit verloren: Bei 100 Sorten werden mehrere Sorten dieselbe PCR-Produktgröße zeigen und durch einen einzigen Mikrosatellitenmarker nicht voneinander unterscheidbar sein. Deshalb müssen mehrere Mikrosatellitenmarker, die unabhängig voneinander in ihrer Länge variieren, parallel untersucht werden. Daraus ergibt sich für jede untersuchte Rosensorte eine eindeutige Kombination von Mikrosatelliten-Fragmentlängen, die als der „Fingerprint" dieser Sorte bezeichnet werden kann.
Für Rose wird eine Anzahl von 25 Mikrosatellitenmarkern ausreichen, um über 90% der im Handel befindlichen Sorten voneinander zu unterscheiden. Bei Weizen liegt die Zahl z.B. bei 21 Markern für eine Unterscheidung von 95% aller Sorten. Mit diesem Ansatz nicht unterscheidbar bleiben sogenannte „Sports", also neue Rosensorten, die durch Spontanmutation aus einer bereits existierenden Sorte hervorgegangen sind und sich in nur einer Eigenschaft (z.B. Blütenfarbe oder Wuchsform) von dieser unterscheiden. Die beiden Genome sind in diesem Fall, abgesehen von der Mutation, identisch und mit dem beschriebenen Markerset wahrscheinlich nicht zu differenzieren.
Erfindungsgemäß werden Mikrosatellitenmarker bereitgestellt, die folgende Primerpaare mit zugeordneten Mikrosatellitensequenzen bzw. eine Anzahl davon enthalten und die Loci verschiedener Chromosomen des Genoms von Pflanzen der Gattung Rosa amplifizieren und daher zur Genmarkierung Verwendung finden.
Name Motiv Produkt Tm Primer F* 5'->3' Tm Primer R 5'->3' -große (bp) in "Lichtblick"
RMS001 GT&GC 242 57.1 TTCAAAATTGCTGCCCCCTTAG 44.8 TACCAGTTGAGTGAGAAATAGTT
RMS002 GA 138 36.5 AATAATTTTTCTTTTGGTA 36.6 GATTTGTTTTCACTATTCA
RMS003 GA 151 52.9 TGGGAAAGGGAAAGCAACA 53.0 AAGGTAGGCAGAAGTGACAGACAT
RMS004 GT&AT 143 55.0 CAGGCCAAGGAAGAGGTAAGTAAA 55.7 CGTATGCGCGTGTAGGAAGG
RMS005 GA 143 53.1 CTACCGGTGACCAGTGACGA 51.9 ATTTTGCCCTCTCCCTTTGT m TJ CΛ RMS006 GT&GA 114 53.0 ACCGGTCTCATCTTTCCATTG 52.2 GTAGGTCGGTCCGTCTGTCA
> H N RMS007 GA 171 48.4 TCTTTCCGACTCCGACAA 54.8 TATGCCATTCAGACTCTCCAACAC CD
RMS008 GA 176 53.4 TCTCTGCGACAAAAACAAACACT 61.9 CCATGAAGCGGCGGAGAGGA
RMS009 CT> 145 47.3 ATTGGCAAAAGATTCTCCTAC 46.5 ACTTGGTAATTTCGAGCATAA m o RMS010 GA 105 61.2 GGTTGGGGGAAATTGAAGCAGAGA 58.9 TCTTTTCTTCTACAAACCCCAACCAA m r RMS011 GT 190 47.9 TAGAAACGACCAATAAAAGAGG 48.0 TAACGAAACATCATCAATAGCA σ.
RMS012 GT 141 48.8 ATAGAAAAATAGAGGGGGTGTG 46.4 GATCGAAAAGTGGTCAAAATA
RMS013 GA 208 57.8 GCCTTAGCCGGGGTTTTCAA 45.6 GATCAATACCGAACTAACAAAG
RMS014 GA 124 56.1 TATTCTTTCTTCCCACCGACGAC 56.2 CCTCACTGCCAACCCAACTGT
RMS015 GA 185 46.5 TAATGTAGGCAGATATAAAGGAGT 52.1 GCAGCTGCACAACAAGGAA
RMS016 GA 121 55.1 GGCCTGGACCTTTCTCATTTG 56.9 AACCGCTGCTGCTTTCATTTTT
RMS017 AT> 246 46.2 AGGTCCCGTTATTTCAGG 46.2 AGTTGGCTTATGGCTTTTT
•"sf σs 00 o o r*- σs f- i— ι S VO ON in 00
< O σ*ϊ o oo f- f- o SO 00 m o o o <3\ o C cn e
C <N t <
RMS038 GA 115 50.3 GTGATAAGAGCAAAACAAGATGG 53.8 CTCGCGGAAGCCTCAAAA
RMS039 2xGA 124 52.1 GCTGCTTTCTCCAATCAACAA 52.1 CAGCTCAGCAAAGGGGACTA
RMS040 GT 143 46.6 AACCCCAAACTTCCTAAACT 45.7 TCTGTATCTACTGTGGCTAACC
RMS041 GA 249 49.2 TTAACCCAAAGCACCAAAAT 48.5 ACCTTCACCGATGTATCACC
RMS042 AT> 181 55.4 GCATGGCCAGGCTCTTCAC 55.5 ATGCCAAACGTCTCAGTCAACC
RMS043 GA 215 52.6 GATCAAAGATGGGTTCTCCTCTC 54.6 AGGGGAATCTTTGAAAGTCGTTC
RMS044 AT 204 49.6 ACCGATGGATGGCAATAAC 49.7 ATACAGGACATAAACGGCTACC
RMS045 AT>&AT 233 40.0 GAAAATAAGGACATCATCTAC 41.4 GGTGCCTCCATTATTTAC
&GA m TJ RMS046 AT> 247 45.0 AAAGGATTGCTGGATGTG 42.4 TATTCGCGTGGACTCTAT CΛ
>
H RMS047 GA 98 51.6 GCTCCCTCAATTTCCACTCA 51.7 ACCAACCCAATTCGCTCAT N CD r- RMS048 GA&AT 197 41.8 ATAAGTATGAAAAAGTAAAATGAT 44.0 GTATACTAGAAAAACAAAACTGGT >
H H RMS049 AT> 178 39.9 AAAAATACAACCGAAAAA 52.6 CCAACCCGTCAAGGCTAAA m RMS050 AT&GA 169 43.1 TAAGCCTAAGAAAAACTCATT 48.6 CAGCCGTCAGATTCACTTG O m r- RMS051 GT 215 46.5 AGTAGACTGTCCTCCATTTAGC 50.9 ATACCATCAGAGAAGAGACGACAC
RMS052 GA 224 59.8 TTAGCCGTTAATTGAGTCGACAACCT 57.0 TGATGAACCCAATAGAATGAAAACA C GA
RMS053 GA 160 56.9 GGCGGTAGCTAGTGACTGGAATCT 55.4 CCCTTACCCTTACCCCTTTGTTAC
RMS054 AT&GA 239 48.8 CTGGGAGGAGAACTCTGTCA 48.7 TAGCTTATTAGTCTGCATTGATGA
RMS055 GA 192 53.4 TGATCACAAGAGCTTTTCAAGTTTAG 53.4 AGTTAGGCGCATGTACAAGAAAAT
RMS056 GA 133 36.7 TGTGTAGATTAGCATTCC 35.2 GATCTAGGATGATTCAATA
RMS057 GAA / GA 174 63.4 CGAGGTGGGTAAGGGCGAACAAAG 63.5 CCCATCCAAAGCGAGACGACGAC
RMS058 GT 143 50.6 CAACCCCTGAAGCCTGAA 47.4 TTTGTAACCCATTTGACCATA
RMS059 AT> 126 42.6 ACAGTCTTATAGTGGCTTCC 44.9 TACAGGGTTCTAATTGATACATAC
RMS060 GA 219 41.6 CATTCATTTGACTCTAAGGA 43.5 TATTCTGGTCTAAGCTATTGTAA
RMS061 GT 211 49.6 ATATCAGCCGTCCCATCAG 38.9 TTAGAAAATCCCAAACAT
RMS062 GA> 189 50.4 GCGAACGGCATTTACTTGT 50.5 GGTTGTTCTGGGTGGTTTTT
RMS063 GAA 90 60.4 CCACCGCCCACAATCACAATG 59.9 GCTCTGCGGAGTGGGAATGGT
RMS064 GA, GT 227 43.7 TTTTTGCAATATGTGAAGC 50.3 GATTGGTCAACCGATATGTAGAA
RMS065 GA 111 42.2 TATAGCTCGGTAGATTCAAA 56.2 CCAGACTGCCCCCAACTCATA m TJ RMS066 GA 198 48.8 TCCACCCACAGACCACAG 49.5 AAGCTCCCTACGATTTCACTC
CΛ
>
H RMS067 GA 169 50.2 CAATCTGCAATCCGAATCC 47.5 ATGGTGAAAAACAGAAATACTACA N CD r- RMS068 GA 199 52.8 GTGCGCTTTCTGCTCCATT 51.8 CATTTTGTCCTACGTTTTCACTTC >
H H RMS069 GT&GA 232 53.0 TCGGAGATTAAGAGTGAGGTGAGT 56.9 GTGCCCACTTACCCAAACCATC m RMS070 GA 173 45.2 TGCCTCTCGATACAAACC 54.0 AATAAGAACCAATACCCCGAAGAG O m r- RMS071 GT 90 44.4 GTTAGCATCTGGCACATTAT 46.3 AGTTCCTTGACCAGCAGAG
RMS072 GA 110 46.3 TTAGCTCAAGAATTCATCAAAG 51.9 TCCAAACCGAGCTAAGAAAACT
RMS073 AT>/GA 156 46.0 AAACCCCTTTTATGTAGAAGTAG 45.5 TAAAACATGAAATTATAACAATAGT
A
RMS074 AT> 237 51.5 GCTTCTATCCACAGTTTCACCTC 51.0 TTCATGTCAACGCTTCTGTAATAG
RMS075 AT> 237 54.4 GCCCGTAAAAGCCCGTAAA 48.3 TTGGTCAACCGATATGTAGAAT
RMS076 GA 180 48.9 TGGATGCAAACACCTACAAA 58.1 CGTCGCCGGCATTCGTC
RMS077 GA> 154 60.375 AGGTGAACATGGGCCAACTA 57.436 TCAAAGAATGAGTGCCTACTAAGA
RMS078 GT 112 59.585 CCATTCCAAAGTTGCACGTA 60.049 CTCTACTGCCAGCAACCACA
RMS079 GA 182 59.502 CCGGTATGGAGAGGAATGAG 59.841 GCAATTATCCTTGACAGAACCC
RMS080 GT 213 59.585 GCTTTCAAAGATGGGAAACCT 59.470 TTGGTATCACATTTACTCTCATTGC
RMS081 GT&GA 164 57.402 TTTGACACACACACACAAACAT 59.784 GACTGAGAAACAAGTCCGTCCT
RMS082 2xGA 113 59.469 AACAACACACGCGGAATATG 59.873 TGCAGTTGGAGTTGGAGTTG
RMS083 GT 90 60.837 GACGTCCGCACTTTAGCAAC 61.720 AGGTCCTCAGCATAGACGGC
RMS084 GT 185 59.893 GGGAGTCTCAAGAGCTACCGT 58.787 CTTCATGTAAGCCACTGGACA
RMS085 GA 204 59.923 ATGCCCATGACTATCTTGCC 61.110 TCCAAGATGAAGAATTGCGG m TJ RMS086 GA 150 60.195 TTCTGTTTCATCTGGCCTCC 59.700 GTTCGTAGATTCAGGTCGGC
CΛ
> RMS087 GA 229 60.328 GCCCAACTATTCCTCCCACT 60.454 CCCACAGTTGTCCAACACAA
N CD r- RMS088 GA 207 59.955 TCCTGATTCGTATCATCCACTG 59.817 GAAGGCCTCAAGGTTCCTCT
>
H H RMS089 AT> 161 59.107 TTCTTATTGTTGGTTTGGAAGAAA 59.394 TCAATAGTGAGGTGCGAGGA m RMS090 GT&GC 204 59.837 TGTGTGTGTATCCATGGCCT 60.080 ATCTGCAATGACAATGGCAA
O m r- RMS091 GA> 207 59.513 GATCAGGGTGAATACCGAGC 59.589 GCCACTCTTCTCTGTCCTCAA
RMS092 AT> 208 59.546 TGAAATGAGAGACCAATTCCAA 58.762 ATCAAGTGAGCCGATGGAG
RMS093 GA 116 60.301 CGTTCTCGTTGTTGTCATCG 60.540 CCCTCTCTCTCCAGTCACGA
RMS094 GA 175 59.918 TCCTATCCACACCGACATCA 60.125 TCACAAATACCTTCCACTCGC
RMS095 GA 163 59.649 CCAATCTCCTCAACTCCCAG 59.730 TCAGGGCTTCTAAAGCTTGC
RMS096 AT>&AT 203 59.485 TGACCAATATGACAGAGAACCAA 58.143 TGATAGCCTTACATATGGAAACATT
RMS097 GA> 163 60.162 ATCTGGCTGAACACCACACA 60.132 CATGCTAACTCTCCATGTTCCA
RMS098 GT / GA 172 59.790 CACGTCCCATTCCAGAATTT 59.943 CCCTCAATGGAGAGCAAGAG
RMS099 GA 166 60.088 GGTCTGGTTCCTTGAGGTGA 60.096 CTCTCTCGTCCGAAAGCATC
RMS100 GT&AT 169 59.556 AGAGCTCCGCTCTGGATATG 59.911 AAGCCAAAGCTTACGTGCAT
RMS101 GA 133 59.291 GAAGAGACTGAAAGCTTGAAGGA 60.388 CTCCTCTCCACTCCTCACCA
RMS102 GT 170 59.891 AACTAAATGGTTGAGATGCCAAA 59.642 GGAATTTCGTTCCTTAAGCTAAGTT
RMS103 GT 193 59.960 ATTATGCGAACCAAACGAGG 60.214 TGGCAGCATTCTCCCTAAAC
RMS104 GA 209 57.011 CTAAAGCTTGAGCAAACAAATG 59.955 GGAGTATTGGCCGTAGGTGA
RMS105 GT&AT 189 58.857 TTGGTCTAATGCCCTATCCC 60.053 CCAGCCCTAGCCATAATTGA
RMS106 GA 189 58.100 CTCTCCCTCTCTGCATCAAA 59.982 CCTCTTCTCTGCAACCCAAG m TJ RMS107 AT> 194 60.073 CGACCTTGAACTCGATGGAT 59.266 CATGAAAGTGGAGCTAGCTAAGAA
CΛ
> H RMS108 GA 183 61.395 GATCGCCATGGCATGTAAAG 59.592 TTCTTCTAGTTTCCGGCTGC N CD RMS109 GT 115 59.625 TGCAAACCTAAATTCCACAGAA 60.012 TGGCCTCTACAGCTCCTGTT
RMS110 GT 194 59.673 TATGAGAATGAGCGTGTGGG 60.532 TTCCCTCTCATTCCTCTCCC
73 m RMS111 GA 135 57.738 TTAGTCATCATCTTCAGTTATCAAGA 59.933 ATTCAATTGGCTTCACTGGG o m A r
RMS112 AT> 227 59.294 CAAGGATACCAGTCGGAGAGA 59.813 AGAAATGGACAGCTCCGAAA
RMS113 GA 174 60.263 CATGGATTGCGTGTCTTCTG 59.955 GGCATCAGAAAGCTGAAAGG
RMS114 GA 224 60.134 AGTCGCATAACAGGACTGGG 59.894 TTGGGATTTCGGATAAGTCG
RMS115 GA 222 60.027 CGTGAAGACGCAAAGTCAAA 60.059 GGAGGAGAAGGAGGATTTGTG
RMS116 AT> 228 59.989 CACCCACTGGAATACTGGCT 58.724 CGACAAGCATGACCTGAAAT
RMS117 GA 199 59.950 TCTTCTTCTCTCACCGCCAT 60.074 GGCCGATTTGTTGACCTAGA
RMS118 (AT&)GT 168 59.075 TGGCTATGGGAAGAACATGA 59.545 TCAGACAAATAATGCGTTACCAA
RMS119 AT> 122 59.857 GCACGCACACATATATAACAACAA 59.807 GATATCCGCAGCCAAGAAAG
RMS120 GT 193 57.360 CAGTTGAAGAGAACCAAGGG 60.162 TGGTGGGTAGGGAAATGAAA
RMS121 GT 94 60.001 TCCTCTCCAAGACACAATATTCAA 60.999 GCCCTCTCTGCTCTCCCTAA
RMS122 GA 229 60.822 ATTCCACTTCCTCCTTCCCA 59.874 GGATTCTTTCCTCCTGACCC
RMS123 GA 167 59.128 AAACACTCTAAGGAGGTATTCCCTAA 59.137 CGAAGTCTCCCATGGTTTCT
RMS124 GT 107 57.353 TTTGTGGTCGTGTGTGTGTAT 58.149 AGGCACAAATACTATCCACCTG
RMS125 GA 160 60.589 AAGTGAAGACTGAGCGACCG 59.694 CTACTCCAATGTCCGCTTCC
RMS126 GT 210 59.822 AACGACCGCCTAGGAGAAA 58.048 TTGTTTCTGTTCGAATGGGT m 73 RMS127 GA 220 59.967 TGCCTTTCTAGATTTGCTGGA 60.812 TAGTTGTTCGTCACCCACCC
>
H RMS128 GA 230 60.016 AGCATCACGAGCACATTCAG 60.470 GCGAAGATTCACCCAATGAC N
C rD RMS129 GT 229 59.203 ACGTGCACACACTCACACAC 57.100 ACTGATGCAGTTTGCTCTGA >
H H RMS130 GA 126 59.518 CAAATCAATCTGCAAACCCA 59.833 TTTGCGAATACCAGATGCAG m6 RMS131 GA 230 60.615 CGGCCAGAGATAACAGATGG 58.938 TGTTTGTTGCTTAACTACTACAACCT
Q m r RMS132 GA 184 59.454 TGTGGTTATGAATTGCTGGTG 59.956 TTCAGTTTGGTTGAATGGGAG r
RMS133 GA 124 59.731 TCTGCAACAATCAGCAGAAGA 59.901 ATTTCTGGCAAATCCGAATG
RMS134 GA 226 58.173 TGAGCTCAAGCAATATGCAA 58.817 GGCTGTCTCTGATTCCAGTATG
RMS135 GA 190 60.011 GACCGATTGGAGAGGAATGA 58.909 TTGCCTTTCTCCCTTCTGTT
RMS136 GA 114 57.218 GATCATGAGAGTCGCCAAA 59.939 AAGAGGCAGATATGGAGCGA
RMS137 GA 228 60.362 TGTACATGATGATGGGACGC 59.847 GGCAATTGCAAAGACAGTCA
RMS138 GA&andere 157 60.022 CTTCTGAGAGCCACACACCA 60.339 GCAAACACATCCCATCATCA
RMS139 GA 187 60.169 CAAGTATCTGCTCAGGCAAGC 60.218 CCATCACATTCGGCTCTTCT
RMS140 GT 123 59.792 CCAATAGCGATGCAATGAGA 59.052 TTGGCTACCACTAACCTCCC
RMS141 GT 202 58.624 ACAGAGACTTGACGCTGCAT 59.668 AGCGTGTGTAGCTAGGGAGC
RMS142 2 GA 186 60.255 TGGCCTCAACGTCTTCTACC 58.588 CCTGAAATATCCCTATGTCAGAAA
RMS143 GA 230 60.261 GTGGGAAGTGTGGGAACAAC 59.617 GCCTCATCCTGTCCATCTTC
RMS144 GT 202 57.412 TTTATCACTGTCACAAGGCATTA 59.661 GAGCTCCATGAGGTGTTTCC
RMS145 2 x GA 122 60.397 TGCTCACTTACCCAGAAGCC 59.350 TCTCTCTCATTTCAAGAGTAAACCC
RMS146 GT 186 59.454 ACAAGGCATTCACCTTGGTT 58.253 TTTCTGGGCCTGCATAAATA
RMS147 AT> 191 59.583 CCAATCTCAATAACACCGAGC 59.767 TCTTTGTGCTGCTAATGCTCA m 7) RMS148 GT 230 59.756 TTTAGCAGGCATTGGCACTAT 59.698 ACCTCCAGCACCAACTCCT
> — | RMS149 AT>&AT 203 59.566 CGGTGTGTAGTTGATTCGGA 60.195 TCAAATTCTGGCCTCTGTCC
N CD RMS150 GT 209 60.251 TGCTGCAGTATGATGCCAAT 59.055 TGGAAATCCTTTCCTTTCCTT
>
H H
7> m Q m r r
Erklärung zur obenstehenden Tabelle:
Spalte A: Name Name des Mikrosatellitenmarkers; RMS für
RosenMikroSatellit; fortlaufende Nummern von 001 bis
150
Spalte B: Motiv Mikrosatellitenmotiv in der DNA-Sequenz, fuer das ein
Primerpaar gesetzt wurde
Spalte C: Produktgrößee anhand der DNA-Sequenz ermittelte theoretische Groesse (bp) des PCR-Produkts in der Rosensorte Lichtblick
Spalte D: Tm theoretische optimale Annealingtemperatur des F-Primers
Spalte E: Primer F* 5'->3' Sequenz des F-Primers
Spalte F: Tm theoretische optimale Annealingtemperatur des R-Primers
Spalte G: Primer R 5'->3' Sequenz des R-Primers
Diese Marker zeichnen sich durch einen hohen Grad an Polymorphismus zwischen verschiedenen Rosensorten bzw. -linien aus und detektieren in der Regel in verschiedenen Rosenlinien mehrere Allele pro genetischem Locus.
Sie sind daher für "DNA fingerprinting", Sortenidentifikation, Nerwandschaft- bzw. Ähnlichkeitss dien und alle Formen von genetischen Kartierungen, einschließlich der Kartierung von Einzelgenen und quantitativen Merkmalen (QTLs) verwendbar. Außerdem ist ihr Ensatz sehr gut für eine Automatisierung geeignet und es ist möglich, die Detektion der Produkte mit nichtradioaktiven Methoden durchzuführen. Mit Hilfe dieser erfindungsgemäßen Marker ist z.B. die Möglichkeit einer Unterschiedung nahezu aller im Handel erhältlichen Rosensorten gegeben.
Damit wird es möglich, Rosensorten und -arten, die sich bereits in der Datenbank befinden, im vegetativen Zustand zu bestimmen. Ein weiterer Norteil der Erfindung liegt in der Identifikation oder Zuordnung anonymer Rosenherkünfte zu einer Nerwandtschaftsgruppe. Ferner wird es möglich, Linien, welche unter verschiedenen Sortennamen gehandelt werden, zu identifizieren. Auch kann die genetische Nielfalt einer Gruppe von Linien festgestellt werden (z.B. die genetische Nielfalt im Zuchtmaterial eines einzelnen Züchters). Es wird auch möglich, die genetische Distanz von Eltern einer geplanten Kreuzung und damit möglicherweise auch die Erfolgsaussichten der Kreuzung abzuschätzen.
Ausführungsbeispiel
Das folgende Ausführungsbeispiel dient der Erläuterung der Erfindung und schränkt die Erfindung in keinem Falle ein.
Verwendete Methoden
DNA-Isolierung a. Präparation nach der Methode von Saghai Maroof et al. (1994) Proc. Natl Acad Sei USA 91: 5466-5470:
Etwa 1.5 g Blattmaterial wurden in flüssigen Stickstoff gemörsert, mit 15 ml CTAB- Puffer versetzt und 60 min bei 65 inkubiert. Die Mischung wurde zweimal mit Chloroform extrahiert und die DNA mit Ethanol gefällt. DNA-Fäden wurden gefischt, in 70% Ethanol gewaschen und in TE-Puffer aufgenommen. Nach RNase- Verdau wurde mit Phenol und nochmals mit Chloroform extrahiert, mit Ethanol gefällt und wieder in TE gelöst.
b. DNeasy Plant Mini Kit (Qiagen #69104)
100 mg Blattmaterial wurden in flüssigen Stickstoff gemörsert und nach Anleitung des Herstellers verarbeitet.
In beiden Fällen wurde die Konzentration der gewonnenen genomische Rosen-DNA über ein Agarosegel abgeschätzt. Für jede Sorte wurde eine Verdünnung von 2.5 ng/μl in Wasser hergestellt. Je 2μl dieser Verdünnung wurden in PCR-Platten vorgelegt und eingetrocknet und konnten in diesem Zustand bis zur Verwendung bei Raumtemperatur bis zur Verwendung gelagert werden.
2. PCR-Reaktionen
Die PCR-Reaktionen wurden im 25 μl-Volumen in einer 96-well-Mikrotiterplatte durchgeführt. Die Reaktion enthielt: 200 nM Primer 1
200 nM Primer 2
je 200 μM dATP, dGTP, dTTP, dCTP
1 x PCR-Puffer (50 mM KC1, lOmM TRIS-HC1 (pH 9.0 bei 25°C), 1.5 mM
MgCl , 0.1% Triton® X-100; wird als 10 x Stock zur Polymerase #M2668 mitgeliefert) ca. 5 ng genomische Rosen-DNA
0.5 U Taq-Polymerase (Promega #M2668)
Die PCR wurde in GeneAmp PCR System 9700 PCR-Maschinen (Applied Biosystems) durchgeführt. Das Temperaturprofil ist in der folgenden Tabelle dargestellt:
3. Fragmentanalyse
Die Größenanalyse der PCR-Produkte wurde auf einem ABI3100-Sequenziergerät durchgeführt. Es wurden Kapillaren einer Länge von 36 cm verwendet, die mit einer aus dem Polymer POP4 (Applied Biosystems) gefüllt waren. Die Laufbedingungen waren:
Injektionszei:t 20 ms, Spannung: 15 kV, Laufzeit: 1080 s
Als interne Standardfragmente wurden NED-markierte Fragmente der Länge 73 bp, 121 bp, 156 bp, 235 bp, 303 bp, 377 bp und 434 bp verwendet. Die zu analysierenden PCR-
Fragmente trugen für ein später im Hochdurchsatz anzustrebendes Multiplexing eine der drei Markierungsfarben HEX, ROX oder FLU.
Die Analyse der gewonnenen Daten erfolgte über die Programme GeneScan und
GenoTyper (Applied Biosystems).
Erstellen einer genomischen Plasmidbibliothek
DNA der Rosensorte „Lichtblick" wurde aus Laubblättern isoliert. Diese DNA wurde einem Verdau mit dem Restriktionsenzym PstI unterzogen. Über ein präparatives Agarosegel wurde die Fraktion der Restriktionsfragmente von ca. 5 bis 30 kb isoliert
und einem weiteren Restriktionsverdau mit dem Enzym bol unterzogen. Über ein zweites präparatives Gel wurden die Fragmente im Bereich von 500-1500 bp isoliert und in den Plasmidvektor pUC18 kloniert. Die so entstandene genomische Plasmidbibliothek von Rose wurde transformiert (E. coli XL2-Blue MRF') und auf Petrischalen plattiert.
Entwicklung der Mikrosatelliten
Durch einen Pipettierroboter wurden die Bakterienkolonien als Referenzbibliothek (ein Klon pro Vertiefung) in Mikrotiterplatten überführt. Die Klone wurden dann in hochdichter Anordnung („High-density-array") auf Nylonmembranen überführt (spotting). Durch radioaktive Hybridisierung mit einem synthetischen Mikrosatelliten- Oligonukleotid (GAn oder GTn) wurden die Plasmidklone identifiziert, die einen entsprechenden Mikrosatelliten enthalten. Diese Plasmide wurden für die Sequenzierung im μg-Maßstab präpariert und sequenziert. Durch spezielle Software (Primer 3.0 bzw. DNAStar/PrimerSelect von Lasergene) wurde Primerpaare abgeleitet, die das Mikrosatellitenmotiv einschließen und ein theoretisches Produkt von 80-250 bp erzeugen.
Auswahlkriterien
Durch PCR und Auftrennung der entstandenen PCR-Fragmente über ein ABI3100- Sequenziergerät von Perkin Eimer wurden Funktionalität (es entsteht ein Fragment im erwarteten Größenbereich) und Spezifität (es entstehen ein oder wenige klar ansprechbare Fragmente) der PCR mit den Primerpaaren überprüft und bei Bedarf optimiert. Zuverlässig funktionierende, polymorphe Mikrosatelliten, die eine klare Differenzierung der 30 für einen Vortest verwendeten Rosensorten erlauben, werden als Markerset für weitere Genotypisierungen ausgewählt. Die Ergebnisse aus der Untersuchung der verschiedenen Sorten werden in einer Datenbank archiviert, die es erlaubt, hinzukommende Sorten als identisch oder nicht identisch mit bereits untersuchten Sorten oder Linien zu identifizieren oder alternativ Verwandtschaft zu den bereits untersuchten Sorten zu bestimmen.
Durchführung der Genotypisierung
Für die weitere Analyse der 84 für die Genotypisierung geeigneten Marker wurden 32 Rosenlinien verwendet (Tabelle 1). Wiederum wurde zunächst DNA präpariert, wobei größere Schwierigkeiten bei der DNA-Präparation aus den im Spätsommer 2001 erhaltenen ausgewachsenen Laubblätter auftraten. Wahrscheinlich werden die Probleme durch lösliche Kohlenhydrate verursacht, die sich in älteren Blättern ansammeln. Das Pflanzenmaterial vom Mai diesen Jahres dagegen ließ sich problemlos verarbeiten. Die Ergebnisse der Fragmentanalysen, die als "Fingerprint" einer Sorte bezeichnet werden können, wurden in einer Datenbank erfasst. Als Beispiel sind die Daten für Mikrosatellitenmarker RMS059 dargestellt (Tabelle 2).
Nach der Genotypisierung, die zweimal an unabhängig präparierter DNA durchgeführt wurde, konnten die analysierten Mikrosatellitenmarker nach ihrer Qualität in zwei Kategorien eingeteilt werden: "brauchbare" und "gute" Marker.
Als Bewertungskriterien wurden folgende Punkte herangezogen: wird eine überschaubare Zahl von Fragmenten (Allelen) pro Rosensorte erzeugt (in der Regel 1-4 Fragmente)? werden verschiedene Allele etwa gleich stark amplifiziert? erschweren Stotterbanden und Schattenpeaks die Auswertung? sind die Fragmente in unabhängigen Experimenten reproduzierbar? ist die Amplifikation unabhängig von DNA-Qualität und -Menge? besteht ein Gleichgewicht zwischen den Allelen, d.h. kommen die verschiedenen Allele im untersuchten Material etwa gleich häufig vor oder gibt es viele nur selten auftretende Allele?
In die Kategorie "gut" fielen 41 (27%) der ursprünglich 150 untersuchten funktionalen Mikrosatellitenmarker und in die Kategorie "brauchbar" 43 Marker (29%). Die anderen 66 Primerkombinationen (44%) waren bereits bei der Testung (siehe oben) als nicht nutzbar bewertet worden. Über 20 dieser für die Genotypisierung nicht nutzbaren Marker können aber für die genetische Kartierung verwendet werden.
Tabelle 2: Datenblatt für Mikrosatellitenmarker RMS059. Spalten bezeichnen verschiedene Allele des Markers in Basenpaaren (bp), Zeilen bezeichnen die 32 verschiedenen Rosensorten; eine 1 steht für Anwesenheit, eine 0 für Abwesenheit eines Alleis in der untersuchten Sorte. Die letzte Zeile gibt an, wie oft ein Allel im untersuchten Material beobachtet wurde. Die letzte Spalte enthält die Zahl der Allele in einer Sorte. RMS059 enthält einen Mikrosatelliten mit den dinukleotiden Wiederholungsmotiven AT und GT und zeigt daher Allele mit einem Größenunterschied von 2 bp (mit Ausnahme des größten Allels).
Ergebnisse der Genotypisierung
Im Vergleich zu anderen Kulturpflanzen wie z.B. Weizen, Raps oder Zuckerrübe zeigt Rose eine hohe durchschnittliche Anzahl von Allelen pro Sorte (letzte Spalte in Tabelle 2), eine hohe Zahl von verschiedenen Allelen pro Mikrosatellitenmarker und relativ wenige Nullallele. Das spiegelt die Heterogenität des untersuchten genetischen Materials und die komplexe Genetik von Rose wider.
Die Ergebnisse der Genotypisierung wurden für eine Verwandtschaftsanalyse der untersuchten Rosensorten über das Programm NTSYS verwendet. Dabei wurden einmal nur die mit den 41 "guten" Markern erzeugten Daten und einmal die mit allen 84 "brauchbaren" Markern erzeugten Daten verrechnet. Die Ergebnisse sind in Form von Stammbäumen in Abbildung 3 und 4 dargestellt. Auf der horizontalen Achse ist jeweils die genetische Distanz angegeben, die zwischen den theoretischen Werten 0 (keine genetische Verwandtschaft) und 1,00 (Übereinstimmung aller untersuchten Markerdaten) liegt. Beide Dendrogramme unterscheiden sich im Wesentlichen nur in der oberen Hälfte, wo Verzweigungen in sehr kurzen Abständen aufeinander folgen. Die Verwandtschaftsbeziehungen in der unteren Hälfte stellen sich bei Verwendung von 41 oder 84 Markern relativ gut übereinstimmend dar.
Das Ziel der Untersuchung, die eindeutige Unterscheidung aller untersuchten Sorten mit Hilfe von Mikrosatellitenmarkern, wurde damit erreicht. Für jede der Sorten existiert nun ein genetischer Fingerabdruck, der mit dem anderer Sorten verglichen werden kann. Je mehr Markerdaten zwischen zwei Sorten übereinstimmen, desto näher sind sie im Dendrogramm benachbart. Die Ergebnisse der durchgeführten Analyse können daher nicht nur zur Unterscheidung von Sorten verwendet werden, sondern auch Verwandtschaften und Züchtungswege offenlegen.
Unter Nutzung der Information, die im Internet zugänglich ist (z.B. www.everyrose.com, www.rogersroses.com), konnte im Dendrogramm von unter nach oben eine grobe Tendenz von Wildarten über alte Sorten zu moderneren Sorten festgestellt werden. Die ganz unten stehende Art Rosa ?nultiflora zeigt übereinstimmend in beiden Analysen eine geringe Verwandtschaft von nur 0,22 zu allen anderen untersuchten Sorten. Auch die Art Rosa xanthina mit der Sorte 'Canary Bird' ist kaum mit den übrigen Sorten
verwandt. Die Moosrosen 'Zoe' und 'Comtesse de Murinais' entstanden 1861 bzw. 1843. Die weiter oben stehenden Remontant-Hybriden 'Abraham Zimmermann' (1876) und 'Dr. Georges Martin' (1908) stammen aus der 2. Hälfte des 19. Jahrhunderts bzw. aus dem frühen 20. Jahrhundert. Die relativ junge Teehybriden 'Autumn' (1928), 'Sommerliebe' (1988) und 'Spes' (1970) stehen in der oberen Hälfte des Dendrogramms. Jeweils am oberen Ende sind die beiden Floribundarosen 'Ulrike' (1973) und 'Jan Spek' (1966) zu finden. Schlecht einzuordnen sind die Sorten 'Spreeglut' (Strauchrose, 1985), 'Sangerhausen' (Polyantha-Hybride, 1938) und 'Lichtblick' (Strauchrose, 1972). Sie bilden zwar in beiden Dendrogrammen eine Gruppe, werden jedoch in Abbildung 2 eher in die Verwandtschaft der Teehybriden und in Abbildung 3 eher in die Verwandtschaft der Floribundarosen gestellt.
Definierung eines Sets von 25 Mikrosatellitenmarkern
Für die weitere Genotypisierung einer größeren Zahl von Sorten wurden aus den 41 guten Markern 25 ausgewählt, die verläßliche Ergebnisse liefern, eindeutig unterscheidbare Allele aufweisen und einen hohen Informationsgehalt haben: RMS023, RMS029, RMS038, RMS047, RMS052, RMS057, RMS059, RMS062, RMS065, RMS070, RMS077, RMS088, RMS089, RMS095, RMS097, RMS102, RMS103, RMS104, RMS112, RMS115, RMS120, RMS128, RMS139, RMS146 und RMS148. Mit Hilfe dieses Sets sollte es möglich sein, mindestens 90% aller Rosensorten zu unterscheiden. Für eine Abstammungsanalyse z.B. zum genauen nachvollziehen von Züchtungswegen sollte aber eine größere Zahl von Markern eingesetzt werden. Generell steigt die Zuverlässigkeit solcher Analysen proportional mit der Zahl der verwendeten Marker (zumindest im Bereich von unter 100 verwendeten Markern).
Das Ziel der Erfindung, die Entwicklung von mindestens 25 für die Genotypisierung geeigneten Mikrosatellitenmarkern, ist erreicht worden. Insgesamt wurden 84 nutzbare Mikrosatellitenmarker entwickelt, von denen 41 besonders gut einsetzbar sind. Ein Set von 25 Mikrosatelitenmarkern wurde definiert, mit dem eine verläßliche Genotypisierung von weiteren Rosensorten durchgeführt werden kann. Die wichtigsten Angaben und Nutzungshinweise für den Gebrauch der Marker sind in der erstellten Datenbank enthalten.
Nähere Beschreibung der Mikrosatellitenmarker
Die nähere Beschreibung der Mikrosatellitenmarker wird in der folgenden Tabelle dargestellt.
> H N 00
7) m o m r
m TJ
> H N 00
73 m o m r
73 <J>
> H N 00
73 m o m ro σ.
m
73 <J> H > N 00
73 m o m ro σ.
m
73 <J>
> H N 00
73 m o m ro σ.
m
73 <J>
> H N 00
73 m o m ro σ.
73 <J>
> H N 00
73 m o m ro σ.
m
73 <J>
> H N 00
73 m o m ro
m
73 <J>
> H N 00
73 m o m ro σ.
Tabelle: Beschreibung der Mikrosatelittenmarker
m
73 <J>
> H N 00
Legenden zu den Abbildungen:
Abbildung 1 (zweiseitig, a und b): Elektropherogramm der PCR-Produkte der Rosensorten 10 bis 18 mit der Primerkombination RMS059. Peaks bezeichnen Allele, deren Größe automatisch berechnet (untere Zahl unter dem Peak) und einer Allelkategorie zugeordnet wurde (obere Zahl).
Abbildung 2: Nerwandtschaftsanalyse der 32 Sorten anhand von 41 Mikrosatellitenmarkern der Kategorie "gut". Je weiter eine Verzweigung zwischen zwei Sorten nach rechts verschoben ist, desto näher sind sie verwandt.
Abbildung 3: Nerwandtschaftsanalyse der 32 Sorten anhand von 84 Mikrosatellitenmarkern der Kategorie "gut" und "brauchbar"