DE19941606A1 - Verfahren zum Ermitteln von Nuklein- und/oder Aminosäuresequenzen - Google Patents
Verfahren zum Ermitteln von Nuklein- und/oder AminosäuresequenzenInfo
- Publication number
- DE19941606A1 DE19941606A1 DE19941606A DE19941606A DE19941606A1 DE 19941606 A1 DE19941606 A1 DE 19941606A1 DE 19941606 A DE19941606 A DE 19941606A DE 19941606 A DE19941606 A DE 19941606A DE 19941606 A1 DE19941606 A1 DE 19941606A1
- Authority
- DE
- Germany
- Prior art keywords
- sequences
- database
- bio
- species
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Die vorliegende Erfindung betrifft ein Verfahren zum Ermitteln potentiell bedeutsamer DNA- und/oder Nukleinsäuresequenzen einer interessierenden Spezies (Artsequenzen). Um ein Verfahren zum Ermitteln von DNA- und/oder Nukleinsäuresequenzen zu schaffen, bei welchem gezielt solche DNA- und/oder Nukleinsäuresequenzen herausselektiert werden, die eine potentiell erhöhte Bedeutsamkeit haben, daß heißt, die mit erheblich weniger Forschungsaufwand gezielt im Hinblick auf bestimmte Funktionen untersucht werden können, insbesondere im Hinblick auf eine potentielle Krankheitsrelevanz, als dies bei den übrigen, nicht auf diese Weise selektierten DNA-Sequenzen möglich wäre, werden erfindungsgemäß die folgenden Verfahrensschritte vorgeschlagen: DOLLAR A a) Ermitteln beliebiger Artsequenzen der interessierenden Spezies mit biologischen bzw. gentechnischen Methoden und Speichern der Artsequenzen in einer ersten Datenbank, DOLLAR A b) Erfassen bekannter DNA-/Nukleinsäuresequenzen einer vorgegebenen Gruppe anderer Arten (Biosequenzen) einschließlich der funktionalen Bedeutung dieser Sequenzen in einer zweiten Datenbank, in welcher die Biosequenzen und Zusatzinformationen einschließlich der funktionalen Bedeutung einzelner Biosequenzen gespeichert sind, DOLLAR A c) Vegleichen der bereits bekannten Artsequenzen der interessierenden Spezies mit den Biosequenzen der in der zweiten Datenbank gespeicherten, vorgegebenen Gruppe von Biosequenzen in einem Homologietest, DOLLAR A d) Aussondern derjenigen Biosequenzen der ...
Description
Die vorliegende Erfindung betrifft ein Verfahren zum Erfassen von DNA- und/oder Nuklein
säuresequenzen und insbesondere ein Verfahren zur Erfassung solcher DNA- und/oder
Nukleinsäuresequenzen einer gegebenen Spezies (im folgenden kurz als "Artsequenzen"
bezeichnet), die eine potentiell erhöhte Bedeutsamkeit haben und die somit besonders loh
nenswert erscheinende Forschungsobjekte sind.
Die Biowissenschaften und insbesondere die Gentechnologie haben in den vergangenen
Jahren eine besonders rasante Entwicklung durchlaufen. Grundlage hierfür waren zum Bei
spiel neue Verfahren zur Erzeugung und Vervielfältigung von gentechnischem Material, wie
z. B. die Polymerase-Kettenreaktion (PCR) und immer bessere Methoden zur Aufspaltung
genetischen Materials und zur Identifizierung der Bruchstücke im Detail, das heißt der ge
nauen Abfolge von Nukleinsäuren, die entlang eines Genabschnittes angeordnet sind.
Dies hat dazu geführt, daß die Zahl der in ihrem genauen Aufbau ermittelten Genabschnitte
verschiedener Arten immer schneller angewachsen ist und weiterhin anwächst. Ein sehr
anspruchsvolles, aber in wenigen Jahren womöglich bereits erreichtes Ziel liegt in der voll
ständigen Erfassung des menschlichen Genoms, das heißt der Erfassung sämtlicher Se
quenzen, aus denen die menschlichen Gene zusammengesetzt sind, einschließlich der ge
nauen Reihenfolge von Nukleinsäuren innerhalb der Sequenzen und der relativen Anord
nung der einzelnen Sequenzen zueinander.
Auch wenn die Anordnung und Positionierung bestimmter Sequenzen schon eine nützliche
Zusatzinformation bei der Ermittlung der funktionellen Bedeutung der betreffenden Sequen
zen liefern kann, so ist doch die reine Kenntnis einer bestimmten Sequenz (Nukleinsäure-
oder DNA-Sequenz) nur von sehr geringem Wert, solange man die genaue Funktion und
Bedeutung des betreffenden Genabschnittes nicht erkannt und verstanden hat. Gerade dies
spielt aber in der wissenschaftlichen Forschung und insbesondere in der Medizin eine immer
größere Rolle. So sind z. B. bestimmte Krankheiten mit der konkreten Ausgestaltung ganz
bestimmter Genabschnitte aufs Engste verknüpft und die genaue Kenntnis des funktionellen
Zusammenhanges zwischen einem bestimmten Genabschnitt und der Ausprägung eines
bestimmten Krankheitsbildes kann daher von enormer therapeutischer Bedeutung sein, da
sich dann viel leichter Pharmazeutika entwickeln lassen, die exakt ein krankhaftes Defizit
ausgleichen. Gegebenenfalls kann sogar eine vollständige Heilung dadurch herbeigeführt
werden, daß durch Gabe eines Therapeutikums, z. B eines Inhibitors eines Genproduktes
eines kranheitsrelevanten Gens, der gesunde Gleichgewichtszustand wieder erreicht wird.
Dies gilt selbstverständlich nicht nur für die menschliche Spezies, sondern im Prinzip für
jede Art von Lebewesen, das heißt sowohl für alle Tier- und Pflanzenarten als auch für mi
krobiologische Arten.
Wie bereits erwähnt, ist das reine Auffinden immer neuer DNA- oder Nukleinsäuresequen
zen ohne Kenntnis von deren funktionaler Bedeutung eine relativ nutzlose Sammlung von
Daten, da es kaum möglich ist, in gezielter biologischer bzw. medizinischer Forschung die
funktionale Bedeutung einzelner Sequenzen oder Sequenzabschnitte auch nur annähernd
in dem Tempo zu ermitteln, in dem neue Sequenzen ermittelt werden.
Außerdem ist die Ermittlung der funktionellen Bedeutung von DNA-Sequenzen, auf deren
Funktion es keinerlei Hinweise gibt, neben dem dafür erforderlichen Zeitaufwand auch au
ßerordentlich kosten- und personalintensiv und bindet damit viele Kapazitäten.
Ausgehend von diesem Stand der Technik liegt der vorliegenden Erfindung die Aufgabe
zugrunde, ein Verfahren zum Ermitteln von DNA- und/oder Nukleinsäuresequenzen zu
schaffen, bei welchem gezielt solche DNA- und/oder Nukleinsäuresequenzen herausselek
tiert werden, die eine potentiell erhöhte Bedeutsamkeit haben, das heißt die mit erheblich
weniger Forschungsaufwand gezielt im Hinblick auf bestimmte Funktionen untersucht wer
den können, insbesondere im Hinblick auf eine potentielle Kranheitsrelevanz, als dies bei
den übrigen, nicht auf diese Weise selektierten DNA-Sequenzen möglich wäre.
Diese Aufgabe wird durch die Merkmale des Anspruchs 1 gelöst, wobei die abhängigen An
sprüche vorteilhafte Ausgestaltungen der Erfindung darstellen, durch die die Selektion
nochmals verfeinert wird und durch die zusätzliche Informationen gewonnen werden, welche
den notwendigen Forschungsaufwand noch weiter reduzieren.
Das erfindungsgemäße Verfahren besteht aus mehreren Schritten, wobei die Reihenfolge
der nachstehend aufgelisteten Schritte jedoch mindestens teilweise auch variabel ist. Zum
Beispiel könnten zunächst die Schritte b und c und anschließend erst der Schritt a des An
spruchs 1 ausgeführt werden.
Gemäß Schritt a werden im Prinzip beliebige Artsequenzen einer interessierenden Spezies
mit biologischen bzw. gentechnischen Methoden ermittelt. Die ermittelten Artsequenzen
werden in einer üblichen Nomenklatur als Buchstabencode, der z. B. aus vier Buchstaben
besteht, in einer ersten Datenbank gespeichert.
Weiterhin werden gemäß Schritt b alle bekannten DNA- und/oder Nukleinsäuresequenzen
einer vorgegebenen Gruppe biologischer Arten oder Klassen in einer zweiten Datenbank
erfaßt, in der im allgemeinen auch die funktionalen Bedeutungen solcher Sequenzen zu
sammen mit den Sequenzen gespeichert sind. Derartige, öffentlich zugängliche Datenban
ken enthalten außerdem mitunter weitere Zusatzinformationen zu den einzelnen Sequen
zen. Lediglich zur besseren Unterscheidung werden diese von mehreren Arten stammenden
Sequenzen hier kurz als "Biosequenzen" bezeichnet, während Sequenzen der interessie
renden Spezies hier durchgehend als "Artsequenzen" bezeichnet werden. Die vorgegebene
Gruppe von Arten oder Klassen kann, muß jedoch nicht die interessierende Spezies ent
halten. Im Gegenteil, gemäß der vorliegenden Erfindung sind es gerade die über andere
Arten in solchen Datenbanken enthalten Informationen, die gemäß der vorliegenden Erfin
dung mit einem ausgeklügelten Verfahren selektiert werden, die dann durch die Verknüp
fung mit anderen Informationsquellen mit Hilfe des erfindungsgemäßen Verfahrens indirekt
Hinweise auf die Bedeutung bestimmter Sequenzen der interessierenden Art liefern.
Gemäß Schritt c werden die in einer Datenbank gemäß Schritt b erfaßten Biosequenzen mit
den ebenfalls bereits bekannten und möglicherweise in derselben Datenbank gespeicherten
Artsequenzen (der interessierenden Art) in einem Homologietest verglichen, wobei wegen
der relativ großen Zahl der miteinander zu vergleichenden Sequenzen ein möglichst einfa
cher Homologietest verwendet werden sollte. Liegt dann die Homologie zwischen den be
kannten Artsequenzen und den bekannten Biosequenzen über einem gewissen Schwellen
wert, so werden all diese zu bekannten Artsequenzen homologen Biosequenzen gemäß
Schritt d aus dem weiter zu betrachtenden Datenbestand ausgesondert. Damit ist die Menge
der verbleibenden, bekannten Biosequenzen gegenüber den insgesamt öffentlich bekannten
Biosequenzen nicht nur durch eine Beschränkung auf eine Gruppe bestimmter Arten redu
ziert, sondern darüber hinaus auch noch auf diejenigen Sequenzen, zu denen bisher keine
homologen Artsequenzen ermittelt wurden.
Die gemäß Schritt a gespeicherten bzw. neu ermittelten DNA-/Nukleinsäuresequenzen wer
den dann in Schritt e mit diesem verbleibenden, reduzierten Bestand an Biosequenzen in
einem Homologietest verglichen. Zweckmäßigerweise werden zur Bestätigung der Homolo
gie und zum besseren Verständnis der übereinstimmenden Abschnitte der Sequenzen die
Artsequenz und die hierzu homologe Biosequenz aneinander angepaßt. Wenn die Homolo
gie über einem vorgegebenen zweiten Grenzwert liegt, so werden die betreffenden Biose
quenzen gemäß Schritt f zusammen mit mindestens einem die zugehörige Biosequenz ein
deutig identifizierenden Verknüpfungsglied abgespeichert bzw. als potentiell bedeutsame
Artsequenz ausgegeben.
Durch die Verknüpfung mit einer oder mehreren bestimmten Biosequenzen, zu denen be
reits Funktionsbeschreibungen und andere Zusatzinformationen bekannt sind, kann man
sehr gezielt nach analogen Funktionen der neu ermittelten Artsequenzen suchen und hat
dabei auch einen sehr hohen Grad von Erfolgswahrscheinlichkeit mit verhältnismäßig nied
rigem Aufwand. Diese erhöhte Erfolgswahrscheinlichkeit bei niedrigem Aufwand macht die
betreffenden Artsequenzen zu Artsequenzen potentiell erhöhter Bedeutsamkeit, da andere
von ihrer Struktur und Länge her gleichwertige Artsequenzen, zu denen aber keine Homolo
ge mit bekannten Funktionen existieren, einen erheblich größeren Aufwand bei der Ermitt
lung ihrer funktionellen Bedeutung erfordern würden.
Allgemein werden verschiedene Informationspools durch die vorliegende Erfindung auf eine
besondere, strategisch günstige Weise so miteinander verknüpft, daß ein Maximum an In
formation zu einer Sequenz mit einem in der Praxis noch machbaren Minimum an Aufwand
gewonnen wird. Dagegen würde eine nach üblichen mathematischen Kriterien vorgenom
mene wechselseitige Verknüpfung aller zu jeweils einer Sequenz und deren Homologen
gespeicherten Daten aus einer größeren Gruppe von biomedizinischen Datenbanken, wie
sie vorliegend verwendet werden, alle derzeit verfügbaren Rechenkapazitäten bei weitem
übersteigen.
Bei dem erfindungsgemäßen Verfahren lassen sich daher nicht nur wesentlich schneller und
sicherer Erfolge bei der Entwicklung von Medikamenten und der Therapie von Krankheiten
erzielen, sondern es ist diese Erfolgswahrscheinlichkeit bei gleichzeitig reduziertem For
schungsaufwand beträchtlich erhöht.
Um diesen Aufwand noch weiter zu reduzieren, ist in einer bevorzugten Ausführungsform
der Erfindung vorgesehen, daß gemäß einem weiteren Schritt g in den öffentlich zugängli
chen Datenbanken Hinweise (Links) erfaßt werden, die dort zu Biosequenzen in der zwei
ten, öffentlichen Datenbank gespeichert sind, und zwar zu den Biosequenzen, die zuvor als
Homologe zu neuen Artsequenzen ermittelt wurden, wobei vorzugsweise solche Hinweise
ausgewertet und verwendet werden, die auf eine taxonomisch organisierte Datenbank hin
weisen. Eine solche taxonomisch organisierte Datenbank enthält zu den jeweiligen Biose
quenzen nach einheitlichen wissenschaftlichen Kriterien ausgewählte Stichworte, die dann
gemäß Schritt h mit einer vorgegebenen Liste von Stichworten verglichen werden, wobei
diese Liste wiederum so ausgewählt ist, daß sie die Forschungsgebiete eines Benutzers
abdeckt. Die betreffende Biosequenz und die zugehörige Artsequenz werden also nur dann
in dem als lohnende Zielobjekte zu definierenden Datenbestand erhalten, wenn Überein
stimmungen zwischen einer vorgegebenen Stichwortliste und den nach taxonomischen Kri
terien vergebenen Stichwörtern in der entsprechenden Datenbank (dritte Datenbank) beste
hen. Die betreffenden Stichwörter, die in gewisser Weise funktionale Bedeutungen reprä
sentieren, lassen dann wiederum eine gezieltere Forschung nach den speziellen Eigen
schaften einer Artsequenz zu.
Die Datenbank, in welcher neu ermittelte Artsequenzen für eine weitere Untersuchung ge
speichert werden, kann eine öffentliche Datenbank sein, dürfte im Regelfall aber eine private
Datenbank sein, zu der jeweils nur der Benutzer oder einige wenige Benutzer Zugang ha
ben, jedoch nicht die Öffentlichkeit.
Dagegen hat die zweite Datenbank, in der auch Zusatzinformationen zu den betreffenden
Biosequenzen und Hinweise auf andere Datenbanken und darin gespeicherte Informationen
enthalten sind, im allgemeinen eine öffentliche Zugangsmöglichkeit.
Eine für die Zwecke der vorliegenden Erfindung besonders geeignete dritte Datenbank, die
nach taxonomischen Kriterien ausgewählte Stichworte (MeSH Begriffe) enthält, ist die soge
nannte "MEDLINE"-Datenbank. Diese Datenbank enthält zum einen eine Identifikations
nummer für jede biomedizinische Literaturstelle und zusätzliche Informationen zusammen
mit einer Reihe weiterer Daten, und unter anderem auch Stichworte, die als "medical subject
headings" bezeichnet werden. Darüber hinaus gibt es Hinweise auf Fundstellen, Autoren,
Veröffentlichungen. Und sogenannte RN Nummern.
Daneben enthält die MEDLINE Datenbank einen sogenannten Sequenz Identifier, der vor
zugsweise als eines der notwendigen Verknüpfungsglieder benutzt wird.
Auf diese Weise ist es möglich, für einen Benutzer umfassende Informationen zu erzeugen
und zusammenzustellen, der ursprünglich lediglich DNA-/Nukleinsäuresequenzen vorliegen
hatte, zu denen keinerlei Informationen bekannt waren, wobei durch das erfindungsgemäße
Verfahren automatisch auf dem Weg über Homologietests und das gezielte Filtern und Aus
sondern von Informationsquellen umfassende Informationen zu einer Artsequenz erzeugt
werden, die Bedeutung und Funktion der Sequenz charakterisieren und eine gezielte For
schung ermöglichen. Alle Artsequenzen, für die auf diese Weise Funktionen und Bedeutun
gen ermittelt werden können, werden uni diese Zusatzinformationen ergänzt. Sie können
jedoch jederzeit wieder aufgegriffen werden, wenn der Datenbestand in der zweiten (öffent
lich zugänglichen) Datenbank entsprechend erweitert worden ist, so daß sich auf diese Wei
se auch zunächst ausgesonderte Artsequenzen bei einem späteren Durchlauf als lohnens
werte Zielobjekte herausstellen können.
Die Homologietests, die zwischen Artsequenzen und Biosequenzen durchgeführt werden,
werden vorzugsweise in einem Pipelineverfahren durchgeführt, so daß nicht immer kom
plette Datenbestände erfaßt und verwaltet werden müssen.
Weiterhin ist es zweckmäßig, wenn auch über die bereits erwähnten Datenbanken hinaus
weitere Datenbanken nach Verknüpfungen insbesondere mit der dritten Datenbank
(MEDLINE) durchsucht werden, um im Falle einer entsprechenden Verknüpfung auch die
Zusatzinformationen aus diesen zusätzlichen Datenbanken zu verwerten. Hierzu zählen
insbesondere auch die als "OMIM" und "KEGG" bezeichneten Datenbanken.
Ein Ausführungsbeispiel der Erfindung wird im folgenden anhand von Figuren erläutert, wor
aus sich weitere Vorteile, Merkmale und Anwendungsmöglichkeiten der vorliegenden Erfin
dung ergeben. Es zeigen:
Fig. 1 ein Schema zur Reduktion der ermittelten Artsequenzen, wie es den Schritten a bis f
in Anspruch 1 entspricht,
Fig. 2 ein Schema von Datenbanken und Datenbankverknüpfungen, wie sie für das weitere
Auswerten von Informationen gemäß der vorliegenden Erfindung verwendet werden und
Fig. 3 die Wiedergabe einer Bildschirmdarstellung mit Bedienfeldern und Informationsfeldern
zur einer (hypothetischen) Nukleinsäuresequenz.
Generell werden zunächst alle z. B. im Laufe einer Woche neu ermittelten DNA-Sequenzen
bzw. Nukleinsäuresequenzen in einer üblichen Nomenklatur (in den standardmäßigen
Buchstabencodes) in einer Datenbank gespeichert, wobei außerdem noch eine Identifikati
onsnummer oder irgendeine andere Codierung zur Identifikation der betreffenden Sequenz
vergeben und gleichzeitig abgespeichert wird. Weitere, zusätzlich mit abzuspeichernde In
formationen sind z. B. die Sequenzlänge, die Art und andere Zusatzinformationen, die un
mittelbar zusammen mit der Ermittlung einer solchen Sequenz zur Verfügung stehen. Die
folgenden Verfahrensschritte laufen dann automatisch ab. Es wird auf eine öffentlich zu
gängliche Sequenzdatenbank zugegriffen, die DNA- und/oder Nukleinsäuresequenzen der
verschiedenen Arten enthält. Dabei wird durch die ursprüngliche Eingabe der interessieren
den Spezies (z. B. Homo sapiens) bereits eine Einschränkung auf eine bestimmte Gruppe
von Arten vorgenommen, von denen man sinnvollerweise eine Korrelation und funktionale
Ähnlichkeit zu Genabschnitten der interessierenden Art vermuten kann.
Die öffentliche Sequenzdatenbank enthält bereits Daten über die interessierende Art. Daher
wird zunächst ein Homologietest zwischen den in der öffentlichen Datenbank dokumentier
ten Sequenzen der interessierenden Art mit den Biosequenzen der entsprechend ausge
wählten Gruppe von Arten, die in derselben Datenbank gespeichert sind. Dabei werden alle
Biosequenzen, die homolog zu den bereits in der öffentlichen Datenbank gespeicherten Art
sequenzen sind ausgesondert, da sie offenbar schon Gegenstand entsprechender For
schungen waren bzw. sind.
Zweckmäßigerweise werden die Ergebnisse dieses Verfahrensschrittes protokolliert, so daß
bei einer Wiederholung desselben Vorganges z. B. eine Woche später alle bereits einmal
ausgesonderten Biosequenzen von vornherein außer Betracht bleiben, was den Verfah
rensablauf beträchtlich beschleunigt. Der Homologietest kann sich dann auf die neu hinzu
gekommenen Biosequenzen beschränken bzw. umgekehrt die zuvor nicht ausgesonderten
Biosequenzen müssen noch in einem Homologietest mit neu hinzugekommenen Artsequen
zen verglichen werden.
Damit wird jedoch der Ausgangsdatenbestand beträchtlich verringert.
Die noch verbleibenden Biosequenzen werden dann mit den neu ermittelten Artsequenzen
in einem Homologietest verglichen. Dabei werden im Regelfall für einige der neu ermittelten
Artsequenzen homologe Biosequenzen gefunden. Sodann wird eine Liste bzw. Tabelle der
Artsequenzen und der dazu neu gefundenen, homologen Biosequenzen angefertigt und in
diese Tabelle bzw. Liste werden auch zusätzliche Informationen aus der öffentlichen Daten
bank übernommen, wie z. B. eine medline-Identitätsnummer, die möglicherweise zu einer
bekannten Biosequenz gespeichert ist.
Ein weiterer Schritt (h) des Verfahrens besteht im Klassifizieren der in Schritt f) ausgegebe
nen bzw. gespeicherten Artsequenzen, d. h. Einordnen (Sortieren) in bestimmte Klassen
von Sequenzen durch linguistische Analyse von Textdefinitionen der zu den homologen Bio
sequenzen gespeicherten Zusatzinformationen. Dies ermöglicht eine Aufteilung in Teilda
tensätze, die für deren Ergänzung wiederum nur ein Teil der sonstigen Datenbasen in Frage
kommt.
Weiterhin erfolgt gemäß Schritt i ein Ergänzen der den potentiell bedeutsamen Artsequen
zen zuzuordnenden Eigenschaftsinformationen der jeweils homologen Biosequenzen durch
Erfassen von Hinweisen (Links) zu den gemäß Schritt f) erfaßten Biosequenzen in der
zweiten Datenbank auf mindestens eine dritte Datenbank und Erfassen der zu den erwähn
ten Biosequenzen in der dritten Datenbank gespeicherten Informationen
Die dritte Datenbank sollte eine mindestens in Teilbereichen taxonomisch organisierte Klas
sifikation bereitstellen, vorzugsweise handelt es sich dabei um die sogenannte MEDLINE
Datenbank.
Erfindungsgemäß werden die nach taxonomischen Kriterien den jeweiligen Biosequenzen
zugeordneten Stichworte mit einer vorgegebenen Liste bzw. Datei von Stichworten vergli
chen und übereinstimmende Stichworte sowie die betreffenden Biosequenzen und die ho
mologen Artsequenzen bzw. jeweils eine Kennung derselben, für die übereinstimmende
Stichworte mit der vorgegebenen Liste von Stichworten gefunden wurden, werden ausgege
ben.
Neben der MEDLINE Datenbank oder auch ersatzweise hierfür werden auch Informationen
aus weiteren Datenbanken verwendet, die z. B. aus der Gruppe ausgewählt werden, die aus
den Unigene, Genemap und GDB (neu) sowie OMIM-, KEGG- und UMLS-Datenbanken
besteht.
In erster Linie ist die interessierende Spezies die des Homo sapiens, wobei aber das erfin
dungsgemäße Verfahren für eine andere Spezies mit im wesentlichen ähnlicher Zielsetzung
ebenso verwendet werden kann.
Mit Bezug auf die Figuren werden nun der Ablauf und das Ergebnis eines hypothetischen
Ausführungsbeispiel etwas genauer erläutert. Wie bereits erwähnt, werden gemäß Schritt c
in Patentanspruch 1 bereits bekannte Artsequenzen der interessierenden Spezies mit den
Biosequenzen in einem Homologietest verglichen, die zu einer vorgegebenen Gruppe von
Biosequenzen gehören, welche in der zweiten Datenbank gespeichert sind. Dieser Schritt ist
in Fig. 1 mit "blastx humprot" bezeichnet. Sofern homologe Sequenzen gefunden wurden,
wird den zu den bereits bekannten Artsequenzen homologen Biosequenzen ein bestimmter
Status (hier Status = 2) zugeordnet und diese Biosequenzen werden entsprechend gekenn
zeichnet und aus dem interessierenden Pool der zweiten Datenbank ausgesondert.
Anschließend erfolgt mit den Artsequenzen, die gemäß Schritt a ermittelt wurden, ein weite
rer Homologietest mit den aus der zweiten Datenbank verbleibenden Biosequenzen, die bis
dahin noch nicht als Homologe zu bekannten Artsequenzen ermittelt wurden. Dieser Schritt
ist in Fig. 1 mit "Blastn proprietary genes" bezeichnet. Sofern homologe Biosequenzen ge
funden wurden, erfolgt die bestmögliche Anpassung und Ausrichtung (dieser Schritt ist in
Fig. 1 mit "bestfit" bezeichnet) und die die Anpassung, Länge und Ausrichtung kennzeich
nenden Daten werden zusammen mit der betreffenden Sequenz gespeichert. Der den ent
sprechenden Biosequenzen zugeordnete Status 0 bedeutet, daß diese Biosequenzen wei
terhin in dem interessierenden Pool an Daten verbleiben.
Ebenso verbleiben auch diejenigen Biosequenzen in dem interessierenden und reduzierten
Datenpool, zu welchen weder unter den ermittelten Artsequenzen noch unter den bereits
bekannten Artsequenzen Homologe zu finden waren.
Auf diese Weise werden Datensätze erzeugt, welchen neu ermittelten Artsequenzen ent
sprechende homologe Biosequenzen zugeordnet sind. Der Benutzer des erfindungsgemä
ßen Systems bedient dieses zweckmäßigerweise von einem Bildschirmarbeitsplatz mit ent
sprechenden Einrichtungen. In Fig. 3 ist schematisch eine Bildschirmanzeige wiedergege
ben, die ein hypothetisches Ergebnis einer Ermittlung potentiell bedeutsamer Artsequenzen
gemäß der Erfindung zeigt. Dabei ist allerdings darauf hinzuweisen, daß das dargestellte
Ergebnis kein Realerzeugnis, sondern lediglich ein hypothetisches, künstlich synthetisiertes
Ergebnis ist, an welchem jedoch prinzipiell alle wesentlichen Schritte und Ergebnisse eines
typischen Ausführungsbeispiels abgelesen werden können.
Der Bildschirm zeigt am linken Rand eine Reihe von Befehls- und Parameterfeldern, die der
Benutzer bedienen kann. Beispielsweise wählt er in dem Feld 1.2 einen Grenzwertparame
ter aus, der die minimale Länge der Homologie zwischen Artsequenz und Biosequenz an
gibt, die gemäß Homologietest und bestmöglicher Anpassung mit den Nukleinsäuren der
homologen Sequenz übereinstimmen. In Feld 1.3 wird der Grenzwert einer prozentualen
Übereinstimmung wiedergegeben. In Feld 1.4 kann z. B. ein Stichwort eingegeben werden,
welches in Verbindung mit den entsprechenden homologen Sequenzen gesucht werden
soll.
Die übrigen Bedienfelder sind selbsterklärend.
Nachdem der/die Benutzer/in entsprechende Parameter ausgewählt hat und das zugrunde
liegende Programm startet, erhält er/sie nach kurzer Zeit eine Liste von Artsequenzen, die
eine oder mehrere Biosequenzen Homologe haben, welche den Kriterien der Benutzerein
gabe entsprechen. Zum Beispiel zeigt Abb. 3, daß 124 Artsequenzen eine oder mehrere
Biosequenzen haben, welche homolog mit einer prozentualen Identität größer als 95% sind
und über eine Homologielänge größer als 500 Basenpaaren verfügen. Darüber hinaus ha
ben die Einträge MeSH Begriffe, die hauptsächlich mit CNS (Zentrales Nerven System) as
soziiert sind. Von den 124 Einträgen zeigt Abb. 3 die fünfte Artsequenz, welche mit der Zif
fernfolge 44567 bezeichnet ist. Die Biosequenzen, die homolog sind mit der Artsequenz,
sind in der rechten Bildhälfte unter "seeds" angegeben. Dabei sind, um diese Zuordnung
einzelner Daten aus umfangreichen Dateien zu einer bestimmten vorgegebenen Artsequenz
einschließlich der vielen Zusatzinformationen erzeugen zu können, mehrere Schritte not
wendig, die allerdings in einem entsprechenden Programm automatisch ablaufen, wobei die
Abläufe schematisch an Fig. 2 erläutert werden sollen. Aus dem Homologietest, der in Fig. 1
mit "blast proprietary genes" bezeichnet ist und aus den sich daraus ergebenden Homolo
gen in der zweiten Datenbank, lassen sich aus der zweiten Datenbank sogenannte Genbank
Identifier (Genbank ID) ermitteln, die wiederum auch in anderen Datenbanken abgelegt sind,
und so eine Relation zwischen verschiedenen Nuklein- und/oder Aminosäuresequenzen und
anderen, in den Datenbanken gespeicherten Informationen herstellen.
Eine Schlüsselfunktion kommt dabei der Medline-Datenbank und dem darin festgelegten
MEDLINE-Identifier (Block "Medline ID") zu, der in vielen anderen Datenbanken registriert
ist. Die unter "seeds" angegebenen Sequenzen sind durch einen Genbank Identifier cha
rakterisiert. Diese durch den Genbank Identifier bezeichneten Einträge können unter ande
rem auch Medline Identifier enthalten. Aus der MEDLINE Datenbank lassen sich die Titel
der entsprechenden Einträge mit Hilfe dieser Medline identifier ermitteln. Außerdem sind in
dieser Datenbank oft auch Hinweise auf bestimmte Enzyme abgelegt, die mit dem betref
fenden Genabschnitt in Verbindung gebracht werden und hieraus ergeben sich wiederum
die biochemischen Reaktionspfade, die von diesen Enzymen beeinflußt werden. Über den
MEDLINE-Identifier lassen sich außerdem weitere Informationen aus anderen Datenbanken
gewinnen, z. B. über pathologische Informationen, die Lokalisierung von Genen auf be
stimmten Chromosomenabschnitten etc.
Auf dem Bildschirm wird dann nach dem Durchlauf eines entsprechenden Programms eine
ganze Reihe von Informationen wiedergegeben, die neben der wahrscheinlichen Lokalisie
rung der neu ermittelten Artsequenz eine ganze Reihe von Hinweisen auf dessen Funktion,
Organverteilung und Krankheitsrelevanz gibt. Im vorliegenden Fall, der, wie bereits erwähnt,
nur hypothetische Informationen zu einer Artsequenz wiedergibt, erkennt man beispielswei
se neben der Sequenz 44567 die biochemische Bezeichnung, das Erstellungsdatum der
Information, bei 17q23 die Position des Genabschnittes auf einem Chromosom. Darunter
sind Gene angegeben, die auf demselben Chromosomenarm lokalisiert sind. Aus der
UNIGENE-Datenbank stammen Informationen über Cluster aus Genbruchstücken (EST-
Cluster), die über eine bestimmte Nummer (Hs.198237) identifiziert werden. Die Anzahl der
ESTs in diesem Cluster im Verhältnis zur Gesamtzahl der Komponenten der vorliegenden
Sequenz ist mit 54/82 angegeben. Proangiotensin-Angiotensin gibt die wahrscheinlichsten
Stoffwechselpfade oder chemischen Reaktionen an, zu welchen die bekannten Biosequen
zen gehören. Weiterhin ist mit BRAIN dasjenige Organ angegeben, in welchem die betref
fenden Sequenzen am häufigsten gefunden werden. Die Organverteilung der EST-
Komponenten wird durch unterschiedliche Balkenlängen veranschaulicht. Der wahrschein
lichste Bereich einer Krankheitsindikation, die in Verbindung mit dem Datenabgleich ermittelt
wurde, ist mit CNS angegeben. In der linken Hälfte erkennt man noch eine horizontale Bal
kenreihe, wobei die Länge dieser Balken jeweils Übereinstimmungen zwischen der Artse
quenz und den in der entsprechenden Zeile angegebenen zugehörigen Biosequenzen oder
Sequenzabschnitten angegeben wird. Daneben sind die Biosequenzen unter "seeds" im
einzelnen aufgelistet, einschließlich ihrer prozentualen Übereinstimmung und der Länge der
übereinstimmenden Sequenzabschnitte. Weiterhin sind angegeben die Titel entsprechender
Zeitschriften, die Enzyme, und verschiedene Stichworte.
In dem vorliegenden Beispiel wurden durch die erfindungsgemäße Verknüpfung über ver
schiedene Identifier, Stichwortsuche und taxonomische Auswertung von Datenbanken ge
wonnene Information aus den meisten der in Fig. 3 angegebenen Datenbanken ermittelt, mit
Ausnahme der mit UMLS, SNOMED und ICD9-CM bezeichneten Blöcke. Zur Speicherung
der aus dem Verfahren gewonnenen Informationen wird das Knowledge Interchange Format
(KIF) verwendet. Dieses Format kann von verschiedenen Knowledge Engineering Werkzeu
gen wie z. B. Ontolingua verwendet werden, um unter anderem HTML oder XML Dateien zu
generieren und weiterführende Methoden der künstlichen Intelligenz (KI) anzuwenden.
Claims (15)
1. Verfahren zum Ermitteln potentiell bedeutsamer DNA- und/oder Nukleinsäurese
quenzen einer interessierenden Spezies (Artsequenzen) mit den folgenden Schritten:
- a) Ermitteln beliebiger Artsequenzen der interessierenden Spezies mit biologischen bzw. gentechnischen Methoden und Speichern der Artsequenzen in einer ersten Datenbank,
- b) Erfassen bekannter DNA-/Nukleinsäuresequenzen einer vorgegebenen Gruppe an derer Arten (Biosequenzen) einschließlich der funktionalen Bedeutung dieser Se quenzen, in einer zweiten Datenbank, in welcher die Biosequenzen und Zusatzinfor mationen einschließlich der funktionalen Bedeutung einzelner Biosequenzen gespei chert sind,
- c) Vergleichen der bereits bekannten Artsequenzen der interessierenden Spezies mit den Biosequenzen der in der zweiten Datenbank gespeicherten, vorgegebenen Gruppe von Biosequenzen in einem Homologietest,
- d) Aussondern derjenigen Biosequenzen der vorgegebenen Gruppe, die zu den be kannten Artsequenzen über einem vorgegebenen Schwellenwert homolog sind,
- e) Vergleichen der aus der zweiten Datenbank verbleibenden, nicht ausgesonderten Biosequenzen aus der erwähnten Gruppe mit den nach Schritt a ermittelten Artse quenzen in einem zweiten Homologietest,
- f) Speichern und/oder Ausgeben derjenigen Artsequenzen als Artsequenzen potentiell erhöhter Bedeutung, deren Homologie mit Biosequenzen aus den aus der erwähnten Gruppe verbliebenen Biosequenzen einen vorgegebenen zweiten Schwellenwert überschreitet, zusammen mit Informationen über die hierzu jeweils homologen Bio sequenzen.
- g) Wobei Schritt e) wahlweise auch vor Schritt c) und ohne vorheriges Aussondern ge mäß Schritt d) durchführbar ist.
2. Verfahren nach Anspruch 1, gekennzeichnet durch die folgenden weiteren Schritte:
- a) Anpassen der in Schritt f) ausgegebenen bzw. gespeicherten Artsequenzen in einer nach vorgebbaren Kriterien optimierten Anpassung an die jeweils homologen Biose quenzen und Ausgabe und/oder Speicherung charakteristischer Parameter der opti mierten Anpassung, wie zum Beispiel der prozentualen Übereinstimmung, der Länge übereinstimmender Sequenzabschnitte und der optimierten relativen Ausrichtung (Alignment).
3. Verfahren nach Anspruch 1, gekennzeichnet durch die folgenden weiteren Schritte:
- a) Klassifizieren der in Schritt f) ausgegebenen bzw. gespeicherten Artsequenzen, d. h. Einordnen (Sortieren) in bestimmte Klassen von Sequenzen durch linguistische Analyse von Textdefinitionen der zu den homologen Biosequenzen gespeicherten Zusatzinformationen.
4. Verfahren nach einem der Ansprüche 1 bis 3, gekennzeichnet durch den folgenden
Schritt:
- a) Ergänzen der den potentiell bedeutsamen Artsequenzen zuzuordnenden Eigen schaftsinformationen der jeweils homologen Biosequenzen durch Erfassen von Hin weisen (Links) zu den gemäß Schritt f) erfaßten Biosequenzen in der zweiten Daten bank auf mindestens eine dritte Datenbank und Erfassen der zu den erwähnten Bio sequenzen in der dritten Datenbank gespeicherten Informationen.
5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß die dritte
Datenbank eine mindestens in Teilbereichen taxonomisch organisierte Klassifikation
bereithält.
6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß die dritte Datenbank die
MEDLINE Datenbank ist.
7. Verfahren nach Anspruch 5, gekennzeichnet durch Vergleichen der nach taxonomi
schen Kriterien den jeweiligen Biosequenzen zugeordneten Stichworte mit einer vor
gegebenen Liste bzw. Datei von Stichworten und Ausgabe übereinstimmender
Stichworte sowie der betreffenden Biosequenzen und der homologen Artsequenzen
bzw. jeweils einer Kennung derselben, für die übereinstimmende Stichworte mit der
vorgegebenen Liste von Stichworten gefunden wurden.
8. Verfahren nach Anspruch 2 und einem der auf Anspruch 2 rückbezogenen Ansprü
che, dadurch gekennzeichnet, daß der Vergleich einer vorgegebenen (klassifizierten)
Liste von Stichworten mindestens mit den Medical Subject Headings der Medline-
Datenbank erfolgt.
9. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß die dritte
Datenbank die UNIGENE Datenbank ist.
10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, daß auf der Basis der EST-
Clusterpositionen aus UNIGENE Informationen über entsprechende oder benach
barte Sequenzabschnitte aus GENEMAP und/oder GDB erfaßt werden.
11. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß weitere Datenban
ken nach Verknüpfungsgliedern zu den in der dritten Datenbank ermittelten Fund
stellen durchsucht werden und Hinzufügen der entsprechenden weiteren Informatio
nen bzw. von Hinweisen auf die weiteren Informationen zu den entsprechenden Art
sequenzen erhöhter Bedeutung.
12. Verfahren nach einem der Ansprüche 1 bis 11, dadurch gekennzeichnet, daß minde
stens die zweite Datenbank eine öffentlich zugängliche Datenbank ist.
13. Verfahren nach einem der Anspruch 5 bis 12, dadurch gekennzeichnet, daß die
weiteren Datenbanken aus der Gruppe ausgewählt werden, die aus den Unigene,
genemap und GDB (neu) sowie OMIM-, KEGG- und UMLS-Datenbanken besteht.
14. Verfahren nach einem der Ansprüche 1 bis 13, dadurch gekennzeichnet, daß das
Hinzufügen weiterer Informationen zu den gemäß Schritt f ermittelten Artsequenzen
in einem Pipelineverfahren erfolgt, wobei die hinzugefügten Informationen in Form
von Verknüpfungsgliedern zu den zugeordneten Positionen in weiteren Datenbanken
bestehen.
15. Verfahren nach einem der Ansprüche 1 bis 14, dadurch gekennzeichnet, daß die
interessierende Spezies die menschliche Spezies ist und daß die zugeordnete Grup
pe von Biosequenzen die Biosequenzen von wirbellosen Tieren, Säugetieren, Pri
maten, Nagetieren und Wirbeltieren, sowie die noch nicht klassifizierten Neueinträge
der zweiten Datenbank umfaßt.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19941606A DE19941606A1 (de) | 1999-09-01 | 1999-09-01 | Verfahren zum Ermitteln von Nuklein- und/oder Aminosäuresequenzen |
AU72759/00A AU7275900A (en) | 1999-09-01 | 2000-08-16 | Method for determining nucleic and/or amino acid sequences |
PCT/EP2000/007953 WO2001020024A2 (de) | 1999-09-01 | 2000-08-16 | Verfahren zum ermitteln von nuklein- und/oder aminosäuresequenzen |
EP00960458A EP1224325A2 (de) | 1999-09-01 | 2000-08-16 | Verfahren zum ermitteln von nuklein- und/oder aminosäuresequenzen |
JP2001523795A JP2003509062A (ja) | 1999-09-01 | 2000-08-16 | 核酸および/またはアミノ酸配列の決定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19941606A DE19941606A1 (de) | 1999-09-01 | 1999-09-01 | Verfahren zum Ermitteln von Nuklein- und/oder Aminosäuresequenzen |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19941606A1 true DE19941606A1 (de) | 2001-03-08 |
Family
ID=7920397
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19941606A Withdrawn DE19941606A1 (de) | 1999-09-01 | 1999-09-01 | Verfahren zum Ermitteln von Nuklein- und/oder Aminosäuresequenzen |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP1224325A2 (de) |
JP (1) | JP2003509062A (de) |
AU (1) | AU7275900A (de) |
DE (1) | DE19941606A1 (de) |
WO (1) | WO2001020024A2 (de) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10323917A1 (de) * | 2003-05-23 | 2004-12-16 | Protagen Ag | Verfahren und System zur Aufklärung der Primärstruktur von Biopolymeren |
EP1251435A3 (de) * | 2001-03-14 | 2005-08-03 | Hitachi Software Engineering Co., Ltd. | Wissensbasis und Methode zum Konstruieren und Intergrieren von Wissensbasen |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002079487A2 (en) * | 2001-03-29 | 2002-10-10 | Evogene Ltd. | Methods, platforms and kits useful for identifying, isolating and utilizing nucleotide sequences which regulate gene expression in an organism |
BRPI0408735A (pt) | 2003-03-12 | 2006-03-07 | Evogene Ltd | polinucleotìdeo isolado, construção de ácido nucléico, célula transgênica, organismo transgênico, vegetal transgênico, método para produzir um vegetal transgênico, método para expressar um polinucleotìdeo de interesse em uma célula, e método para co-expressar dois polinucleotìdeos de interesse em uma célula |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5871697A (en) * | 1995-10-24 | 1999-02-16 | Curagen Corporation | Method and apparatus for identifying, classifying, or quantifying DNA sequences in a sample without sequencing |
US6633819B2 (en) * | 1999-04-15 | 2003-10-14 | The Trustees Of Columbia University In The City Of New York | Gene discovery through comparisons of networks of structural and functional relationships among known genes and proteins |
US6470277B1 (en) * | 1999-07-30 | 2002-10-22 | Agy Therapeutics, Inc. | Techniques for facilitating identification of candidate genes |
-
1999
- 1999-09-01 DE DE19941606A patent/DE19941606A1/de not_active Withdrawn
-
2000
- 2000-08-16 EP EP00960458A patent/EP1224325A2/de not_active Withdrawn
- 2000-08-16 WO PCT/EP2000/007953 patent/WO2001020024A2/de not_active Application Discontinuation
- 2000-08-16 AU AU72759/00A patent/AU7275900A/en not_active Abandoned
- 2000-08-16 JP JP2001523795A patent/JP2003509062A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1251435A3 (de) * | 2001-03-14 | 2005-08-03 | Hitachi Software Engineering Co., Ltd. | Wissensbasis und Methode zum Konstruieren und Intergrieren von Wissensbasen |
DE10323917A1 (de) * | 2003-05-23 | 2004-12-16 | Protagen Ag | Verfahren und System zur Aufklärung der Primärstruktur von Biopolymeren |
Also Published As
Publication number | Publication date |
---|---|
JP2003509062A (ja) | 2003-03-11 |
WO2001020024A3 (de) | 2002-05-23 |
WO2001020024A2 (de) | 2001-03-22 |
EP1224325A2 (de) | 2002-07-24 |
AU7275900A (en) | 2001-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fraser et al. | The sequential development of the brain lesions of scrapie in three strains of mice | |
EP0922226B2 (de) | Verfahren zur erfassung des status eines organismus durch messung von peptiden | |
DE112005000598T5 (de) | Verfahren zur Identifizierung einer Zuckerkettenstruktur und Vorrichtung zur Analyse derselben | |
EP2263183B1 (de) | Automatisiertes system zur auswahl und vermittlung von gelagerten allogenen biologischen zellen für transplantation, therapie und forschung | |
DE102010038014A1 (de) | Verfahren zur Charakterisierung einer Probe und eines Systems | |
DE10038694A1 (de) | Verfahren zur Identifizierung von Mikroorganismen mittels MALDI-TOF-MS | |
EP2801825A1 (de) | Massenspektrometrische Bestimmung der Resistenzen von Mikroben | |
DE10159262B4 (de) | Identifizieren pharmazeutischer Targets | |
DE10240216A1 (de) | Verfahren und Datenbank zum Auffinden von medizinischen Studien | |
DE19941606A1 (de) | Verfahren zum Ermitteln von Nuklein- und/oder Aminosäuresequenzen | |
WO2010089158A1 (de) | Automatisiertes system zum vergleich individueller genom-, transkriptom-, proteom-, epigenom und metabolomdaten mit daten aus knochenmarkspender-registern und blut, nabelschnurblut und gewebebanken | |
EP1660880A1 (de) | Vorrichtung und verfahren zur quantitativen auswertung der in einer körperflüssigkeitsprobe enthaltenen polypeptide sowie marker zur erkennung von pathologischen zuständen | |
DE10393475B4 (de) | Verfahren und Vorrichtung zur Identifizierung von Verbindungen in einer Probe | |
EP1027669B1 (de) | Verfahren zur eingruppierung von sequenzen in familien | |
DE60017586T2 (de) | Automatisiertes Verfahren zum Identifizieren verwandter biomolekularer Sequenzen | |
DE10300743A1 (de) | Verfahren zur Identifizierung von Mikroorganismen mittels Massenspektrometrie | |
DE69815718T2 (de) | Verfahren zur vorhersage, identifizierung und beschreibung von molekülen die ein gewünschtes verhalten aufweisen, inbesondere im pharmazeutischen sektor und derart hergestellte moleküle | |
EP2238553B1 (de) | System für die bereitstellung individueller oder gepoolter auch anonymisierter patientendaten auf grundlage von molekularen genom-, transkriptom-, proteom-, epigenom oder metabolomdaten | |
DE102020111584A1 (de) | Verfahren zum Gewinnen von Daten mithilfe von Operationsmikroskopiesystemen | |
DE102019134003A1 (de) | Verfahren und Vorrichtung zum Kultivieren biologischer Zellen | |
WO2001059609A1 (de) | Vorrichtung, speichermedium und verfahren zum ermitteln von objekten mit grossen ähnlichkeit zu einem vorgegebenen objekt | |
Weiner | Diversity and resource choice of flower-visiting insects in relation to pollen nutritional quality and land use | |
Dibba | Impact evaluation of improved rice varieties and farmer training on food security and technical efficiency in The Gambia | |
Barbera | High-Performance approaches for Phylogenetic Placement, and its application to species and diversity quantification | |
DE4306338C1 (de) | Verfahren zur Bestimmung der biologischen Funktion und/oder Charakterisierung von DNA und RNA Sequenzen von Organismen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8139 | Disposal/non-payment of the annual fee |